Ik heb een Dell Optiplex T310 staan die CentOS 6.5 draait, het ding draait als secondary mailserver voor een bedrijf. Zeer onregelmatig, ongeveer eens in de twee week (nu ook weer eens), besluit het ding volledig vast te lopen.
Ik kan er echter niet achter komen waarom het ding vast loopt.
De kerneldump op het scherm is erg lang en zijn niet terug te scrollen na het moment van vastlopen. De logging meldt helemaal niets zinnigs; de laatste logging voor het vastlopen is vaak wisselend en niet consequent. Ik heb wel eens systemen gehad die nog iets van kernel dump info naar de syslog wisten te krijgen, deze stopt simpelweg. De kernel meldt bij het booten niets dat duid op problemen met het systeem.
Het systeem lijkt het meest vast te lopen tijdens een backup naar LTO. Ik heb daarom de SCSI kaart al eens verplaatst naar een ander slot en een andere SCSI kaart er in gezet, maar ook zonder veel succes. Hij geeft er de voorkeur aan om van vrijdag op zaterdag vast te lopen, maar dan weer niet op regelmatige momenten en soms vind hij ook geen bezwaar om door de week er eens mee op te houden.
Ik heb (gelukkig?) zeer weinig ervaring met het vaststellen van systeem crashes en ben dus op zoek naar wat suggesties, leesvoer, tips, whatever.
Ik kan er echter niet achter komen waarom het ding vast loopt.
De kerneldump op het scherm is erg lang en zijn niet terug te scrollen na het moment van vastlopen. De logging meldt helemaal niets zinnigs; de laatste logging voor het vastlopen is vaak wisselend en niet consequent. Ik heb wel eens systemen gehad die nog iets van kernel dump info naar de syslog wisten te krijgen, deze stopt simpelweg. De kernel meldt bij het booten niets dat duid op problemen met het systeem.
Het systeem lijkt het meest vast te lopen tijdens een backup naar LTO. Ik heb daarom de SCSI kaart al eens verplaatst naar een ander slot en een andere SCSI kaart er in gezet, maar ook zonder veel succes. Hij geeft er de voorkeur aan om van vrijdag op zaterdag vast te lopen, maar dan weer niet op regelmatige momenten en soms vind hij ook geen bezwaar om door de week er eens mee op te houden.
Ik heb (gelukkig?) zeer weinig ervaring met het vaststellen van systeem crashes en ben dus op zoek naar wat suggesties, leesvoer, tips, whatever.
[ Voor 3% gewijzigd door hommer op 12-04-2014 09:30 ]
t.k.a. sig space t.e.a.b.