Ik heb hier een virtualisatie servertje staan met 2x 250 Gb Samsung 840 in software RAID 1 op Debian.
Afgelopen Zondag is de server gestopt, deze stond volledig uitgeschakeld volgens IPMI.
Na het starten van de server via IPMI is de raid array gaan syncen. Het syncen is volledig afgerond en de server heeft goed gedraaid tot vanmorgen.
Vanmorgen stond de server weer uit, echter dit keer na het opstarten is hij niet gaan syncen.
De RAID array lijkt in orde te zijn:
In de logfiles is niks terug te vinden van het moment van crashen.
Ook niet van enkele minuten daarvoor. Ik vermoed dat hij helemaal niet meer naar de SSD's kan schrijven op dat moment.
Volgens mij is het bij Centos zo als een disk er mee stopt dat hij niet uitgaat maar je een I/O error krijgt op je scherm.
Met de Smart waardes lijkt mij ook niks mis mee.
Totaal zo'n 12 Tb naar de SSD's geschreven.
Logfile van crash afgelopen weekend: http://pastebin.com/ZtEXeyiR
Syncen afgelopen zondag: http://pastebin.com/FjDQp5wE
Smart waardes SSD-1: http://pastebin.com/dViUU3ai
Smart waardes SSD-2: http://pastebin.com/HySw7Eq8
Kan het zijn dat er iets mis is met SSD1 en dat er daarom geen logfiles meer geschreven zijn op het moment van de crash?
Afgelopen Zondag is de server gestopt, deze stond volledig uitgeschakeld volgens IPMI.
Na het starten van de server via IPMI is de raid array gaan syncen. Het syncen is volledig afgerond en de server heeft goed gedraaid tot vanmorgen.
Vanmorgen stond de server weer uit, echter dit keer na het opstarten is hij niet gaan syncen.
De RAID array lijkt in orde te zijn:
code:
1
2
3
4
5
6
| Personalities : [raid1]
md1 : active raid1 sda2[2] sdb2[1]
243672952 blocks super 1.2 [2/2] [UU]
md0 : active raid1 sda1[2] sdb1[1]
523252 blocks super 1.2 [2/2] [UU] |
In de logfiles is niks terug te vinden van het moment van crashen.
Ook niet van enkele minuten daarvoor. Ik vermoed dat hij helemaal niet meer naar de SSD's kan schrijven op dat moment.
Volgens mij is het bij Centos zo als een disk er mee stopt dat hij niet uitgaat maar je een I/O error krijgt op je scherm.
Met de Smart waardes lijkt mij ook niks mis mee.
Totaal zo'n 12 Tb naar de SSD's geschreven.
Logfile van crash afgelopen weekend: http://pastebin.com/ZtEXeyiR
Syncen afgelopen zondag: http://pastebin.com/FjDQp5wE
Smart waardes SSD-1: http://pastebin.com/dViUU3ai
Smart waardes SSD-2: http://pastebin.com/HySw7Eq8
Kan het zijn dat er iets mis is met SSD1 en dat er daarom geen logfiles meer geschreven zijn op het moment van de crash?