Dit is een probleem wat zich al een hele tijd voordoet. Het is een lange lijst pogingen en symptomen geworden, dus ik probeer ze een beetje overzichtelijk neer te zetten.
Specs:
Gigabyte GA-7A8DW
2x AMD Opteron 244
2x 512MB Kingston ECC/REG KVR400D8R3AK2/1G
Point of View TNT2 64MB
Compaq NC 6136 Gbit SX
Boot: Maxtor 6Y250P0 (PATA, 8MB, 7200rpm, 250GB)
Areca 1160 met 10 maxtor disks en 2 seagate disks
Tagan TurboJet TG900-U95 900W
Win2k3 Enterprise
Symptomen:
De server crasht veelvuldig. Soms als hij idle is, maar meestal tussen 3 en 4 's nachts, wanneer de automatische defragmentatie aan de slag is (Diskeeper 10). De errorcode is nagenoeg altijd 0x0000009c, ofwel MACHINE_CHECK_EXCEPTION. Soms gaat het een paar dagen goed, soms crasht ie 4x per dag, om de onregelmatigheid maar even aan te duiden. Het feit dat de server vaak 's nachts crasht lijkt mij het gevolg van een algemene grotere load op het systeem, niet op de schijven specifiek.
Meestal reboot de server nadat hij z'n memory dump heeft gemaakt, maar 2/10 keer blijft het systeem hangen. Als ik dan de server een hard reboot geef brandt het LEDje van de bootdisk nog van het schrijven van de dump, maar in werkelijkheid is het systeem allang bevroren.
Research:
MS Knowledgebase
GoT
Google
Wat heb ik geprobeerd om het probleem te verhelpen:
Conclusie:
Ik denk dat het moederbord naar de gort is. Als de server crasht, lijkt het een combinatie van factoren. CPU, geheugen en disk checks geven individueel geen problemen.
Vragen:
Zijn er andere tests die ik nog uit kan voeren? (en die zinnig zijn)
Waar zou het eventueel anders aan kunnen liggen?
Specs:
Gigabyte GA-7A8DW
2x AMD Opteron 244
2x 512MB Kingston ECC/REG KVR400D8R3AK2/1G
Point of View TNT2 64MB
Compaq NC 6136 Gbit SX
Boot: Maxtor 6Y250P0 (PATA, 8MB, 7200rpm, 250GB)
Areca 1160 met 10 maxtor disks en 2 seagate disks
Tagan TurboJet TG900-U95 900W
Win2k3 Enterprise
Symptomen:
De server crasht veelvuldig. Soms als hij idle is, maar meestal tussen 3 en 4 's nachts, wanneer de automatische defragmentatie aan de slag is (Diskeeper 10). De errorcode is nagenoeg altijd 0x0000009c, ofwel MACHINE_CHECK_EXCEPTION. Soms gaat het een paar dagen goed, soms crasht ie 4x per dag, om de onregelmatigheid maar even aan te duiden. Het feit dat de server vaak 's nachts crasht lijkt mij het gevolg van een algemene grotere load op het systeem, niet op de schijven specifiek.
Meestal reboot de server nadat hij z'n memory dump heeft gemaakt, maar 2/10 keer blijft het systeem hangen. Als ik dan de server een hard reboot geef brandt het LEDje van de bootdisk nog van het schrijven van de dump, maar in werkelijkheid is het systeem allang bevroren.
Research:
MS Knowledgebase
GoT
Wat heb ik geprobeerd om het probleem te verhelpen:
- Bios updaten (laatste bios was reeds geflashed)
- Snelheden proberen aan te passen (moederbord heeft hier geen functies voor, alleen de memory settings performance/normal)
- Bank- en node memory interleaves aan/uit gezet
- Bootdisk checken met Powermax
- Lowlevel format van de bootdisk, frisse Windows install
- Memtest een paar nachten laten draaien
- Prime95 laten draaien
- Hot CPU tester pro gebruikt om CPU en caches te testen
- Diskeeper en virusscanner niet geïnstalleerd
- CPU's individueel in het systeem testen (single CPU, beide getest)
- Geheugen in een andere volgorde in de banken zetten
- PCI devices uit het systeem laten, andere volgorde in de banken
Conclusie:
Ik denk dat het moederbord naar de gort is. Als de server crasht, lijkt het een combinatie van factoren. CPU, geheugen en disk checks geven individueel geen problemen.
Vragen:
Zijn er andere tests die ik nog uit kan voeren? (en die zinnig zijn)
Waar zou het eventueel anders aan kunnen liggen?
[ Voor 5% gewijzigd door Fauna op 29-04-2007 11:35 ]
