Beste allemaal,
Graag jullie visie op onderstaand. Volgens mij is mijn moederbord stuk. Maar geheugen gaat ook niet helemaal lekker. Wat denken jullie?
Ik draai een 3-node proxmox homelab met ceph. Eén node is al maanden onstabiel. Dan draait hij weer een tijdje goed en dan is er weer tijden gezeik. Onverwachte reboots, freezes, etc. Laatst weer een ceph-cluster ingesteld en dan geeft deze node veel gedoe. OSD's die om onverklaarbare redenen offline gaan, Ceph-monitor die crasht. Meestal draait hij maar een dag of 2 zonder gedoe, en daarna moet ik weer aan het werk.
Relevante software en hardware die ik gebruik
Wat ik al gevonden of geprobeerd heb
Afgelopen nacht maar eens een Memtest86 gedraaid. Wat blijkt: 2 errors bij test 9.
Test # Tests Passed Errors
Test 0 [Address test, walking ones, 1 CPU] 4/4 (100%) 0
Test 1 [Address test, own address, 1 CPU] 4/4 (100%) 0
Test 2 [Address test, own address] 4/4 (100%) 0
Test 3 [Moving inversions, ones & zeroes] 4/4 (100%) 0
Test 4 [Moving inversions, 8-bit pattern] 4/4 (100%) 0
Test 5 [Moving inversions, random pattern] 4/4 (100%) 0
Test 6 [Block move, 64-byte blocks] 4/4 (100%) 0
Test 7 [Moving inversions, 32-bit pattern] 4/4 (100%) 0
Test 8 [Random number sequence] 4/4 (100%) 0
Test 9 [Modulo 20, ones & zeros] 3/4 (75%) 2
Test 10 [Bit fade test, 2 patterns, 1 CPU] 4/4 (100%) 0
Test 13 [Hammer test] 4/4 (100%) 0
Ik heb er dus 4 stuks DDR van elke 16Gb in zitten. Vanochtend 2 stuks verwijderd zodat ik kon onderzoeken welk van de setjes problemen zou geven. Resultaat: geen. PC start niet meer op. Alle randapparatuur afgekoppeld. Moederbord verwijderd uit de kast en geprobeerd op te starten met enkel één geheugenbankje. PC doet niets meer. Gaat wel aan, maar geen beeld, geen bios. De LED-lampjes van de Post Status Checker geven aan dat er problemen met geheugen en/of cpu zijn.
Het lijkt mij sterk dat alle 4 geheugenbankjes stuk zijn. Dus dan denk ik: moederbord stuk. Wat denken jullie?
Graag jullie visie op onderstaand. Volgens mij is mijn moederbord stuk. Maar geheugen gaat ook niet helemaal lekker. Wat denken jullie?
Ik draai een 3-node proxmox homelab met ceph. Eén node is al maanden onstabiel. Dan draait hij weer een tijdje goed en dan is er weer tijden gezeik. Onverwachte reboots, freezes, etc. Laatst weer een ceph-cluster ingesteld en dan geeft deze node veel gedoe. OSD's die om onverklaarbare redenen offline gaan, Ceph-monitor die crasht. Meestal draait hij maar een dag of 2 zonder gedoe, en daarna moet ik weer aan het werk.
Relevante software en hardware die ik gebruik
# | Category | Product | Prijs | Subtotaal |
---|---|---|---|---|
1 | Processors | AMD Ryzen 5 7600X Boxed | € 219,95 | € 219,95 |
1 | Moederborden | ASRock B650 PG Lightning | € 164,90 | € 164,90 |
1 | Behuizingen | Inter-Tech 2U 2129-N | € 109,90 | € 109,90 |
1 | Netwerkadapters | Intel Ethernet Converged Network Adapter X540-T2 | € 155,- | € 155,- |
1 | Casemodding | Icy Dock MB994SP-4SB-1 | € 156,85 | € 156,85 |
1 | Processorkoeling | Noctua NH-L9a-AM4 | € 46,90 | € 46,90 |
1 | Ventilators | Noctua NF-A8 PWM Bruin, 80mm | € 16,34 | € 16,34 |
2 | Geheugen intern | Kingston Fury Beast KF560C36BBEK2-32 | € 120,90 | € 241,80 |
1 | Voedingen | Corsair RM550x (2018) (EU-model) Zwart | € 0,- | € 0,- |
2 | Solid state drives | Kingston DC600M 3.84TB | € 432,84 | € 432,84 |
1 | Solid state drives | Samsung 980 500GB | € 52,90 | € 52,90 |
1 | Solid state drives | WD Green SN350 240GB | € 34,27 | € 34,27 |
Totaal | € 1.631,65 |
Wat ik al gevonden of geprobeerd heb
Afgelopen nacht maar eens een Memtest86 gedraaid. Wat blijkt: 2 errors bij test 9.
Test # Tests Passed Errors
Test 0 [Address test, walking ones, 1 CPU] 4/4 (100%) 0
Test 1 [Address test, own address, 1 CPU] 4/4 (100%) 0
Test 2 [Address test, own address] 4/4 (100%) 0
Test 3 [Moving inversions, ones & zeroes] 4/4 (100%) 0
Test 4 [Moving inversions, 8-bit pattern] 4/4 (100%) 0
Test 5 [Moving inversions, random pattern] 4/4 (100%) 0
Test 6 [Block move, 64-byte blocks] 4/4 (100%) 0
Test 7 [Moving inversions, 32-bit pattern] 4/4 (100%) 0
Test 8 [Random number sequence] 4/4 (100%) 0
Test 9 [Modulo 20, ones & zeros] 3/4 (75%) 2
Test 10 [Bit fade test, 2 patterns, 1 CPU] 4/4 (100%) 0
Test 13 [Hammer test] 4/4 (100%) 0
Ik heb er dus 4 stuks DDR van elke 16Gb in zitten. Vanochtend 2 stuks verwijderd zodat ik kon onderzoeken welk van de setjes problemen zou geven. Resultaat: geen. PC start niet meer op. Alle randapparatuur afgekoppeld. Moederbord verwijderd uit de kast en geprobeerd op te starten met enkel één geheugenbankje. PC doet niets meer. Gaat wel aan, maar geen beeld, geen bios. De LED-lampjes van de Post Status Checker geven aan dat er problemen met geheugen en/of cpu zijn.
Het lijkt mij sterk dat alle 4 geheugenbankjes stuk zijn. Dus dan denk ik: moederbord stuk. Wat denken jullie?