Vraag


Acties:
  • 0 Henk 'm!

  • ZatarraNL
  • Registratie: Mei 2015
  • Laatst online: 19:04
Beste allemaal,

Graag jullie visie op onderstaand. Volgens mij is mijn moederbord stuk. Maar geheugen gaat ook niet helemaal lekker. Wat denken jullie?

Ik draai een 3-node proxmox homelab met ceph. Eén node is al maanden onstabiel. Dan draait hij weer een tijdje goed en dan is er weer tijden gezeik. Onverwachte reboots, freezes, etc. Laatst weer een ceph-cluster ingesteld en dan geeft deze node veel gedoe. OSD's die om onverklaarbare redenen offline gaan, Ceph-monitor die crasht. Meestal draait hij maar een dag of 2 zonder gedoe, en daarna moet ik weer aan het werk.

Relevante software en hardware die ik gebruik
#CategoryProductPrijsSubtotaal
1ProcessorsAMD Ryzen 5 7600X Boxed€ 219,95€ 219,95
1MoederbordenASRock B650 PG Lightning€ 164,90€ 164,90
1BehuizingenInter-Tech 2U 2129-N€ 109,90€ 109,90
1NetwerkadaptersIntel Ethernet Converged Network Adapter X540-T2€ 155,-€ 155,-
1CasemoddingIcy Dock MB994SP-4SB-1€ 156,85€ 156,85
1ProcessorkoelingNoctua NH-L9a-AM4€ 46,90€ 46,90
1VentilatorsNoctua NF-A8 PWM Bruin, 80mm€ 16,34€ 16,34
2Geheugen internKingston Fury Beast KF560C36BBEK2-32€ 120,90€ 241,80
1VoedingenCorsair RM550x (2018) (EU-model) Zwart€ 0,-€ 0,-
2Solid state drivesKingston DC600M 3.84TB€ 432,84€ 432,84
1Solid state drivesSamsung 980 500GB€ 52,90€ 52,90
1Solid state drivesWD Green SN350 240GB€ 34,27€ 34,27
Totaal€ 1.631,65


Wat ik al gevonden of geprobeerd heb
Afgelopen nacht maar eens een Memtest86 gedraaid. Wat blijkt: 2 errors bij test 9.
Test # Tests Passed Errors
Test 0 [Address test, walking ones, 1 CPU] 4/4 (100%) 0
Test 1 [Address test, own address, 1 CPU] 4/4 (100%) 0
Test 2 [Address test, own address] 4/4 (100%) 0
Test 3 [Moving inversions, ones & zeroes] 4/4 (100%) 0
Test 4 [Moving inversions, 8-bit pattern] 4/4 (100%) 0
Test 5 [Moving inversions, random pattern] 4/4 (100%) 0
Test 6 [Block move, 64-byte blocks] 4/4 (100%) 0
Test 7 [Moving inversions, 32-bit pattern] 4/4 (100%) 0
Test 8 [Random number sequence] 4/4 (100%) 0
Test 9 [Modulo 20, ones & zeros] 3/4 (75%) 2
Test 10 [Bit fade test, 2 patterns, 1 CPU] 4/4 (100%) 0
Test 13 [Hammer test] 4/4 (100%) 0

Ik heb er dus 4 stuks DDR van elke 16Gb in zitten. Vanochtend 2 stuks verwijderd zodat ik kon onderzoeken welk van de setjes problemen zou geven. Resultaat: geen. PC start niet meer op. Alle randapparatuur afgekoppeld. Moederbord verwijderd uit de kast en geprobeerd op te starten met enkel één geheugenbankje. PC doet niets meer. Gaat wel aan, maar geen beeld, geen bios. De LED-lampjes van de Post Status Checker geven aan dat er problemen met geheugen en/of cpu zijn.

Het lijkt mij sterk dat alle 4 geheugenbankjes stuk zijn. Dus dan denk ik: moederbord stuk. Wat denken jullie?

Beste antwoord (via ZatarraNL op 18-02-2024 20:08)


  • The_Doman
  • Registratie: Augustus 2005
  • Laatst online: 21:06
Volledige CMOS reset misschien ook eens proberen?
Dus stekker eruit, CMOS batterij eruit en dan ook Bios jumper reset doen.
Reddit r/ASRock: X670E Steel Legend - CPU LED Indicator
vincenzobags:
The one thing that I failed to do when resetting the bios, including removing the battery was physically unplugging the psu.

Most other boards I have used recently including an MSI x570, i didn't need to unplug the psu for the bios reset to work, but in a new rig and t his motherboard, I indeed do need to unplug before bios resetting procedure.

I hope that solves your issue.
OfficerAction:
Holy shit man. After I did a BIOS update on my x670E SL my pc wouldn't boot anymore no matter what with the CPU POST status LED glowing. 50 restarts, reverting to the old BIOS and even a CMOS reset with the jumper pins didn't do anything. I thought my CPU was a goner. But unplugging and removing the battery actually did the trick, thanks.

Alle reacties


Acties:
  • 0 Henk 'm!

  • Hackus
  • Registratie: December 2009
  • Niet online

Hackus

Lifting Rusty Iron !

bij twee verwijderen, moet je wel 2en4 laten zitten. (vanaf cpu bekeken) en dit niet doen op lopende PC, maar zonder stroom.

Kiest als MTB' er voor het mulle zand en drek, ipv het naastgelegen verharde pad.


Acties:
  • 0 Henk 'm!

  • ZatarraNL
  • Registratie: Mei 2015
  • Laatst online: 19:04
Hackus schreef op zaterdag 17 februari 2024 @ 15:55:
bij twee verwijderen, moet je wel 2en4 laten zitten. (vanaf cpu bekeken) en dit niet doen op lopende PC, maar zonder stroom.
Uiteraard. Bankjes gewisseld met stekker uit stopcontact en extra op de knop gedrukt om eventuele aanwezige spanning weg te laten vloeien.

En eerst nog even gecheckt bij de handleiding; 2 bankjes inderdaad 2 en 4. 1 bankje alleen 4. Daar is dus aan gedacht. :P

Acties:
  • Beste antwoord
  • 0 Henk 'm!

  • The_Doman
  • Registratie: Augustus 2005
  • Laatst online: 21:06
Volledige CMOS reset misschien ook eens proberen?
Dus stekker eruit, CMOS batterij eruit en dan ook Bios jumper reset doen.
Reddit r/ASRock: X670E Steel Legend - CPU LED Indicator
vincenzobags:
The one thing that I failed to do when resetting the bios, including removing the battery was physically unplugging the psu.

Most other boards I have used recently including an MSI x570, i didn't need to unplug the psu for the bios reset to work, but in a new rig and t his motherboard, I indeed do need to unplug before bios resetting procedure.

I hope that solves your issue.
OfficerAction:
Holy shit man. After I did a BIOS update on my x670E SL my pc wouldn't boot anymore no matter what with the CPU POST status LED glowing. 50 restarts, reverting to the old BIOS and even a CMOS reset with the jumper pins didn't do anything. I thought my CPU was a goner. But unplugging and removing the battery actually did the trick, thanks.

Acties:
  • 0 Henk 'm!

  • ZatarraNL
  • Registratie: Mei 2015
  • Laatst online: 19:04
The_Doman schreef op zaterdag 17 februari 2024 @ 21:53:
Volledige CMOS reset misschien ook eens proberen?
Dus stekker eruit, CMOS batterij eruit en dan ook Bios jumper reset doen.
Reddit r/ASRock: X670E Steel Legend - CPU LED Indicator

[...]
Dat ga ik nog even proberen.


[...]

Acties:
  • +1 Henk 'm!

  • ZatarraNL
  • Registratie: Mei 2015
  • Laatst online: 19:04
The_Doman schreef op zaterdag 17 februari 2024 @ 21:53:
Volledige CMOS reset misschien ook eens proberen?
Dus stekker eruit, CMOS batterij eruit en dan ook Bios jumper reset doen.
Reddit r/ASRock: X670E Steel Legend - CPU LED Indicator

[...]


[...]
Had ik niet verwacht, maar met stekker eruit, CMOS batterij eruit en met Bios jumper reset: Ik kan weer in de bios. Nu het geheugen maar even grondig testen.

Dank voor de tip!
Pagina: 1