Vraag


Acties:
  • 0 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
Sinds kort(week) herstart mijn PC uit zicht zelf. Heb totaal geen idee waar het aanligt. Ik heb er proxmox 6.1 op geïnstalleerd.
...

Heb gebruik gemaakt van volgende onderdelen:
  • AMD Ryzen 5 3600 processor
  • Cooler Master MWE Gold 650 Full Modular PSU / PC voeding
  • G.Skill DDR4 Ripjaws-V 2x8GB 3200Mhz - [F4-3200C16D-16GVKB] Geheugenmodule
  • G.Skill DDR4 Ripjaws-V 2x8GB 3200Mhz - [f4-3200c16d-16gvgb] Geheugenmodule
  • Noctua NH-L9x65 SE-AM4
  • Sharkoon Case SKILLER SGC1
  • MSI MSI B450M PRO-VDH MAX B450
  • Intel Consumer SSD 660p 512 GB PCI Express 3.0 M.2, SSDPEKNW512G8X1
  • Radeon HD5450 PCI-E R81KLC DDR3 512MB DVI Video Card AX5450 512MK3-SH.
...
Via stress app kan ik de volgende logging uit syslog halen:
Dec 17 10:05:02 bulldog kernel: [43898.424537] mce: [Hardware Error]: Machine check events logged
Dec 17 10:05:02 bulldog kernel: [43898.424544] [Hardware Error]: Corrected error, no action required.
Dec 17 10:05:02 bulldog kernel: [43898.424558] [Hardware Error]: CPU:10 (17:71:0) MC0_STATUS[Over|CE|MiscV|AddrV|-|-|SyndV|CECC|-|-|-]: 0xdc204000000c0135
Dec 17 10:05:02 bulldog kernel: [43898.424561] [Hardware Error]: Error Addr: 0x00000007e050f11c
Dec 17 10:05:02 bulldog kernel: [43898.424563] [Hardware Error]: IPID: 0x000000b000000000, Syndrome: 0x000000201a1b0402
Dec 17 10:05:02 bulldog kernel: [43898.424567] [Hardware Error]: Load Store Unit Ext. Error Code: 12, DC Data error type 1 and poison consumption.
Dec 17 10:05:02 bulldog kernel: [43898.424571] [Hardware Error]: cache level: L1, tx: DATA, mem-tx: DRD
Dec 17 10:05:02 bulldog rasdaemon[27352]: rasdaemon: register inserted at db
Dec 17 10:05:02 bulldog rasdaemon[27352]: <...>-31420 [010] 0.004390: mce_record: 2019-12-17 10:05:02 +0100 Load Store Unit (bank=0), status= dc204000000c0135, Corrected error, no action required., mci=Error_overflow CECC, mca= DC data error type 1 (poison consumption).
Dec 17 10:05:02 bulldog rasdaemon[27352]: Memory Error 'mem-tx: data read, tx: data, level: L1', cpu_type= AMD Family 17h Zen1, cpu= 10, socketid= 0, misc= d01a003900000000, addr= 7e050f11c, synd= 201a1b0402, ipid= b000000000, mcgstatus=0, mcgcap= 11c, apicid= b
...

Alle reacties


Acties:
  • +1 Henk 'm!

  • Room42
  • Registratie: September 2001
  • Niet online
Dec 17 10:05:02 bulldog rasdaemon[27352]: Memory Error 'mem-tx: data read, tx: data, level: L1', cpu_type= AMD Family 17h Zen1, cpu= 10, socketid= 0, misc= d01a003900000000, addr= 7e050f11c, synd= 201a1b0402, ipid= b000000000, mcgstatus=0, mcgcap= 11c, apicid= b
@phdelodder Begin eens met een memtest. ;)

"Technological advancements don't feel fun anymore because of the motivations behind so many of them." Bron


Acties:
  • 0 Henk 'm!

Verwijderd

Dat als eerste en je hebt twee verschillende geheugenkits geïnstalleerd.
Treedt de fout ook op als je met beide kits apart test?
Mogelijk zijn de ripjaws niet compatible met elkaar?

Acties:
  • +1 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
@Verwijderd @Room42 Ik heb een stress test gedaan met 'stress', om de 32 GB te testen. Deze avond zal ik beide kits apart testen. Ik hou jullie op de hoogte, alvast bedankt voor de ideeën!

Acties:
  • 0 Henk 'm!

  • Uszka
  • Registratie: Maart 2018
  • Laatst online: 15:15
Doe er eerst eens een videokaart in!

Acties:
  • +1 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
Uszka schreef op dinsdag 17 december 2019 @ 11:04:
Doe er eerst eens een videokaart in!
Er zit reeds een video kaart, een radeon 512 MB

Acties:
  • 0 Henk 'm!

  • Room42
  • Registratie: September 2001
  • Niet online
Uszka schreef op dinsdag 17 december 2019 @ 11:04:
Doe er eerst eens een videokaart in!
En wat is er mis met de on-board videokaart?

"Technological advancements don't feel fun anymore because of the motivations behind so many of them." Bron


Acties:
  • 0 Henk 'm!

  • lamaa1
  • Registratie: Mei 2016
  • Laatst online: 22-09 23:50
Room42 schreef op dinsdag 17 december 2019 @ 11:11:
[...]

En wat is er mis met de on-board videokaart?
Een R5 3600 heeft geen on-board videochip.

Acties:
  • 0 Henk 'm!

  • Room42
  • Registratie: September 2001
  • Niet online
lamaa1 schreef op dinsdag 17 december 2019 @ 11:59:
[...]

Een R5 3600 heeft geen on-board videochip.
Is dat nodig voor de HDMI-/VGA-aansluiting op het (betreffende) moederbord?

[ Voor 3% gewijzigd door Room42 op 17-12-2019 12:02 ]

"Technological advancements don't feel fun anymore because of the motivations behind so many of them." Bron


Acties:
  • 0 Henk 'm!

  • TommyboyNL
  • Registratie: Januari 2006
  • Niet online
Room42 schreef op dinsdag 17 december 2019 @ 12:01:
[...]

Is dat nodig voor de HDMI-/VGA-aansluiting op het (betreffende) moederbord?
Waar zou het beeld dan vandaan moeten komen?

Acties:
  • 0 Henk 'm!

  • Tazzios
  • Registratie: November 2001
  • Laatst online: 16:47

Tazzios

..

Room42 schreef op dinsdag 17 december 2019 @ 12:01:
[...]
Is dat nodig voor de HDMI-/VGA-aansluiting op het (betreffende) moederbord?
ja
phdelodder schreef op dinsdag 17 december 2019 @ 11:10:
[...]
Er zit reeds een video kaart, een radeon 512 MB
Kun je daar ook het merk en type bij opgeven? Het laatst dat 512MB Videokaarten gangbaar waren was iets van 10 jaar geleden.

Acties:
  • 0 Henk 'm!

  • Room42
  • Registratie: September 2001
  • Niet online
TommyboyNL schreef op dinsdag 17 december 2019 @ 12:17:
[...]

Waar zou het beeld dan vandaan moeten komen?
Nou, 'vroeger' zat er dan gewoon een videokaart on-board. ;)

"Technological advancements don't feel fun anymore because of the motivations behind so many of them." Bron


Acties:
  • +2 Henk 'm!

  • TommyboyNL
  • Registratie: Januari 2006
  • Niet online
Room42 schreef op dinsdag 17 december 2019 @ 12:40:
[...]

Nou, 'vroeger' zat er dan gewoon een videokaart on-board. ;)
De tijd dat eventuele on-board video verwerkt was in de north/southbridge hebben we al een jaar of 15 achter ons gelaten. Sommige server moederborden hebben wel een on-board videochip, hoewel die vaak weer verwerkt is in de IPMI/iLO/iDRAC chip.

Acties:
  • 0 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
De video kaart is een Radeon HD5450 PCI-E R81KLC DDR3 512MB DVI Video Card AX5450 512MK3-SH.

De enigste reden dat ik de video kaart gebruik is om voor het booten van de PC. Het is een proxmox server met een LXC container voor pihole, octoprint en zoneminder. Verder heb ik een ubuntu VM met Home assistant en een paar docker containers zoals esphome.

Als ik een stress test doe met stress --vm 32 --vm-bytes 1024M voor de 32GB die aanwezig zit krijg ik na een aantal minuten de foutmelding en na 10 minuten een herstart.

Mijn volgende stress is een stress --vm 16 --vm-bytes 1024M, dus met 1 soort geheugen.

Update Met 1 soort geheugen zelfde fout als met 32 alsook een herstart!

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353604] [Hardware Error]: Corrected error, no action required.

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353616] [Hardware Error]: CPU:4 (17:71:0) MC0_STATUS[Over|CE|MiscV|AddrV|-|-|SyndV|CECC|-|-|-]: 0xdc204000000d0175

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353620] [Hardware Error]: Error Addr: 0x0000000403db701c

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353621] [Hardware Error]: IPID: 0x000000b000000000, Syndrome: 0x000000201a1b0002

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353625] [Hardware Error]: Load Store Unit Ext. Error Code: 13, DC Data error type 2.

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353629] [Hardware Error]: cache level: L1, tx: DATA, mem-tx: EV

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353633] [Hardware Error]: Corrected error, no action required.

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353635] [Hardware Error]: CPU:10 (17:71:0) MC0_STATUS[Over|CE|MiscV|AddrV|-|-|SyndV|CECC|-|-|-]: 0xdc204000000c0135

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353637] [Hardware Error]: Error Addr: 0x000000014806c09c

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353640] [Hardware Error]: IPID: 0x000000b000000000, Syndrome: 0x000000201a1b0204

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353642] [Hardware Error]: Load Store Unit Ext. Error Code: 12, DC Data error type 1 and poison consumption.

Message from syslogd@bulldog at Dec 17 17:35:49 ...
kernel:[ 316.353644] [Hardware Error]: cache level: L1, tx: DATA, mem-tx: DRD

[ Voor 60% gewijzigd door phdelodder op 17-12-2019 17:40 ]


Acties:
  • 0 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
Op mijn moederbord is er EZ DEBUG leds aanwezig, ik heb nu een aantal stress testen gedaan en iedere keer licht het CPU led op bij een herstart. Want bij iedere stress test op RAM met beide types(samen en apart) krijg ik hetzelfde probleem.

Iemand nog een idee?

Acties:
  • 0 Henk 'm!

Verwijderd

Kun je zoals eerder geschreven even een memtest uitvoeren?
Je stresst nu binnen een geïnstalleerd os, mogelijk word je wijzer als je dat even negeert.

Acties:
  • 0 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
Verwijderd schreef op dinsdag 17 december 2019 @ 19:27:
Kun je zoals eerder geschreven even een memtest uitvoeren?
Je stresst nu binnen een geïnstalleerd os, mogelijk wordt je wijzer als je dat even negeert.
Memtest is bezig, heb geboot via een USB.

Acties:
  • 0 Henk 'm!

  • Uszka
  • Registratie: Maart 2018
  • Laatst online: 15:15
Op welke snelheid is het geheugen ingesteld in het bios? 3200 MT/s zal het niet zijn met 4 modules denk ik.

Acties:
  • 0 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
@Uszka ik heb xmp aanstaan met 3200 MHz

Acties:
  • 0 Henk 'm!

  • Uszka
  • Registratie: Maart 2018
  • Laatst online: 15:15
Op B450 verwacht ik niet dat 3200 stabiel loopt. Zet dat eens op 2933.

Acties:
  • 0 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
Uszka schreef op dinsdag 17 december 2019 @ 21:29:
Op B450 verwacht ik niet dat 3200 stabiel loopt. Zet dat eens op 2933.
Volgens de spec (https://download.msi.com/archive/mnu_exe/mb/M7A38v8.0.pdf):

4x DDR4 memory slots, support up to 64GB*ƒSupports 1866/ 2133/ 2400/ 2667Mhz (by JEDEC)ƒSupports 2667/ 2800/ 2933/ 3000/ 3066/ 3200/ 3466 MHz (by A-XMP OC MODE

Moet het kunnen werken.

Heb onder tussen 1 pass gedaan van de memtest, nog 3 te gaan en geen error's.

Acties:
  • +2 Henk 'm!

  • Uszka
  • Registratie: Maart 2018
  • Laatst online: 15:15
Er staat nergens dat je met 4 dimms die snelheden gaat halen. Onderstaande is van Asrock maar geeft een prima beeld van wat er met Ryzen 3xxx op B450 mogelijk is.
Afbeeldingslocatie: https://www.asrock.com/mb/Memory/4xMatisse-3200-2667.png

Acties:
  • 0 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
@Uszka de default is blijkbaar 'auto' in de BIOS waarbij dus 3200 mhz word genomen. Wanneer ik het aanpas naar 2933 komt het systeem in een boot loop terecht, ik zie BIOS->GRUB->reboot.

Heb ook een nog een wattage meter er eens tussen geplaast en bij idle is de stroomverbruik 52 - 55 watt, bij stress testen gaat het naar 118 watt.

De memtest is nu compleet:

Summary
Report Date 2019-12-18 04:02:59
Generated by MemTest86 V8.3 Free (64-bit)
Result PASS
System Information
EFI Specifications 2.70
System
Manufacturer Micro-Star International Co., Ltd.
Product Name MS-7A38
Version 8.0
Serial Number To be filled by O.E.M.
BIOS
Vendor American Megatrends Inc.
Version B.40
Release Date 11/07/2019
Baseboard
Manufacturer Micro-Star International Co., Ltd.
Product Name B450M PRO-VDH MAX (MS-7A38)
Version 8.0
Serial Number J916095055
CPU Type AMD Ryzen 5 3600 6-Core
CPU Clock 3600 MHz [Turbo: 4175.5 MHz]
# Logical Processors 12
L1 Cache 12 x 64K (234509 MB/s)
L2 Cache 12 x 512K (95842 MB/s)
L3 Cache 1 x 32768K (27571 MB/s)
Memory 32731M (18661 MB/s)
DIMM Slot #0 8GB DDR4 XMP PC4-25600
G Skill Intl / F4-3200C16-8GVKB
16-18-18-38 / 3200 MHz / 1.350V
DIMM Slot #1 8GB DDR4 XMP PC4-25600
G Skill Intl / F4-3200C16-8GVKB
16-18-18-38 / 3200 MHz / 1.350V
DIMM Slot #2 8GB DDR4 XMP PC4-25600
G Skill Intl / F4-3200C16-8GVGB
16-18-18-38 / 3200 MHz / 1.350V
DIMM Slot #3 8GB DDR4 XMP PC4-25600
G Skill Intl / F4-3200C16-8GVGB
16-18-18-38 / 3200 MHz / 1.350V
Result summary
Test Start Time 2019-12-17 18:50:24
Elapsed Time 6:42:20
Memory Range Tested 0x0 - 81F380000 (33267MB)
CPU Selection Mode Parallel (All CPUs)
ECC Polling Enabled
# Tests Passed 48/48 (100%)
Test # Tests Passed Errors
Test 0 [Address test, walking ones, 1 CPU] 4/4 (100%) 0
Test 1 [Address test, own address, 1 CPU] 4/4 (100%) 0
Test 2 [Address test, own address] 4/4 (100%) 0
Test 3 [Moving inversions, ones & zeroes] 4/4 (100%) 0
Test 4 [Moving inversions, 8-bit pattern] 4/4 (100%) 0
Test 5 [Moving inversions, random pattern] 4/4 (100%) 0
Test 6 [Block move, 64-byte blocks] 4/4 (100%) 0
Test 7 [Moving inversions, 32-bit pattern] 4/4 (100%) 0
Test 8 [Random number sequence] 4/4 (100%) 0
Test 9 [Modulo 20, ones & zeros] 4/4 (100%) 0
Test 10 [Bit fade test, 2 patterns, 1 CPU] 4/4 (100%) 0
Test 13 [Hammer test] 4/4 (100%) 0

[ Voor 3% gewijzigd door phdelodder op 18-12-2019 05:22 ]


Acties:
  • 0 Henk 'm!

Verwijderd

Ik vermoed dat het probleem ergens bij Proxmox ligt.
Heb je hier al eens gekeken?
Hen je het bios een update gegeven naar de meest recente versie?

[ Voor 19% gewijzigd door Verwijderd op 18-12-2019 08:01 ]


Acties:
  • 0 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
Verwijderd schreef op woensdag 18 december 2019 @ 07:59:
Ik vermoed dat het probleem ergens bij Proxmox ligt.
Heb je hier al eens gekeken?
Hen je het bios een update gegeven naar de meest recente versie?
BIOS is reeds laatste versie.

Via je link heb ik een topic gevonden die "rcu_nocbs=0-11 processor.max_cstate=1" parameters toevoegt aan grub config. Reeds doorgevoerd: heb nu deze parameters: quiet rcu_nocbs=0-11 processor.max_cstate=1 iommu=pt amd_iommu=on video=efifb:off

Update:

Na het toevoegen van de grub parameters.

De hardware error's verschijnen iedere 5min en 11 seconden, exact hetzelfde. Iedere keer ....

Update 2: random reboots zijn nodig steeds aanwezig.

[ Voor 31% gewijzigd door phdelodder op 18-12-2019 11:57 ]


  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
Helaas is het nu zo dat als ik via proxmox start, het systeem iedere 5 minuten herstart. Via een debian usb krijg ik de zelfde foutmeldingen maar blijft het systeem werken zonder herstarts. Als ik ubuntu usb gebruik dan herstart het systeem zich wanneer er een sleep heeft voorgedaan. Beide hebben enkel 1 malige de hardware fouten afgeprint. Geen herhaling zoals met proxmox.

Via AMD support alsook megekko geraak ik geen meter verder, zeer trage communicatie. Hebben jullie nog andere ideeën? Kan ik eventueel deze processor verkopen en een nieuwe kopen?

Verwijderd

phdelodder schreef op donderdag 19 december 2019 @ 10:37:
Helaas is het nu zo dat als ik via proxmox start, het systeem iedere 5 minuten herstart. Via een debian usb krijg ik de zelfde foutmeldingen maar blijft het systeem werken zonder herstarts. Als ik ubuntu usb gebruik dan herstart het systeem zich wanneer er een sleep heeft voorgedaan. Beide hebben enkel 1 malige de hardware fouten afgeprint. Geen herhaling zoals met proxmox.

Via AMD support alsook megekko geraak ik geen meter verder, zeer trage communicatie. Hebben jullie nog andere ideeën? Kan ik eventueel deze processor verkopen en een nieuwe kopen?
Het vervelende van de hele zaak is eigenlijk dat AMD-V en AMD processoren uitgezonderd Epyc vaker kuren vertonen bij virtualisatie.
Nu weet ik niet of dit met Zen 2 al beter is maar ik lees her en der nog regelmatig problemen.
Een mogelijke oplossing is terugschakelen naar Intel.
Je zou ook kunnen kijken of een andere Hypervisor uitkomst biedt.

[ Voor 3% gewijzigd door Verwijderd op 19-12-2019 10:49 ]


  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
Verwijderd schreef op donderdag 19 december 2019 @ 10:47:
[...]

Het vervelende van de hele zaak is eigenlijk dat AMD-V en AMD processoren uitgezonderd Epyc vaker kuren vertonen bij virtualisatie.
Nu weet ik niet of dit met Zen 2 al beter is maar ik lees her en der nog regelmatig problemen.
Een mogelijke oplossing is terugschakelen naar Intel.
Je zou ook kunnen kijken of een andere Hypervisor uitkomst biedt.
Ik heb ook al virtualisatie uitgeschakeld, zelfde probleem blijft zich voor doen. Zoals ik al zeg als ik een ubuntu usb gebruik heb ik hetzelfde probleem wanneer er een sleep voor doet. Ik denk dat de processor stuk is.

Verwijderd

Heb je ubuntu / proxmox al eens geïnstalleerd en meteen een update gegeven vanaf de command line?
- sudo apt-get update
- sudo apt-get upgrade

Acties:
  • +1 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
Verwijderd schreef op donderdag 19 december 2019 @ 11:16:
Heb je ubuntu / proxmox al eens geïnstalleerd en meteen een update gegeven vanaf de command line?
- sudo apt-get update
- sudo apt-get upgrade
Heb ik reeds gedaan, het verschil is dat ubuntu enkel herstart wanneer het in sleep gaat en terug wakker wordt. Proxmox zeer vaak 4 keer per uur.

Beide distro's heb ik reeds de laatste updates geïnstalleerd. Helaas is het niet mogelijk om de updates evt van vandaag te installeren op proxmox.

Volgens een mail net ontvangen van megekko gaat over een defect in de instructie set en cache geheugen. Dus dit topic mag voor mij worden afgesloten.

Verwijderd

phdelodder schreef op donderdag 19 december 2019 @ 11:22:
[...]


Heb ik reeds gedaan, het verschil is dat ubuntu enkel herstart wanneer het in sleep gaat en terug wakker wordt. Proxmox zeer vaak 4 keer per uur.

Beide distro's heb ik reeds de laatste updates geïnstalleerd. Helaas is het niet mogelijk om de updates evt van vandaag te installeren op proxmox.

Volgens een mail net ontvangen van megekko gaat over een defect in de instructie set en cache geheugen. Dus dit topic mag voor mij worden afgesloten.
Kun jij nog even laten weten of alles wel naar behoren werkt met een nieuwe Ryzen?
Ik ben wel benieuwd, mede vanwege eigen plannen in die richting.

Acties:
  • +1 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
Morgen gaat de processor op de post als er een update is zie je het op deze topic!

Acties:
  • 0 Henk 'm!

  • Intergalactic
  • Registratie: September 2017
  • Laatst online: 09:02

Intergalactic

Testlab Coördinator & Moderator Harde Waren

𝙸𝚗𝚟𝚊𝚍𝚎𝚛𝚜 𝙼𝚞𝚜𝚝 𝙳𝚒𝚎

schopje naar PMG->WSS

𝙸𝚗 𝚜𝚙𝚊𝚌𝚎 𝚗𝚘 𝚘𝚗𝚎 𝚌𝚊𝚗 𝚑𝚎𝚊𝚛 𝚢𝚘𝚞 𝚜𝚌𝚛𝚎𝚊𝚖 | Tweakers Discord | Stats.fm | Discogs


Acties:
  • 0 Henk 'm!

  • phdelodder
  • Registratie: Februari 2018
  • Laatst online: 22-05-2023
Nieuwe CPU, reeds een uptime van > 1Dag
Pagina: 1