• CAPSLOCK2000
  • Registratie: Februari 2003
  • Laatst online: 13:59

CAPSLOCK2000

zie teletekst pagina 888

Topicstarter
Ik overweeg de aanschaf van een nieuw systeem met DDR4 ECC-geheugen en ben op zoek naar cijfers om die aankoop te onderbouwen (of juist niet). Om de discussie niet te vertroebelen vermeld ik met opzet niet wat het doel van het systeem is.

Ik weet hoe ECC werkt en wanneer het nuttig is en dat het gevolgen heeft voor de rest van je hardware, dat is dus allemaal niet te vraag. Ik ben op zoek naar concrete gegevens die laten zien hoe groot of hoe klein het probleem is. Het maakt immers veel uit of je 1 fout per dag of 1 fout per jaar mag verwachten. Op grond van het serverpark alhier krijg ik de indruk dat geheugenfouten echt enorm zeldzaam zijn.

Ik kan wel vergelijkende onderzoeken vinden in relatieve percentages laten zien dat ECC de meeste fouten kan opvangen, maar die zeggen niks over hoe vaak per jaar je nu echt een fout kan verwachten op een bepaald balkje RAM.

Ook heb ik gelezen dat de eisen voor DDR4 geheugen veel strenger zijn dan die voor DDR3. Ik las zelfs dat de eisen voor gewoon DDR4 strenger zijn dan die voor DDR3 mét ECC. Ik heb alleen geen concrete bron kunnen vinden die beschrijft wat die eisen zijn, ik kan het dus niet zelf controleren.

De beste gegevens die ik heb komen uit http://www.cs.utoronto.ca/~bianca/papers/sigmetrics09.pdf maar dat gaat nog over DDR1 en DDR2. Op grond van mijn gevoel en dat artikel denk ik dat moderne systemen minder dan geheugenfout 1 fout per jaar kunnen verwachten.

Wie helpt me op weg?
Heeft er iemand last van een mening over dit onderwerp?
Heeft er iemand zelf een afweging gemaakt op grond van cijfers over het wel of niet kopen van ECC?

Ik heb de indruk dat nogal veel beheerders altijd ECC kopen omdat ze er niet over nadenken en de baas toch wel betaalt, maar misschien is dat geld beter aan andere zaken uit te geven. Kom aub dus niet met de reflex dat je sowieso altijd ECC moet kopen, daar gaat dit topic niet over.

This post is warranted for the full amount you paid me for it.


  • chaoscontrol
  • Registratie: Juli 2005
  • Laatst online: 15:46
ECC is een methode om data corruptie te voorkomen. Hoe vaak dat voor kan komen hangt af van de hoeveelheid ram en welke software je gebruikt (en hoe). De meerprijs is ook nihil maar de mogelijke risico's die je ermee af vangt kan alleen jij inschatten (vooral met zo'n vage OP :+). Ook hebben ECC modules over het algemeen een langere levensduur.

http://www.techspot.com/article/845-ddr3-ram-vs-ecc-memory/
Much of the ECC versus Non-ECC argument comes down to speed versus reliability. The reliability argument at least is easy to validate; over the last 12 months we've seen a tiny .09% failure rate with ECC memory compared to a .6% failure rate for standard memory.
Ik zie ECC een beetje (analogie) als raid1. Schijven gaan ook bijna niet stuk, maar wanneer ik geen risico wil lopen probeer je je hardware op orde te hebben, dat sluit toch weer eventuele problemen uit. Als de risico's niet opwegen tegen de meerprijs doe je het niet. Maar dat weet je allemaal al.

Er staat mij ook iets bij dat ECC zeker nog zijn meerwaarde heeft nu de ram modules zo groot zijn en alleen maar groter worden. Je moet er toch niet aan denken dat er ineens een 32GB ram module uit je vm cluster wegvalt, met alle problemen van dien. :P

https://www.pugetsystems....ntages-of-ECC-Memory-520/

Inventaris - Koop mijn meuk!


  • ChojinZ
  • Registratie: September 2001
  • Laatst online: 23-02 08:42
Je zou het niet verwachten, maar in de wiki worden wat vage cijfers genoemd:
Wikipedia: ECC memory

Kijk vooral even naar references 5,6 en 7.

Daarnaast, hangt het eea niet af van de locatie van de server/machine? Plekken waar veel electromagnetische straling is, zullen bitjes eerder omslaan. Een flinke solar flare wil ook nog weleens roet in het eten gooien. (van wat ik heb begrepen).

[ Voor 8% gewijzigd door ChojinZ op 16-08-2016 23:12 ]

Roland SP404 sampler te koop: https://gathering.tweakers.net/forum/list_messages/2089640


  • CAPSLOCK2000
  • Registratie: Februari 2003
  • Laatst online: 13:59

CAPSLOCK2000

zie teletekst pagina 888

Topicstarter
chaoscontrol schreef op dinsdag 16 augustus 2016 @ 17:56:
Ik zie ECC een beetje (analogie) als raid1. Schijven gaan ook bijna niet stuk, maar wanneer ik geen risico wil lopen probeer je je hardware op orde te hebben, dat sluit toch weer eventuele problemen uit. Als de risico's niet opwegen tegen de meerprijs doe je het niet. Maar dat weet je allemaal al.
Klopt, maar om dat risico te kunnen bepalen moet ik weten wat de kans is dat er een probleem optreedt. Cijfers daar over vinden is erg lastig.
Er staat mij ook iets bij dat ECC zeker nog zijn meerwaarde heeft nu de ram modules zo groot zijn en alleen maar groter worden. Je moet er toch niet aan denken dat er ineens een 32GB ram module uit je vm cluster wegvalt, met alle problemen van dien. :P

https://www.pugetsystems....ntages-of-ECC-Memory-520/
Mooie link! De lagere uitval van ECC is ook wel een aardig punt, dat verschil is groter dan ik dacht, al blijft de absolute kans vrij klein.
Interessant is dat de betrouwbaarheid van geheugen (zowel ECC als non-ECC) ieder jaar beter wordt. Als de trend uit die grafiek heeft doorgezet dan is non-ECC DDR3 geheugen nu net zo betrouwbaar als ECC geheugen in 2011 was.

Uit het Google-onderzoek heb ik geleerd dat DDR2 veel betrouwbaarder is dan DDR1 en zo te zien is DDR3 weer beter. Ik heb dus het vermoeden dat DDR4 nog beter is. Het zou me dus niet verbazen als een DD4 geheugen zonder ECC net zo betrouwbaar is als DD3 met ECC. Maar zonder cijfers over DDR4 blijft dat allemaal speculatie.
ChojinZ schreef op dinsdag 16 augustus 2016 @ 17:57:
Je zou het niet verwachten, maar in de wiki worden wat vage cijfers genoemd:
Wikipedia: ECC memory

Kijk vooral even naar references 5,6 en 7.
Bedankt, maar die links kende ik al, ze zijn helaas allemaal wat ouder en gaan over DDR3 of ouder en hebben het uitsluitend over ECC zonder ook naar geheugen zonder ECC te kijken.

Daarnaast, hangt het eea niet af van de locatie van de server/machine? Plekken waar veel electromagnetische straling is, zullen bitjes eerder omslaan. Een flinke solair flare wil ook nog weleens roet in het eten gooien. (van wat ik heb begrepen).
[/quote]

This post is warranted for the full amount you paid me for it.


  • White Feather
  • Registratie: Januari 2000
  • Laatst online: 15:50
Dat soort statistieken moet je altijd een beetje met een korreltje zout nemen. ECC-geheugen is over het algemeen degelijker dan normaal geheugen. Dat lijkt me logisch, omdat het specifiek voor servers is bedoeld en niet voor een habbekrats in de zeer concurrerende normale markt geplaatst is. Dat vertekent het beeld gewoon. Als je geheugen koopt van dezelfde prijs als het ecc-geheugen, dan zal het verschil al vele malen minder zijn.