Hier even verder om het topic daar niet te vervuilen.
Q schreef op donderdag 12 januari 2023 @ 20:12:
[...]
Voor veel van die andere oorzaken zoals Controllers, PSU, memory, daarom draai je als je werkelijk om dit soort onderwerpen geeft en werkelijk dit spelletje wilt spelen (data integriteit is super belangrijk) dan draai je met ECC. Controllers en PSUs, dat scenario zie ik niet realistisch gezien.
ECC dan sowieso, ik volg je wel.
Maar pas op, ik lees nu ondertussen ook al een paar jaar mee op Reddit en zie hier soms ook topics voorbij komen: als er iets misgaat op storage dan is het meestal de disk individueel waarbij SMART of andere dingen het kunnen melden OF de controller OF problemen met PSU.
Dat zie je dan door een "wide shot" aan CKSUM/READ/WRITE errors.
Zou gewone RAID dan ook niets zien dat er iets mis is? Goh, geen idee, dat laat ik in het midden, zal er maar weer net van af hangen.
Heb ik liever ZFS dan omdat ik dan geniet van die integriteit en garanties? Ja, voor mij wel.
Ik heb wel eens gezocht op succesverhalen van ZFS waarbij silent data corruptie werd vastgesteld. In al deze voorbeelden was er spraken van hobbyisten die liepen te knoeien / fouten aan het maken waren en het had niets te maken met ZFS.
Zelf heeft ZFS mij na tientallen scrubs over 10+ jaar en petabyte+ aan data transfers nog nooit gered, nog nooit iets gevonden.
Storage is extreem betrouwbaar, mad respect. Silent data corruptie blijft iets wat vooral een statistisch ding is waar je mee rekening wilt houden als je racks vol schijven hebt.
Daar moet ik je wel gelijk in geven, in al die jaren doe ik hier wekelijkse scrubs, dat is begonnen bij mijn HP N40L met 5 x 4TB 10 à 12 jaar geleden tot alle arrays daar tussen in tot de array van vandaag met 6 x 12TB.
Het is bewonderenswaardig hoe weinig disks zelf liggen te bokken of vuile data teruggeven. Moet je bedenken dat we vandaag met disks upwards of 18TB zitten

. Ja dat is echt chique want men daar van technologie neerzet.
Ik heb in al die tijd wel eens wat verdwaalde CKSUM errors of disks gehad die begonnen falen en ik durf toch te zeggen dat ik niet loop te knoeien en toen heb ik dit ergens meegemaakt:
HyperBart in "Het grote ZFS topic" .
Geen idee wat er toen mis ging, monitoring gaf wat berichtjes en ik heb het toch kunnen opvolgen en dat is wel een ease of mind die ik niet heb met klassieke mdraid of hardware RAID controllers.
Ik blijf bij mijn punt: consumenten hoeven zich niet druk te maken over silent data corruptie. De kans dat ze dit tegen komen is onwijs klein. Dus een Synology of QNAP is ook prima spul voor hen. Of iets zelfbouw met Unraid of vergelijkbare oplossingen.
Laat consumenten zich maar druk maken over backups en redundancy. Ik durf te wedden dat zoveel mensen een NAS draaien en dan de backups niet goed geregeld hebben, een 100x groter risico dan silent data corruptie.
Als iemand toch graag ZFS wil toepassen prima natuurlijk, moeten mensen zelf weten. Maar het moet allemaal een beetje in perspectief geplaatst worden.
Dat perspectief snap ik wel en daar volg ik je ook wel in, HDD's wil ik nog heel wat krediet geven qua betrouwbaarheid. Want anders dan had die
Pino die ooit voorspelde dat bij het volledig inlezen van een HDD je altijd een omgevallen bit ging hebben met die URE's nu veel meer outputs gekregen van zpool status'en waar 1 of meerdere read/write/cksums op terug kwamen.
Maar in zijn geheel vertrouw ik hardware niet genoeg om zonder ZFS te gaan. Wat ergens ook contradictorisch is want in mijn dagelijks werk gebruik je ook continu hardware en gaan daar ook bits en bytes door die je wel vertrouwt, de kansen zijn misschien dermate klein maar de moeite die ik moet doen om ZFS te draaien is dan ook weer even klein dat ik het echt geen probleem vind en ik het ook iedereen blijf aanraden als je wat zelfbouw NAS of goedkopere NAS wil doen.
Laat consumenten zich maar druk maken over backups en redundancy. Ik durf te wedden dat zoveel mensen een NAS draaien en dan de backups niet goed geregeld hebben, een 100x groter risico dan silent data corruptie.
Sinds een klein jaartje is dat hier ook wel OK

. Ik had wat oude backups koud liggen maar sinds kort draait er hier in een apart gebouw een dagelijkse syncoid op een hardenend Ubuntu 22.04 LTS die via snapshots alles binnen neemt van de NAS/hoofdserver en wordt de power de rest van de tijd mechanisch afgesloten van die backup server. Offline backups ftw
