Grote SATA HDs en failure rates

Pagina: 1
Acties:

  • Cyb
  • Registratie: Augustus 2002
  • Niet online
(Knip, link niet meer geldig)
(In het oranje zijn hd's met nog weinig reviews, en dus statisch minder betrouwbaar.)
(Als failure ben ik uitgegaan van 3 of minder eggs.)


Op NewEgg.com kunnen mensen hun ervaringen posten over harde schijven, en daarbij een score (egg) geven van 1 t/m 5 (hoger is beter). NewEgg laat een overzicht zien van de verdelingen van de scores per hd. Verder posten veel klanten hun ervaingen. Deze combinatie levert statisch gezien interessante data op, waarmee je conclusies kan trekken over de betrouwbaarheid van schijven.
Bijv. http://www.newegg.com/Pro...aspx?Item=N82E16822148337

Des te meer ervaringen per schijf, des te betrouwbaarder de statische getallen worden.
Een lastig punt is dat bezoekers met erg negatieve ervaringen eerder geneigd zijn hun mening te verkondigen dan mensen met een middelmatige ervaring. Het benaderen van de werkelijk uitvals percentages is lastig, en eigenlijk niet eens zo boeiend. Interessanter zijn de verhoudingen tussen de gerapporteerde uitval percentage van een hd ten opzichte van die van andere hd's. Dit geeft aan of een hd betrouwbaarder is dan een andere hd.

Eventueel kan je een correctie uivoeren op de gerapporteerde percentages door het percentage van de bezoekers dat bij die score ook zijn mening laat weten, mee te rekenen. Zo zou je bijv. als test even kunnen aannemen dat van de mensen die een HD maar 1 egg waard vinden, 25% dit ook daadwerkelijk laat weten op de site. Bij een egg met de waarde 2 zou je bijv. dan kunnen uit gaan van 20%. etc:
1egg, 25%
2eggs, 20%
3eggs, 17%
4eggs, 13%
5eggs, 10%
Deze parameters kan ik uiteraard makkelijk veranderen in Excel. Wat de werkelijke waardes precies zijn weet ik niet, dus dit is maar een erg ruwe schatting/gok. Maar voor de verhoudingen tussen schijven opzich, maakt dit niet eens zoveel uit.

Hier een ander voorbeeld waarbij data van NewEgg wordt gebruikt om de betrouwbaarheid van een HD te bepalen: http://www.tgdaily.com/content/view/41265/135/


Verder weet Western Digital de betrouwbaarste schijf te maken. Ik vraag me af of dit ook de reden is waarom zij al een lange tijd als enigste een 2TB schijf op de markt hebben. Dit is zelfs zodanig dat ze de prijs erg hoog hebben.

[ Voor 6% gewijzigd door Cyb op 05-02-2023 12:31 ]


  • TERW_DAN
  • Registratie: Juni 2001
  • Niet online

TERW_DAN

Met een hamer past alles.

Ik denk dat je een paar gevaarlijke conclusies trekt. Waarop baseer je dat slecht 10% van de mensen die hun schijf goed vinden dit laat weten en 25% die hun schijf niets vinden. Hoe kom je aan deze percentages?

Verder, hoe wil je op basis van deze gegevens uitvalspercentages berekenen. Als van merk A 20 schijven stuk gaan en van merk B 15, dan zegt dat niets over het uitvalspercentage. Als merk A er 1000 verkoopt heb je een uitval van 2%. Verkoopt merk B er 300, dan zit je hier op een uitvalspercentage van 5%. Ook al is het absolute aantal minder, het percentage ligt een heel eind over.
Daarbij neem je volgens mij in deze vergelijking niet op hoeveel disks het betreft, maar alleen het aantal beoordelingen.
Ik heb ook de t.net productreview ingevuld voor de 500GB Seagate 7200.11. Dat is 1 review. Maar het betrof in totaal 17 disks die ik in gebruik heb (gehad).

Tenzij ik je tabel verkeerd interpreteer wordt dat dus niet meegenomen en maak je een aantal gevaarlijke shortcuts.

Zou je overigens de tabel niet gewoon als tabel kunnen posten ipv een plaatje? Dat maakt het een stuk beter indexeerbaar.

  • Cyb
  • Registratie: Augustus 2002
  • Niet online
TERW_DAN schreef op vrijdag 08 mei 2009 @ 23:22:
Ik denk dat je een paar gevaarlijke conclusies trekt. Waarop baseer je dat slecht 10% van de mensen die hun schijf goed vinden dit laat weten en 25% die hun schijf niets vinden. Hoe kom je aan deze percentages?
Die percentages heb ik uit de lucht gegrepen, en kunnen inderdaad zeer sterk afwijken van de werkelijkheid. Maar ik kan zo andere waardes invullen als iemand betere getallen heeft over customer response. Maar eigenlijk gaat het daar niet eens om. (zie verder)
Verder, hoe wil je op basis van deze gegevens uitvalspercentages berekenen. Als van merk A 20 schijven stuk gaan en van merk B 15, dan zegt dat niets over het uitvalspercentage. Als merk A er 1000 verkoopt heb je een uitval van 2%. Verkoopt merk B er 300, dan zit je hier op een uitvalspercentage van 5%. Ook al is het absolute aantal minder, het percentage ligt een heel eind over.
Daarbij neem je volgens mij in deze vergelijking niet op hoeveel disks het betreft, maar alleen het aantal beoordelingen.
Ik kijk naar het aantal negatieve reviews van schijf x t.o.v. het totaal aan reviews van schijf x.

Bijv. deze: http://www.newegg.com/Pro...aspx?Item=N82E16822148337
-Review Summary: 1264 reviews
-Excellent (5 eggs): 624 reviews
-Good (4 eggs): 158 reviews
-Average (3 eggs): 77 reviews
-Poor (2 eggs): 74 reviews
-Very poor 1( eggs): 331 reviews

Onder een failure neem ik aan, 3 eggs of minder. (Kan ook 1 of 2 nemen.)
Aantal failures onder de reviews is dan dus: 331+74+77=482 failures.
Het totale aantal reviews is: 1264.
De failure ratio onder de reviews voor deze hd is dus 482/1264 = 0.381 = 38.1%

Deze 38.1% is hoger dan de daadwerkelijke waarde. Als ik zou zijn uitgegaan van 1 egg als failure, dan is de failure ratio nog steeds te hoog. Deze hoge ratio komt doordat de customer response ratio per score kan verschillen. Mensen die erg negatief zijn over een product zijn namelijk een stuk sneller geneigd hun mening te verkondigen dan middelmatig tevreden gebruikers. Om de exacte statistische waardes te vinden, zal er dus een correctie moeten worden uitgevoerd op de response ratio. Hoeveel deze correctie per egg is, weet ik niet. Maar de exacte waardes zijn eigenlijk niet eens zo interessant. Interessanter is om te weten hoeveel groter/kleiner de kans op uitval is tussen schijf x en y. Je moet dus niet kijken naar de absolute uitval waardes, maar naar de verhoudingen tussen de hd's onderling.

Daaruit is bijv. te zien dat een WD RE3 1TB met failure (7.5%) een 3.13 keer zo laag uitval percentage heeft dan een Samsung SP F1 HD103UU 1TB met failure (23.5%). Als je uit gaat van review ratio, dan kom je uit op 3.02 keer zo laag. De impact van de review ratio op de failure tussen schijven onderling, is dus te verwaarlozen. Ook als ik andere review ratio waardes kies, blijkt dit weinig invloed te hebben op de onderlinge verhoudingen.
Ik heb ook de t.net productreview ingevuld voor de 500GB Seagate 7200.11. Dat is 1 review. Maar het betrof in totaal 17 disks die ik in gebruik heb (gehad).
Dat zou idd invloed kunnen hebben, maar als je de schijven onderling in verhouding vergelijkt, zal het niet erg veel uitmaken.
Zou je overigens de tabel niet gewoon als tabel kunnen posten ipv een plaatje? Dat maakt het een stuk beter indexeerbaar.
De tabel werd wat breed toen ik dat probeerde.

Verwijderd

Is er ook rekening gehouden met de populariteit? Bij een populaire schijf zullen in verhouding meer fanboys een positief bericht achterlaten.

Dit soort statistieken zijn gecompliceerd.