Gisteravond was ik nog vrij laat door gegaan met aan mijn studie te werken. Dit hield in dat ik bezig was om virtuele netwerkjes te bouwen in VMWare met Windows 2008 Server R2 en W7. Vanochtend was ik dan bijna klaar met wat ik wou bereiken gisteren, dus ik zat vermoeid naar mijn schermpjes te loeren hopende zo klaar te zijn.
Gelokt door de veel betere transfers van RAID-0 had ik lang geleden besloten om van mijn 5 schijven er 2 in RAID-0 te zetten, om daar dan vervolgens weer 2 volumes van ieder ongeveer de helft te maken.
Het kan mijn perceptie zijn geweest, maar voor mijn gevoel graasden de harddisks stevig door, ideaal voor I/O intensief werk.
Helaas. Anything that can go wrong, will go wrong.
Rond 13 uur werd ik opgeschrikt door een van de 5 interne harddisks welke klaarblijkelijk te lijden had onder de disk-load die ik veroorzaakt had door een VM te klonen. Een kwartier later begonnen de eerste problemen.
Van de Intel Rapid Storage kreeg ik te lezen dat één 1,5TB schijf verminderd toerekeningsvatbaar was verklaard. Dat wil zeggen, ik zag ongeveer dit:
Dit was in den beginne nog niet zo'n hele ramp. Ten eerste moest ik natuurlijk direct stoppen met de bestandsbewerkingen die ik allemaal aan het uitvoeren was, want Windows wist ook eventjes niet wat hij met de melding aan moest. VMWare dreigde terplekke in te storten met rampzalige filelock-ellende tot gevolg was mijn vrees, dus PC zo snel mogelijk geforceerd maar wel netjes (buffer leegmaken) afgesloten. Computer helemaal uit.
Na een paar minuten besloot ik het er weer op te wagen. Ik moest tenslotte toch kijken of mijn gebouwde VLAN nog functioneren zou. De koude start verliep goed, tijdens de POST van de maarliefst 3 schijfcontrollers die mijn PC rijk is kwamen geen vreemde meldingen over dode disks o.i.d. dus ik dacht even dat ik geluk had.
Eenmaal onder Windows was dat wat minder van harte echter. Maar nadat ik in Rapid Storage had geklikt op: "Markeer als Normaal" - leek het even of de schijven het allemaal weer prima deden; en tot op heden is dit het optimistische beeld dat ik krijg ik Schijfbeheer:
Echter ondertussen heb ik natuurlijk al lang het garantiebewijsje van de 2 schijven opgescharreld en mijn dealer in harde waren gebeld, voor een inruil-afspraak. Ik was er wel content mee dat de schijf had besloten om moeilijk te gaan doen vlak vóór het verstrijken van de garantieperiode. Meestal is het net te laat, maar ik heb dus "geluk". Daarbij had ik nog maar vorige maand net al mijn belangrijke data op een fonkelnieuwe 3TB externe USB3-drive gezet en deze vervolgens ontkoppeld zodat hij ook niet door slijtage kon sneuvelen.
Maar ondertussen zat ik wel met bijna een heel etmaal aan noest ploeteren voor een leer/experimenteer omgeving in VMWare welke ik graag zou bewaren. Ik begon hier op GoT al het Data-rescue topic door te lezen om te kijken wat de best te volgen strategie zou zijn, en vooralsnog bleek dat:
.... wachten ... en wachten ... terwijl met een slakkegangetje er een magisch wonder plaats vind:
De data is nog te redden, en wel gewoon vanuit verkenner, al zij het bijzonder traag.
Wat mij nu dus erg puzzelt is wat er nu precies mis is, met welke schijf en in hoeverre dat gerelateerd was aan de tijdelijk intensieve I/O of dat het toch gewoon na 2 jaar de schijf zelf zou zijn. En wat nog vreemder is:
Dit is RAID-0 afaik:
Want probeer ik de gewraakte Raid_Array met logisch NTFS-volume daarop, te benaderen in CHKDSK, dan snapt de binnenkant van Windows er helemaal niets van en loopt hij te schelden over RAW-volumes, waar nergens anders in Windows over geklaagd wordt.
In de POST van mijn ICH10R controller zie ik inmiddels wel een rode mededeling welke overeenstemt met de eerste melding van Intel Rapid Storage, namelijk dat 1 schijf "FAILED" is. Gek genoeg zegt hij vervolgens dan over de 2 RAID-volumes die er op staan dat 1 er prima in orde is, en de andere moet er nog over nadenken (melding: Verifying...).
Dit is toch Raar!
Gezien hoe striping werkt met 2 schijven: Block(0)->Schijf(1) ; Block(1) -> Schijf(0) ; Block(2) -> Schijf(1) ; Block(3) -> Schijf(0) etc. en dan te bedenken dat of schijf 0 of schijf 1 volgens het systeem nu echt stuk is. Ik kan ook geen knopjes meer resetten om de schijfstatus weer op "Normaal" te zetten. Dus ik had eigenlijk verwacht dat alles weg zou zijn van beide Arrays, maar in tegendeel dus blijkbaar.
Kan iemand dit aan mij uitleggen? Hoe dat zo kan werken? Want dit heb ik nog niet eerder meegemaakt... Een RAID-0 array die crasht, maar vervolgens wel gelegenheid tot dataherstel biedt ... (zij het tergend langzaam)
En is de harddisk nog te revalideren eigenlijk, gewoon uit nieuwsgierigheid? Ik ruil hem wel om, maar toch, voor de volgende keer....
Wat ik las in het recovery topic ging over TestDisk van CGSecurity. En iemand had een vergelijkbaar incident met ICHxxR-controller gepost en een howto van hoe de partitietabellen te herstellen. Welnuja, voorlopig zijn de partitietabellen het enige dat nog wel werkt, dus ik wou ze toch maar niet gaan verwijderen om mijn arrays te kunnen resetten. Ik weet dat dit waarschijnlijk wel goed kan komen, maar voorlopig staat het beestje mijn werk van de schijf af te schrapen, daar wou ik hem verder niet teveel bij storen.
Gelokt door de veel betere transfers van RAID-0 had ik lang geleden besloten om van mijn 5 schijven er 2 in RAID-0 te zetten, om daar dan vervolgens weer 2 volumes van ieder ongeveer de helft te maken.
Het kan mijn perceptie zijn geweest, maar voor mijn gevoel graasden de harddisks stevig door, ideaal voor I/O intensief werk.
Helaas. Anything that can go wrong, will go wrong.
Rond 13 uur werd ik opgeschrikt door een van de 5 interne harddisks welke klaarblijkelijk te lijden had onder de disk-load die ik veroorzaakt had door een VM te klonen. Een kwartier later begonnen de eerste problemen.
Van de Intel Rapid Storage kreeg ik te lezen dat één 1,5TB schijf verminderd toerekeningsvatbaar was verklaard. Dat wil zeggen, ik zag ongeveer dit:
Dit was in den beginne nog niet zo'n hele ramp. Ten eerste moest ik natuurlijk direct stoppen met de bestandsbewerkingen die ik allemaal aan het uitvoeren was, want Windows wist ook eventjes niet wat hij met de melding aan moest. VMWare dreigde terplekke in te storten met rampzalige filelock-ellende tot gevolg was mijn vrees, dus PC zo snel mogelijk geforceerd maar wel netjes (buffer leegmaken) afgesloten. Computer helemaal uit.
Na een paar minuten besloot ik het er weer op te wagen. Ik moest tenslotte toch kijken of mijn gebouwde VLAN nog functioneren zou. De koude start verliep goed, tijdens de POST van de maarliefst 3 schijfcontrollers die mijn PC rijk is kwamen geen vreemde meldingen over dode disks o.i.d. dus ik dacht even dat ik geluk had.
Eenmaal onder Windows was dat wat minder van harte echter. Maar nadat ik in Rapid Storage had geklikt op: "Markeer als Normaal" - leek het even of de schijven het allemaal weer prima deden; en tot op heden is dit het optimistische beeld dat ik krijg ik Schijfbeheer:
Echter ondertussen heb ik natuurlijk al lang het garantiebewijsje van de 2 schijven opgescharreld en mijn dealer in harde waren gebeld, voor een inruil-afspraak. Ik was er wel content mee dat de schijf had besloten om moeilijk te gaan doen vlak vóór het verstrijken van de garantieperiode. Meestal is het net te laat, maar ik heb dus "geluk". Daarbij had ik nog maar vorige maand net al mijn belangrijke data op een fonkelnieuwe 3TB externe USB3-drive gezet en deze vervolgens ontkoppeld zodat hij ook niet door slijtage kon sneuvelen.
Maar ondertussen zat ik wel met bijna een heel etmaal aan noest ploeteren voor een leer/experimenteer omgeving in VMWare welke ik graag zou bewaren. Ik begon hier op GoT al het Data-rescue topic door te lezen om te kijken wat de best te volgen strategie zou zijn, en vooralsnog bleek dat:
.... wachten ... en wachten ... terwijl met een slakkegangetje er een magisch wonder plaats vind:
De data is nog te redden, en wel gewoon vanuit verkenner, al zij het bijzonder traag.
Wat mij nu dus erg puzzelt is wat er nu precies mis is, met welke schijf en in hoeverre dat gerelateerd was aan de tijdelijk intensieve I/O of dat het toch gewoon na 2 jaar de schijf zelf zou zijn. En wat nog vreemder is:
Dit is RAID-0 afaik:
Maar mijn schijf schijnt zich te bevinden in een soort vagevuur. En nog bijzonderder is, is het feit dat ik onder Verkenner met een simpele CTRL-C / CTRL-V, gewoon de data aan het kopiëren ben naar een nog levende schijf. Hoe kan dat?RAID 0 (block-level striping without parity or mirroring) has no (or zero) redundancy. It provides improved performance and additional storage but no fault tolerance. Hence simple stripe sets are normally referred to as RAID 0.
Want probeer ik de gewraakte Raid_Array met logisch NTFS-volume daarop, te benaderen in CHKDSK, dan snapt de binnenkant van Windows er helemaal niets van en loopt hij te schelden over RAW-volumes, waar nergens anders in Windows over geklaagd wordt.
In de POST van mijn ICH10R controller zie ik inmiddels wel een rode mededeling welke overeenstemt met de eerste melding van Intel Rapid Storage, namelijk dat 1 schijf "FAILED" is. Gek genoeg zegt hij vervolgens dan over de 2 RAID-volumes die er op staan dat 1 er prima in orde is, en de andere moet er nog over nadenken (melding: Verifying...).
Dit is toch Raar!
Gezien hoe striping werkt met 2 schijven: Block(0)->Schijf(1) ; Block(1) -> Schijf(0) ; Block(2) -> Schijf(1) ; Block(3) -> Schijf(0) etc. en dan te bedenken dat of schijf 0 of schijf 1 volgens het systeem nu echt stuk is. Ik kan ook geen knopjes meer resetten om de schijfstatus weer op "Normaal" te zetten. Dus ik had eigenlijk verwacht dat alles weg zou zijn van beide Arrays, maar in tegendeel dus blijkbaar.
Kan iemand dit aan mij uitleggen? Hoe dat zo kan werken? Want dit heb ik nog niet eerder meegemaakt... Een RAID-0 array die crasht, maar vervolgens wel gelegenheid tot dataherstel biedt ... (zij het tergend langzaam)
En is de harddisk nog te revalideren eigenlijk, gewoon uit nieuwsgierigheid? Ik ruil hem wel om, maar toch, voor de volgende keer....
Wat ik las in het recovery topic ging over TestDisk van CGSecurity. En iemand had een vergelijkbaar incident met ICHxxR-controller gepost en een howto van hoe de partitietabellen te herstellen. Welnuja, voorlopig zijn de partitietabellen het enige dat nog wel werkt, dus ik wou ze toch maar niet gaan verwijderen om mijn arrays te kunnen resetten. Ik weet dat dit waarschijnlijk wel goed kan komen, maar voorlopig staat het beestje mijn werk van de schijf af te schrapen, daar wou ik hem verder niet teveel bij storen.