Toon posts:

Areca 1260 en verdwenen harddisk

Pagina: 1
Acties:

Verwijderd

Topicstarter
Gisteren begon uit het niks mijn areca 1260 te piepen, toen ik ging kijken wat er mis was bleek dat een van de drives gefaald was (drive 16 om precies te zijn).

Het leek mij raar aangezien mijn server de laatste 3 maand niet meer verplaats is geweest, en over het algemeen ook niet veel gebruikt word (enkele keren per maand geboot).

Dus ging ik even kijken naar de falende schijf, de connectors/kabels gecontroleerd, en alles bleek in orde te zijn. Echter, het probleem bleef bestaan.
Dan heb ik de betreffende schijf uit de server gehaald en aan mijn pc gehangen zodat ik er wat drive diagnostics op kon loslaten.
Zowel Samsung ES Tool als HDTune Pro vertellen mij dat de schijf perfect in orde is.

Volgende stap: sata- & stroomkabels vervangen, maar nog steeds hetzelfde probleem.

Is er iets dat ik mis, tests dat ik nog zou moeten doen, of is (wat ik op deze moment vrees) mijn areca kapot?

Background info:
Areca 1260 16 poorts controller met nieuwste firmware geïnstalleerd
falende array: 8 x Samsung HD203WI 2TB drives

Ik hoor wel van de falende drive korte geluidjes alsof hij iets naar de drive probeert te schrijven.

Verwijderd

Ik had hier een keer een Hitachischijf, die nadat hij aangesloten was, een zacht piepje maakte en dan zachtjes 2 tikken gaf, daarna even stil en weer een piepje gevolgd door 2 tikjes. Voordeel voor mij was, dat deze schijven net binnen waren en heb hem dus RMA gestuurt. Ik denk dat het bij jou net zoiets is en dat je de schijf RMA moet sturen, indien dit nog mogelijk is.

EDIT :
Lees net dat je de schijf getest hebt en er glansrijk doorheen komt. Wat gebeurt er als je de schijf op een andere poort zet? Houdt het probleem dan aan of is het opgelost? Want ik verdenk de schijf eerder dan je controller.

[ Voor 24% gewijzigd door Verwijderd op 30-08-2010 13:05 ]


  • Fauna
  • Registratie: December 2000
  • Laatst online: 19:37
Wat is de status nu dan als je de schijf aan je Areca hangt? Als dit 'Free' is, kun je dan een rebuild initialiseren door de schijf als hotspare aan te merken?

Verwijderd

Topicstarter
@KeDeShCh: ik wil liefst van de rest van de array afblijven en de controller zit helemaal vol
@Fauna: Ch16 staat als Failed

even erbij vermelden, is mss nuttig: wanneer ik opstart en aan "waiting for raidcontroller F/W to become ready..." scherm zit, duurt dit verbazend lang, 3 of zelfs 4 keer langer dan anders.

Verwijderd

Ok, dat kan ik begrijpen. Maar in je openingspost had je het over "slechts" 8 aangesloten harde schijven, daarom ging ik er vanuit dat de andere poorten nog vrij waren.

Verwijderd

Topicstarter
ja, mijn fout, was enkel over die array bezig, zit nog een 2de array op met 8 x samsung 1TB in raid5

Verwijderd

Ach foutjes maakt iedereen. Knappe raidsetjes btw! De schijf werkt standalone prima, maar ik vrees dat je er bijna niet onderuit gaat komen om een nieuwe harddisk aan te schaffen en dan te kijken wat er gebeurt. Mocht die dan zonder problemen op de controller werken, dan moet er toch iets fout zijn met deze schijf.

Verwijderd

Topicstarter
Thanks, misschien dat ik vandaag of morgen naar een kennis ga die ook een areca heeft en zien wat hij daar op geeft.

Verwijderd

Yep, zo kan je ook uittesten of het aan de disk ligt of niet. Als hij bij die kennis ook kuren heeft (wat ik eigenlijk ook wel vermoed), dan is het een duidelijke zaak.

Verwijderd

Topicstarter
Net terug van kennis, daar werd de schijf herkent zonder enige problemen.
Echter, the plot thickens....
Nu ik terug mijn server wou booten, kreeg ik een melding dat hij de firmware niet kon laden omdat er een timeout was (heb de exacte melding niet kunne lezen, hij resette zich)

Any idea's?

Verwijderd

Helaas kan ik je hier niet helpen, ik heb namelijk zelf geen Areca controllers. Maar misschien dat Fauna of iemand anders hier een antwoord op heeft?

  • dvl-2
  • Registratie: Mei 2005
  • Laatst online: 11-02 21:06
Hoi Kinezumi,

Toevallig ben ik laatst ook flink aan het stoeien geweest met mijn 1280 controller. Telkens was er wel iets waardoor het systeem wegviel.

1. Controller niet herkend: bleek defect pci-e slot te zijn op mobo.
2. power, controller bleek onvoldoende 3,3V te hebben waardoor hij crashte met load. 24pins voeding losgemaakt, stofvrij gemaakt opnieuw aangesloten en ook de extra 12V stekkers op het mobo aangesloten.
3. defecte poorten op controller - controller moet nog RMA hiervoor.

Mbt tot jouw probleem: hang de controller eens in een ander systeem (beste: neem jouw controller mee naar die vriend van je en wissel jouw en zijn controller eens om) en kijk eens wat er dan gebeurd.

  • aval0ne
  • Registratie: Maart 2004
  • Laatst online: 31-01 16:43
Uitgevallen schijven kan je laten rebuilden door de schijf aan te sluiten op je raid controller als je computer aanstaat. De areca controller zal de nieuwe schijf herkennen en automatisch rebuilden.

  • John2B
  • Registratie: Mei 2000
  • Laatst online: 05-02 21:39

John2B

I Love RAID5..!!

Verwijderd schreef op maandag 30 augustus 2010 @ 21:28:
Net terug van kennis, daar werd de schijf herkent zonder enige problemen.
Echter, the plot thickens....
Nu ik terug mijn server wou booten, kreeg ik een melding dat hij de firmware niet kon laden omdat er een timeout was (heb de exacte melding niet kunne lezen, hij resette zich)

Any idea's?
Indien er problemen zijn met uitvallende disken, en dat op een andersysteem niet het geval is....dan is het probleem in 9 van de 10 gevallen de voeding. Ik heb dat zelf ook meegemaakt. De voeding kan dan wel power genoeg hebben, maar kan ook brak zijn "geworden" door een kleine kortsluiting of door onweer een tik heeft gehad, of gewoon een oude voeding die z'n tijd heeft gehad.

Ook ik had al vanalles vervangen, weken mee bezig geweest. 8)7 ...als sluitstuk maar de voeding vervangen..probleem opgelost...Yessssssss !! ;)

[ Voor 8% gewijzigd door John2B op 01-09-2010 10:33 ]

A friendship founded on business is better than a business founded on friendship


  • Jiffy
  • Registratie: Februari 2002
  • Laatst online: 11-02 19:48

Jiffy

God, you're ugly!

aval0ne schreef op woensdag 01 september 2010 @ 10:15:
Uitgevallen schijven kan je laten rebuilden door de schijf aan te sluiten op je raid controller als je computer aanstaat. De areca controller zal de nieuwe schijf herkennen en automatisch rebuilden.
Ehmz... Topic niet gelezen? Het gaat helemaal niet om de vraag of en hoe een array zichzelf zal rebuilden bij het vervangen van een (al dan niet defecte) harde schijf. Ik neem aan dat TS dat, gezien het gebruik van zijn arrays, ook wel weet...

Life sucks. Then you die. Then they throw mud in your face. Then you get eaten by worms. Be happy it happens in that order...


  • aval0ne
  • Registratie: Maart 2004
  • Laatst online: 31-01 16:43
Jiffy schreef op woensdag 01 september 2010 @ 10:45:
[...]

Ehmz... Topic niet gelezen? Het gaat helemaal niet om de vraag of en hoe een array zichzelf zal rebuilden bij het vervangen van een (al dan niet defecte) harde schijf. Ik neem aan dat TS dat, gezien het gebruik van zijn arrays, ook wel weet...
Hoe weet je dat? Ben je helderziende? En zelfs al wist hij dat dan is mijn post nuttig voor mensen die het niet wisten (zoals ikzelf tot voor kort). Jouw reactie daarentegen voegt helemaal niets toe.

  • Jiffy
  • Registratie: Februari 2002
  • Laatst online: 11-02 19:48

Jiffy

God, you're ugly!

Rustig maar, hoor. Maar nee, ik ben niet helderziend. Veel beter nog: ik kan lezen. :)

TS heeft een Areca 1260 controller (16 poorts) met één array van 8x1 TB schijven en één array van 8x 2 TB schijven. Totaal dus 16 aangesloten harde schijven. TS geeft aan dat van de tweede array één van de harde schijven (om een nog niet bekende reden) tegenstribbelt en zoekt naar een oplossing, aangezien de betrokken schijf los en na testen normaal lijkt te functioneren.

Ik weet het, assumption is the mother of all fuck ups, maar ik denk dat ik er in dit geval toch wel vanuit mag gaan dat iemand met een dergelijke controller/harde schijf combi ook wel op de hoogte is van het feit dat een controller als de door hem gebruikte Areca 1260 met een downgraded array (automatisch) aan het rebuilden slaat zodra er een vervangende schijf in de array wordt gedropt.

Dat mijn berichtje het probleem van TS niet dichter bij een oplossing brengt, tja, daar was ik al van op de hoogte op het moment van posten. Ik had echter de indruk dat je zelf niet helemaal begreep waar het topic over ging. Mocht je dat verkeerd hebben opgevat: mijn excuses daarvoor. Mea culpa.

[ Voor 4% gewijzigd door Jiffy op 01-09-2010 13:31 ]

Life sucks. Then you die. Then they throw mud in your face. Then you get eaten by worms. Be happy it happens in that order...


  • Fauna
  • Registratie: December 2000
  • Laatst online: 19:37
Hm, kun je dan nu echt helemaal niets met de disk? Kijk eens op Ch16 wat de status is. Wellicht dat je daar iets wijzer van wordt. Want 'Failed' betekent in ieder geval dat de schijf wel gewoon online is, maar dat de controller de schijf niet meer zomaar in de array accepteert vanwege een fout. Bij 'Missing' zou ik aan een controllerdefect gaan denken.

Uit de array gevallen schijven heb ik meestal kunnen fixen met het opnieuw toevoegen van de schijf via 'Create hot spare'.

  • casparz
  • Registratie: November 2007
  • Laatst online: 11-02 20:14
Boot het hele zaakje nog wel, ik ben het spoor een beetje bijster nu ;)

Ik heb zelf ook een areca kaartje, en ik heb al 2 keer gehad dat een schijf op failed ging. Beide keren bleek er niets aan de hand. Ik had altijd een hot-spare draaien, en die nam dan ook netjes de gefaalde drive over, waarna ik de gefaalde drive weer als hot-spare aanwees. Schijven draaien nu, na 2 jaar, nog steeds fantastisch.

Kortom, hang hem er inderdaad eens als hot-spare aan. Als het goed is moet het hele zaakje weer gaan draaien.

  • jwpmzijl
  • Registratie: December 2002
  • Laatst online: 12-02 23:22
@kinezumi
Kun je even aangeven wat de status van jouw server op dit moment is. Boot hij nu wel met de Areca kaart of niet? Maakt nogal uit voor de adviezen die wij kunnnen geven:)

Maar buiten dat enkele opmerkingen op basis van mijn ervaringen:
  • Areca is nogal gevoelig voor kabellengte van de aansluiting tussen controller en harde schijven. Zeker als je verlengkabels of hot-swap behuizingen gebruikt dan kan het leiden in last zijn omdat een van de kabels niet voldoet aan de specificaties. Dit merk door time-out foutmeldingen in het logboek van de areca kaart.
  • Te weinig voltage op de V3.3 aansluiting vind Areca ook niet leuk. Ook dat geeft foutmeldingen in het logboek.
  • Een drive die op een Areca controller als failed is gemarkeerd zal door deze Areca controller niet meer geaccepteerd worden. De areca controller schrijft iets weg op de boot sector van de schijf zodat de Areca controller de volgende keer weet dat er een probleem met die schijf was. Als je zeker weet dat de schijf niet het probleem is dan moet je eerst de partitietabel van die schijf opnieuw initialiseren.
  • Zoals eerder opgemerkt zal de controller met een rebuild van de array beginnen zodra er een harde schijf aan de conttroller wordt gehangen die groot genoeg is en niet als failed of als onderdeel van een andere raidset gemarkeerd is
Hopelijk heb je er iets aan.

Hans van Zijl


  • wezzley
  • Registratie: Oktober 2000
  • Laatst online: 06-02 21:09
ik heb twee areca kaarten, een 1680 (zo'n 2 jaar oud) en een 1220 (kleine 4 jaar oud). op de 1220 heb ik 1x een 'failed' schijf gehad. ik kon hem niet meer aan de gang krijgen met de areca1220. die schijf kwam echter goed door verschillende tests heen op een normale mobo sata port. toch rma gedaan en de nieuwe schijf draait inmiddels alweer 2 jaar zonder problemen.

op mijn 1680 heb ik inmiddels 2 failed disks gehad. 1 echt fysiek kapot, spinde niet meer op. de andere schijf was hetzelfde verhaal als op mijn 1220: de areca kaart kon/wilde er niets meer mee doen, maar op een mobo sata port en externe usb behuizing werkte de schijf wel normaal. ook rma gedaan, en de vervangende schijf werkt alweer een jaar ok.

moraal van 't verhaal: ookal zeggen de tooltjes dat de disk OK is, vervanging heeft mijn probleem 2x opgelost.

overigens geen bit aan data verloren (alles in raid5).

[ Voor 3% gewijzigd door wezzley op 02-09-2010 21:49 ]


Verwijderd

Topicstarter
Mijn excuses dat ik wat stil geweest ben de laatste dagen.
Ik ben net begonnen op mijn eerste werk, en dat verloopt altijd wat chaotisch.

Om deze reden heb ik nog niet kunnen checken, maar dat ga ik vanavond of dit weekend zeker doen.

I'll keep you posted!

Verwijderd

Topicstarter
Vandaag eindelijk terug naar mijn raid kunnen kijken, maar het ziet er nog altijd niet positief uit.

Ik heb een nieuwe samsung 2TB gekocht en die aan channel 16 gehangen, hier staat nog altijd 'Failed' wanneer ik kijk bij View Drive Information kijk.

Ondertussen staan de 7 andere schijven uit mijn raidset van 2TB schijven als Free.

@Fauna: Wanneer ik een hot spare wil maken kan ik enkel kiezen uit channel 9 tem 15 (wss omdat die als "Free" staan)

  • jwpmzijl
  • Registratie: December 2002
  • Laatst online: 12-02 23:22
@Kinezumi
Een nieuwe niet geformateerde schijf die aan de Areca wordt gehangen wordt door Areca direct gebruikt om een degraded raidset te rebuilden. Tenzij de capaciteit van de drive te klein is. Zeker als de nieuwe drive van een ander merk/type is kan het zijn dat er net iets minder oppast dan de kleinste drive uit de huidige array. Ik heb in het verleden meegemaakt dat zelfs schijven van hetzelfde merk/type maar een andere revisie van elkaar afwijken. Als je nieuwe disk dus net iets kleiner is dan gaat het niet lukken.

Hans van Zijl


  • Fauna
  • Registratie: December 2000
  • Laatst online: 19:37
Ok, iets lijkt er behoorlijk f*cked up. Het doet me denken aan een probleem dat ik ook ooit heb gehad, ik weet alleen niet zeker of het hier ook van toepassing is. Zou je eens een screenshot kunnen posten van je webinterface (de RaidSet Hierarcy pagina)?

Een eventuele oplossing vind je hier: [Areca]Opgesplitste Raidarrays "lijmen"

Verwijderd

Topicstarter
Ik heb een email gestuurd naar Areca (wel via het webform, als iemand een direct emailadres moest hebben, mag dat altijd laten weten ^^), en ga wachten met mijn server terug aan te zetten tot ik daar antwoord van heb.

Ben enorm geschrokken, en gruwel een beetje dat mijn 14TB data weg zou kunnen zijn

Verwijderd

Tja, daarom wordt hier ook zo vaak gezegd, dat je een back-up moet hebben. Zeker in dit soort gevallen is het handig om dat te hebben. Maar nog niet getreurt, als het goed is, mag je een schijf missen en blijft je array toch doordraaien, zij het een stuk trager. Dit is niet om je af te katten, maar om je duidelijk te maken, dat ook raid GEEN back-up is. Nu ga ik het wel met je eens zijn, dat 14 TB niet makkelijk te back-uppen is, maar onmogelijk is het zeker niet. Ik kan je wel vertellen hoe ik het opgelost heb, de back-up dus, maar dat is wel een kwestie van flink investeren.

Verwijderd

Topicstarter
Ben mij daar zeer van bewust dat raid geen backup is.
Het is gwn even schrikken omdat mijn array plots verdwenen is. Maar voor zo goed ik Areca ken, moet er veel gebeuren vooraleer je je data echt echt kwijt bent.
Ik heb er nog wel een goed oog op (positief blijven helpt ook altijd imo ^^) maar het is altijd even schrikken als je die akelige pieptoon van je raidcontroller begin te hore (i know my heart stopped for a second)

Verwijderd

Schrikken is het zeker, het geluid is mij ook niet onbekend. Met Areca heb ik (nog) geen ervaring, heb er nog nooit tot nu toe mee gewerkt. Eerst inderdaad even afwachten wat Areca zelf te melden heeft voordat je de totale paniek toe laat slaan. Positief blijven denken helpt wel, al zijn er sommige situatie's waarin dat knap moeilijk wordt.

Verwijderd

Topicstarter
Ben voorlopig aan het emailen met Areca support, als er nieuws is, laat ik hier zowiso iets weten, misschien heeft iemand er in de toekomst nog iets aan.

  • Guru Evi
  • Registratie: Januari 2003
  • Laatst online: 23-12-2025
Ik heb een (dubbel) Areca 1680 met 48 x 2TB WD Green (Desktop) schijven eerder in Areca's RAID6, nu in ZFS en een (redundant) LSI met 32 x 2TB Seagate Constellation (SAS Server) schijven in ZFS.

De Areca controller heeft al 2 of 3 schijven opgehaald (in 6 maand) die 'slecht' waren waar op het eerste zicht niets mee mis was (de tooltjes gaven na enkele uren mooi 0 fouten aan). Dan eventjes de schijven in ZFS zitten rondzooien, blijken de schijven toch checksum errors te genereren.

Een waarschuwing is onder andere dat je array enorm lang duurt om op te starten of het systeem hangt op een bepaald moment met een van de schijven die enorm lage (10 of minder) IOPS heeft. Een desktop schijf probeert zo lang mogelijk zichzelf te 'herstellen' door de ECC te gebruiken om toch wat correcte data terug te geven. Een server schijf geeft veel eerder een fout aan zodat je die sneller kan herstellen en het array niet blijft hangen. Soms kan het zijn dat je desktop schijf te lang hangt met een interne fout (sommige schijven hangen meer dan 10s) en dan gaat je controller (die server schijven verwacht) die schijf eruit schoppen als zijnde 'niet aanwezig'.

Behalve als de Areca echt een dood kanaal heeft (kun je snel testen door een andere schijf erin te proppen) dan zou ik toch afgaan op wat Areca zegt. Met zo'n groot array heb je toch liever een hot spare en eventueel een cold spare voor snelle herstellingen. Als je echt denkt dat die 1 of 2TB iewat bruikbaar (moderne schijven geven aan welke sectoren dood zijn) is kun je die altijd in een desktop of een andere non-critical toepassing gebruiken.

[ Voor 14% gewijzigd door Guru Evi op 08-09-2010 04:35 ]

Pandora FMS - Open Source Monitoring - pandorafms.org


Verwijderd

Topicstarter
Een statusupdate zoals beloofd: mijn raidset is atm aan het rebuilden.

Oorzaak: een defecte schijf en een logische fout

Na emailen met Areca support, stelde men voor dat ik alle schijven uittrok en dan 1 voor 1 terug aankoppelde. Daar werd de fout duidelijk: channels 11&12, 13&14 en 15&16 waren omgewisseld (fysiek that is)
Hoewel alle kabels gelabeld waren met nummers, bleken de laatste 6 dus telkens omgewisseld te zijn.
Dus toen ik hierboven zei dat ik disk 16 vervangen had, had ik eigenlijk disk 15 vervangen.

Dus snel de echte 16de schijf vervangen, samen met de labels (en voor de zekerheid ook nog eens de disken genummerd) et voila, alle problemen van de baan (voorlopig toch).

Moraal van het verhaal: check u labels goed, en dubbelcheck?

Ik wil graag iedereen bedanken voor mee te brainstormen en me te helpen de oorzaak te vinden.

Een grote facepalm voor mezelf is hier wel op zen plaats denk ik (evenals eens goed lachen voor julie?)
Pagina: 1