Sindskort heb ik een HP P420 controller in mijn server zitten, als vervanging voor mijn stokoude HP P400, die onlangs problemen gaf en een array spontaan liet falen (vermoed ik althans).
De controller heb ik toen vervangen (zie vorig topic: HP P400 RAID5 array stuk, maar disks zijn OK, wat nu?) en sindsdien ben ik eigenlijk constant in de weer geweest met mijn server, omdat ik de array's / disks gewoon nog niet lekker aan de praat krijg in mijn setup:
De betreffende array, van 4x 2TB disks in RAID5 bleef namelijk falen en uiteindelijk besloot ik om de controller te vervangen; die was oud en misschien daarom niet goed meer. Dit heef tot nu toe nog 0 resultaat. Ook heb ik afgelopen week de 4x 2TB disks vervangen wat WD Greens waren (ook nog wel mee getest, dankzij een tip van Wim-Bart om WDIDLE3 te draaien. Uiteindelijk heb ik een Linux alternatief daarvoor gedaan en is deze idle-timer dus uit.
Omdat de fouten bleven, deze WD Greens aangeschaft zijn in 2010 en steeds dezelfde twee disks faalden, nadat ik de array meermaals opnieuw heb aangemaakt, ben ik ervan uitgegaan dat de disks ook gewoon op zijn. Afgelopen week heb ik daarom 4 nieuwe disks besteld en aangezien ik nu een P420 heb, kan ik ook grotere disks aansluiten aan de controller (officieel gaat die tot 4TB). Ik heb daarom 4x 4TB aangeschaft, maar helaas heb ik die nooit goed kunnen testen, omdat 1 disk daarvan DOA is.
De machine draait ESXi en op zowel de 4x 2TB als de 4x 4TB wil ik een RAID5 array aanmaken. Ik wil dus kijken hoe de 4x 2TB het nu doen. Deze combinatie heeft echter eenmalig geboot op mijn machine, daarna nooit meer; frapante daarbij is dat de disk in bay 3 nooit herkend wordt. Met de disks in de IcyDock als buiten deze IcyDock word de disk in bay 3 nooit herkend. De 7 overgebleven disks worden bovendien perfect herkend door mijn desktop, ik weet dus dat deze 7 overgebleven disks prima zijn.
Sluit ik de 4x 2TB array aan op SAS-poort 1 (de linker vanaf de achterkant gezien) dan doet de controller er heel langer over en uiteindelijk (denk ik) een soort time-out geeft en dan maar doorgaat, zonder disks herkend te hebben. Echter blijft het laden van ESXi dan hangen bij het laden van de nhpsa driver. Dit is de driver voor HP controllers.
Ik heb daarom het volgende geprobeerd om mijn 4x 2TB disks (waar reeds een RADI5 array op zit vanuit de HP P400) aan de praat te krijgen op mijn P420:
De HP SmartArray P420 is voorzien van versie 8 van de firmware, zover ik begrepen heb is dit de nieuwste. Ook zit er een 2GB FWBC module op met capacitor.
Als het even kan, gooi ik liever niet de array weg van de disks. Het is niet dat er superbelangrijke data op staat, maar zou het jammer vinden als ik alles wat er op staat, opnieuw moet zien te krijgen, daar gaat dan wel de nodige tijd eroverheen om die data terug te krijgen.
Mochten er geen andere opties zijn, kan ik dit immers altijd nog doen, maar het lijkt mij stug dat dan een disk opeens wel herkend kan/zou worden.
De versie van ESXi die ik gebruik is 6.5.0, ik heb de custom HP installatie, momenteel draait de versie van mei 2017, maar met de versie van juli 2017 (die onlangs released is) heb ik dezelfde problemen.
Toen ik met mijn server begon, intussen de nodige jaren geleden, heb ik destijds een HP P400 controller gekocht. Om compatibiliteit te houden met de array's en data loss te voorkomen (wat een overstap naar ZFS bijvoorbeeld momenteel zou kosten), heb ik ervoor gekozen om een nieuwe Smart Array te kopen.
Niet dat het voor het issue belangrijk is, maar dan is tenminste wat duidelijker waarom ik voor deze array koos.
Uiteindelijk wil ik wel van hardware RAID af, maar heb daarvoor momenteel de financiën niet (zou dan een extra machine willen / moeten draaien, plus ESXi heeft geen support voor ZFS, zover ik weet), plus deze hardware is voor het moment méér dan afdoende voor mijn server. 
Ik zit dus ook niet te wachten op reacties om over te stappen naar bijvoorbeeld ZFS. Ik weet dat dat een beter systeem is dan de hardware RAID die ik nu heb, maar ik heb momenteel de middelen noch de financiën niet om daar naartoe over te stappen op een nette manier, zonder data loss.
De controller heb ik toen vervangen (zie vorig topic: HP P400 RAID5 array stuk, maar disks zijn OK, wat nu?) en sindsdien ben ik eigenlijk constant in de weer geweest met mijn server, omdat ik de array's / disks gewoon nog niet lekker aan de praat krijg in mijn setup:
De betreffende array, van 4x 2TB disks in RAID5 bleef namelijk falen en uiteindelijk besloot ik om de controller te vervangen; die was oud en misschien daarom niet goed meer. Dit heef tot nu toe nog 0 resultaat. Ook heb ik afgelopen week de 4x 2TB disks vervangen wat WD Greens waren (ook nog wel mee getest, dankzij een tip van Wim-Bart om WDIDLE3 te draaien. Uiteindelijk heb ik een Linux alternatief daarvoor gedaan en is deze idle-timer dus uit.
Omdat de fouten bleven, deze WD Greens aangeschaft zijn in 2010 en steeds dezelfde twee disks faalden, nadat ik de array meermaals opnieuw heb aangemaakt, ben ik ervan uitgegaan dat de disks ook gewoon op zijn. Afgelopen week heb ik daarom 4 nieuwe disks besteld en aangezien ik nu een P420 heb, kan ik ook grotere disks aansluiten aan de controller (officieel gaat die tot 4TB). Ik heb daarom 4x 4TB aangeschaft, maar helaas heb ik die nooit goed kunnen testen, omdat 1 disk daarvan DOA is.
De machine draait ESXi en op zowel de 4x 2TB als de 4x 4TB wil ik een RAID5 array aanmaken. Ik wil dus kijken hoe de 4x 2TB het nu doen. Deze combinatie heeft echter eenmalig geboot op mijn machine, daarna nooit meer; frapante daarbij is dat de disk in bay 3 nooit herkend wordt. Met de disks in de IcyDock als buiten deze IcyDock word de disk in bay 3 nooit herkend. De 7 overgebleven disks worden bovendien perfect herkend door mijn desktop, ik weet dus dat deze 7 overgebleven disks prima zijn.
Sluit ik de 4x 2TB array aan op SAS-poort 1 (de linker vanaf de achterkant gezien) dan doet de controller er heel langer over en uiteindelijk (denk ik) een soort time-out geeft en dan maar doorgaat, zonder disks herkend te hebben. Echter blijft het laden van ESXi dan hangen bij het laden van de nhpsa driver. Dit is de driver voor HP controllers.
Ik heb daarom het volgende geprobeerd om mijn 4x 2TB disks (waar reeds een RADI5 array op zit vanuit de HP P400) aan de praat te krijgen op mijn P420:
- Disks apart in mijn desktop getest. Alle disks (behalve de disk die DOA is) worden herkend door mijn desktop.
- Andere SAS-to-SATA kabel geprobeerd, dit geeft echter hetzelfde beeld. In de linker SAS-poort wordt de controller heet en hangt het laden van ESXi uiteindelijk op de nhpsa driver. Ik geloof wel dat na lang wachten ESXi uiteindelijk doorstart, maar ook dan gaat hij geloof ik automatisch herstarten.
- Disks aangesloten op de controller, terwijl zij niet in de IcyDock zitten. Ook dan worden maar 3 disks herkend, bay 3 wordt dan niet herkend, mits de SAS kabel aan de rechter SAS-poort zit. Geldt voor beide kabels, overigens.
- De SATA-kabels van de SAS-kabel aan andere disks. In eerste instantie had ik de volgorde 1, 2, 3 en 4. Ik heb ook de volgorde 2,1, 4 en 3 geprobeerd, ook met beide kabels overigens, maar ook dit mocht niet baten.
- UEFI/BIOS. Ik las in een issue op Github (al is dat een totaal anders iets als waar ik last van heb) dat eea wellicht kan komen doordat de PC vanuit UEFI boot. Ik heb daarom geswitched naar legacy, in de hoop dat het zou werken, maar helaas, ook dit mocht niet baten.
- HP driver van HP P420 upgraden vanuit commandline van ESXi Ik heb momenteel 2.0.14 (oid) geïnstalleerd, versie 2.0.16 (oid) probeer ik te installeren, maar lukt helaas niet. Op beide versies van ESXi (HP image van 6.5.0 van mei en juli 2017) overigens.
De HP SmartArray P420 is voorzien van versie 8 van de firmware, zover ik begrepen heb is dit de nieuwste. Ook zit er een 2GB FWBC module op met capacitor.
Als het even kan, gooi ik liever niet de array weg van de disks. Het is niet dat er superbelangrijke data op staat, maar zou het jammer vinden als ik alles wat er op staat, opnieuw moet zien te krijgen, daar gaat dan wel de nodige tijd eroverheen om die data terug te krijgen.
De versie van ESXi die ik gebruik is 6.5.0, ik heb de custom HP installatie, momenteel draait de versie van mei 2017, maar met de versie van juli 2017 (die onlangs released is) heb ik dezelfde problemen.
Toen ik met mijn server begon, intussen de nodige jaren geleden, heb ik destijds een HP P400 controller gekocht. Om compatibiliteit te houden met de array's en data loss te voorkomen (wat een overstap naar ZFS bijvoorbeeld momenteel zou kosten), heb ik ervoor gekozen om een nieuwe Smart Array te kopen.
Ik zit dus ook niet te wachten op reacties om over te stappen naar bijvoorbeeld ZFS. Ik weet dat dat een beter systeem is dan de hardware RAID die ik nu heb, maar ik heb momenteel de middelen noch de financiën niet om daar naartoe over te stappen op een nette manier, zonder data loss.
[ Voor 9% gewijzigd door CH4OS op 09-08-2017 23:53 ]