[RAID] Is RAID nog wel nodig op Windows?

Pagina: 1
Acties:

  • Trommelrem
  • Registratie: Februari 2009
  • Laatst online: 09-11-2021
Na enkele jaren enkele honderden SSD's in het veld te hebben gemonitord, waarbij de slechte SSD's (denk aan OCZ) er snel uitgefilterd waren, wordt het eens tijd om een server uit te rusten met SSD's.

Nu zijn server SSD's voor mijn gevoel een slag apart. Nog steeds is er TLC, MLC en SLC, maar de prijzen zijn minstens 10x hoger. Vandaar dat ik twijfel of een mirror van SSD's nu echt gewenst is.

Het betreft een database die op een Hyper-V draait en asynchroon wordt gerepliceerd naar een offsite locatie. De Hyper-V Replica staat ingesteld op 30 sec. Verder wordt er elke avond een full backup gemaakt van de databaseserver. Omdat een full backup minder dan een uur duurt, komt er wellicht ook een full backup bij tijdens de lunchpauze. Het is immers een database van slechts 40 GB. Vanwege de te verwachten groei binnen 3 jaar, is de 691864-B21 een kanshebber, op voorwaarde dat deze op de HCL van de (nog aan te schaffen) server staat.

Nu zijn er een aantal nadelen aan RAID:
- Tweede SSD is een beetje prijzig;
- RAID helpt alleen bij een defect aan een schijf, niet aan een controller;
- Voor mijn gevoel kunnen RAID controllers de snelheid van een SSD niet altijd aan;

De backups:
Er zal om 12:00 uur en om 20:00 uur een full backup van de database worden gemaakt naar een NAS. Er wordt slechts eenmaal per dag een offsite backup naar een externe device gemaakt.

Ook vindt er Hyper-V Replicatie plaats. Een handmatige failover is dus altijd mogelijk en de hoeveelheid dataverlies is dan normaliter zo'n 30 sec. Die 30 sec. aan dataverlies gaat de klant hoogstwaarschijnlijk prima vinden. Monitoring van Hyper-V Replica is in de praktijk ook prima gebleken.

Een disaster recovery van de database server is onlangs nog getest: Deze duurt ongeveer een uur.

Voor de klant is een dag dataverlies nog te behappen.

Wat vinden jullie? Geen RAID? Wel RAID (mirror)? Waarom? Wat hebben jullie in een soortgelijk geval geregeld aan "redundancy"?

[ Voor 4% gewijzigd door Trommelrem op 22-06-2015 20:48 ]


Verwijderd

De keuze voor de juiste SSD zou ik als belangrijker achten dan de keuze voor RAID1/mirroring. Bovendien, hoe voer je die uit? Want ik ben niet zo te spreken over de mogelijkheden die Windows zelf biedt, en de mogelijkheden die je chipset drivers ("FakeRAID"). Voor thuisgebruik kan dat prima zijn, voor een server is dat onder de maat.

Dus een losse maar heel goede SSD is zo gek nog niet. Lekker simpel, dus ook geen potentiële problemen met de RAID-laag. Kun je zeker overwegen.

Welke SSD? Een Intel 320 of S3500/3700 bijvoorbeeld. Dat is de opvolger van de vertrouwde controllerchip gebruikt in de klassieke X25-M - het begin van de moderne SSD. Nog steeds de standaard wat mij betreft. Door zijn lange geschiedenis is de betrouwbaarheid beter dan welke andere SSD zou ik durven zeggen. In elk geval op papier door zijn lange track record en populariteit.

  • Bigs
  • Registratie: Mei 2000
  • Niet online
SSD's kunnen net zo goed falen als harde schijven. Uiteraard is het aannemelijk dat Enterprise SSD's minder snel falen dan hun consumenten evenknieën, maar dat geldt voor harddisks ook. Enterprise harddisks (de 10k/15k RPM types, niet de nearline 7200rpm schijven) falen in mijn ervaring zelden. Toch zou je er waarschijnlijk nooit aan denken om die zonder RAID te draaien. Dat geldt wat mij betreft voor SSD's dus ook.

Ik heb wel 1 server draaien met een enkelveroudige boot SSD (Intel DC S3500), maar dat is voor een niet-kritieke toepassing en noodgedwongen omdat er geen ruimte meer was op het backplane. Als hij faalt dan is de server binnen 30 minuten weer opnieuw geïnstalleerd met Cobbler+Puppet. Voor al het andere gebruiken wij absoluut RAID met SSD's.

Op de hybride SAN's hebben we wel overigens wel draaiende harde schijven als hot spares voor de SSD's vanwege de kosten (een beetje HGST SAS SSD met IBM sticker kost zo tegen de € 2000) en de gevoelsmatig lage kans op valen. De tijd zal uitwijzen of dit een verstandige keuze is :)

Verwijderd

Bigs, vergeet niet dat moderne SSDs al in feite RAID5 arrays zijn, dus dan praat je eigenlijk over een RAID55.

Hardeschijven zijn mechanische apparaten en het elektronische gedeelte faalt maar zelden. Bij SSDs is het andersom en zijn fysieke problemen zelden te oorzaak; maar op het softwarematige vlak veel vaker.

Moderne SSDs hebben bescherming tegen stroomuitval en tegen onleesbare NAND blocks middels hun RAID5 bitcorrectie ('RAISE', 'RAIN'). De betrouwbaarheid van een solid state drive is ten opzichte van een hardeschijf theoretisch astronomisch hoger. Mechanische techniek is in feite per definitie onbetrouwbaar - al zal het in veel gevallen afdoende betrouwbaar zijn. Met SSDs ben je in klap af van de risico's van mechanische techniek, maar door de complexiteit van de software (in feite een mini-OS) komen daar weer andere risico's bij.

Daarom is het zaak om een goede SSD te kiezen mijns inziens belangrijker dan om voor RAID te kiezen.

  • The Eagle
  • Registratie: Januari 2002
  • Laatst online: 17:41

The Eagle

I wear my sunglasses at night

Even vanuit een andere invalshoek: over wat voor DB's praten we? MS SQL en hyper V gaan wel samen qua replicatie, maar met elk ander DBMS ben ik bang dat je replicatie in het honderd loopt.

DR Wat ik bij een klant heb gezien: Twee locaties, elk met storage en een hypervisor. Storage draait kruislings van de VM's, dus VM op locatie A draait standaard op storage B. En backups van de data ook weer net omgekeerd. Bij een DR wordt de VM naar de andere locatie geblazen. Daar worden de datafiles weer aangekoppeld (die stonden er al). Start de DB op, recover de database en gaan.
DR van de data: VM op A, storage op B, storage op B valt weg. Op A stond ook al backup storage dus dan die aankoppelen, Db startup, recover en gaan.

Qua raid voor een DB: er werd vroeger gesteld dat je raid 1 moest hebben voor DB's. Dat was toen al discutabel omdat het afhankelijk was van lees en schrijftijden - en daarmee voor iedere DB anders vanwege het doel van de DB. Met HDD's was de HDD IO meestal de bottleneck, maar met de komst van SSD's is dat niet meer het geval. Dus kan de hele discussie over raid 1 of geen raid in principe ook de deur uit vwb het IO deel en blijft alleen het extra stukje veiligheid over.

Tenzij je DB zoveel ram en CPU trekt dat zelfs een SSD dat niet bijhoudt. Maar in voorkomend geval heb je meestal een in-memory ding als SAP HANA oid draaien en daarmee ook een (hyper) converrged stack in huis die special voor dat doel geschikt is. Eithe that, of je praat over Big Data achtige applicaties. En die doe je per definitie al niet op een RDBMS omdat dat daar sowieso niet voor geschikt is :P

Al is het nieuws nog zo slecht, het wordt leuker als je het op zijn Brabants zegt :)


  • lazybones
  • Registratie: December 2001
  • Laatst online: 30-11-2025
Ik heb inmiddels al meerdere Samsung 850 SSD's in HP Proliant DL380 G8 en DL385 G8 machines hangen aan een Smart Array P420 controller en dat werkt prima. Stuk goedkoper dan de officiele SSD's en tot nog toe erg betrouwbaar.

  • Trommelrem
  • Registratie: Februari 2009
  • Laatst online: 09-11-2021
Verwijderd schreef op maandag 22 juni 2015 @ 21:10:
De keuze voor de juiste SSD zou ik als belangrijker achten dan de keuze voor RAID1/mirroring. Bovendien, hoe voer je die uit? Want ik ben niet zo te spreken over de mogelijkheden die Windows zelf biedt, en de mogelijkheden die je chipset drivers ("FakeRAID"). Voor thuisgebruik kan dat prima zijn, voor een server is dat onder de maat.

Dus een losse maar heel goede SSD is zo gek nog niet. Lekker simpel, dus ook geen potentiële problemen met de RAID-laag. Kun je zeker overwegen.
Het zal in dit geval een P4xx of PERC controller zijn.
Welke SSD? Een Intel 320 of S3500/3700 bijvoorbeeld. Dat is de opvolger van de vertrouwde controllerchip gebruikt in de klassieke X25-M - het begin van de moderne SSD. Nog steeds de standaard wat mij betreft. Door zijn lange geschiedenis is de betrouwbaarheid beter dan welke andere SSD zou ik durven zeggen. In elk geval op papier door zijn lange track record en populariteit.
Hoewel ik die Intel's zeer goed vind, staan die niet op de HCL van HP. Als de server een HP wordt, dan wordt het waarschijnlijk een 691864-B21. Dat is geen SLC maar MLC. Voor deze situatie voldoende.
Bigs schreef op maandag 22 juni 2015 @ 21:33:
SSD's kunnen net zo goed falen als harde schijven. Uiteraard is het aannemelijk dat Enterprise SSD's minder snel falen dan hun consumenten evenknieën, maar dat geldt voor harddisks ook. Enterprise harddisks (de 10k/15k RPM types, niet de nearline 7200rpm schijven) falen in mijn ervaring zelden. Toch zou je er waarschijnlijk nooit aan denken om die zonder RAID te draaien. Dat geldt wat mij betreft voor SSD's dus ook.
Mijn ervaring is dat een controller tegenwoordig sneller faalt dan een enterprise-HDD. Als de controller faalt, dan heb je niets meer aan je twee disken, tenzij je een extra controller on spare hebt die ook nog eens dezelfde firmware heeft.

Maargoed, wetende dat Hyper-V Replica wordt ingesteld met een latency van 30 sec., is RAID dan nog wel nodig? Want ik heb het gevoel dat RAID tegenwoordig wordt gezien als een heilige graal, wat het mijns inziens zeker niet is.
The Eagle schreef op maandag 22 juni 2015 @ 22:14:
Even vanuit een andere invalshoek: over wat voor DB's praten we? MS SQL en hyper V gaan wel samen qua replicatie, maar met elk ander DBMS ben ik bang dat je replicatie in het honderd loopt.
MSSQL en Hyper-V :)

De replicatie loopt al een tijdje als proef op de huidige server en dat geeft weinig problemen. Inmiddels is de monitoring ook goed ingeregeld, zodat er automatisch een ticket wordt aangemaakt als de replicatie faalt. De updates die telkens worden verstuurd zijn erg klein, gemiddeld 5-10 MB.

Het is een database van slechts 40 GB, waar niet zo extreem veel wijzigingen in worden gemaakt.
lazybones schreef op maandag 22 juni 2015 @ 22:45:
Ik heb inmiddels al meerdere Samsung 850 SSD's in HP Proliant DL380 G8 en DL385 G8 machines hangen aan een Smart Array P420 controller en dat werkt prima. Stuk goedkoper dan de officiele SSD's en tot nog toe erg betrouwbaar.
Ik heb enkele nieuwe klanten die een soortgelijke configuratie hadden. De P420 werd plotseling een bottleneck. Zelfde geldt voor de PERC H700. Er is echter wel een enorme snelheidswinst. Hoewel ik bekend ben met de Samsung 845DC SSD's, gaat dat niet gebeuren. De SSD's moeten wel op de HCL staan in verband met support.

  • Bigs
  • Registratie: Mei 2000
  • Niet online
In plaats van Hyper-V replicatie waarbij je 30 seconden verliest zou ik liever synchrone replicatie op databaseniveau opzetten (neem aan dat MS SQL wel zoiets heeft). Dan staan al je writes gegarandeerd ook op de slave.

Daarnaast bedacht ik me nog een voordeel van RAID: als één SSD een leesfout geeft op een sector dan kan de andere SSD hem mogelijk/waarschijnlijk nog wel kan lezen. Je RAID controller zorgt daarvoor en je applicatie draait gewoon door. Als je op een enkele SSD draait en je krijgt een leesfout dan valt niet gelijk je hele VM uit, maar je krijgt wel een storing in je database. Het zal geen aanleiding zijn voor een automatische failover. Wat gebeurt er überhaupt met de replicatie op het moment dat er een fout ontstaat in je storage? Dit is voor mij onbekend terrein, ik zou lekker met RAID draaien.
Pagina: 1