JaQ schreef op woensdag 30 mei 2012 @ 22:15:
[...]
Hoe dan ook, persoonlijk zou ik voor een systeem altijd voor de eenvoudigste restore-optie kiezen. m.i. is dat alles in de database
...
Daarbij moet ik wel opmerken dat ik met Oracle databases werk ipv MySQL (en op systemen die wel PITR vereisen vanuit EU of DNB regels).
Nou weet ik niet hoe oracle opslag werkt. Maar transactie logs wil je meestal maar van een "korte" periode bewaren en daarna wil je een complete backup hebben.
Qua restore opties zet ik liever 100.000 files terug waarvan er misschien vanwege reden x/y/z 10 beschadigd zijn dan 10 db-files van 10Gb het stuk waarvan er 1 beschadigd is.
Persoonlijk moet ik er niet aan denken om bij een restore actie een initiele database te restoren en dan daarna 5 jaar aan transactie logs daaroverheen te gooien. Maarja, ik moet er ook niet aan denken om 1 db van 200Gb te moeten restoren om er dan achter te komen dat murphy's law heeft opgetreden.
Doe mij dan maar 1 db van 5Gb met daarnaast 195Gb aan files waarbij murphy's law optreedt in 10 files.
Oftewel het blijft een afweging. Heb je de structuur in huis om elke dag echt de backup te controleren zodat je murphy's law minimaliseert (desnoods pak je de backup van gister) dan kan 1 db van 200Gb best acceptabel zijn. Mis je echter de dagelijkse controle (imho bij 99% van de bedrijven van toepassing) of je de backup ook echt kan restoren dan is het een riskante operatie en kan je murphy weer minimaliseren door simpelweg de kans dat murphy iets belangrijks raakt te minimaliseren.
Zo ken ik nog een "grappig" verhaal van een ex-collega van mij. Die had een "defecte" backup drive en een strict backup + restore regime zodat hij altijd 100% zeker wist dat het te restoren was. Met de "defecte" drive ging het helemaal perfect, jarenlang goed gegaan. Toen kwam er een nieuwe server + een nieuwe tape-robot en spontaan kwamen er allemaal errors naar boven (tijdens backup en restore).
Hij heeft er ongeveer een maand in gestoken (inclusief HP-hulp) en eindconclusie was : zijn oude tape-drive was niet up-to-spec maar functioneerde wel binnen zichzelf. As in alles wat beschreven werd was ook weer uit te lezen, alleen niet in een andere tape-robot, enkel in dit ene apparaat wat off-spec was.
Dit soort verhalen zijn grappig zolang ze ontdekt worden bij vervanging server etc. Komen ze naar boven terwijl je server net afgefikt is en je een bedrijfs-restore op een complete nieuwe bak probeert te doen dan zijn ze iets minder grappig.
En in dat licht vind ik het ook altijd wel grappig hoe sommige mensen netwerk-diskjes etc afschrijven als "voor ongevoelige data" etc. Hetgene wat er op die dingen staat is namelijk ook niet-gevoelige data. Die dingen kunnen 10x per jaar kapot vallen, de echte belangrijke backup is wel netjes geregeld, het enige wat die dingen doen is een stukje restore-beheer weghalen zodat alledaagse users het zelf kunnen ipv dat sys-beheer het moet doen.
[
Voor 45% gewijzigd door
Gomez12 op 30-05-2012 22:51
]