Als je een vraag stelt om te leren en niet om een kant-er-klare oplossing voorgeschoteld te krijgen is het per definitie geen domme vraag wat mij betreft; hier een poging tot uitleg:
Je hebt een drietal meest voorkomende concepten met tape backups.. Full, incremental en differential.
Full; alle bestanden op disk gaan naar tape. Archive bit wordt gereset.
Differential; maakt alleen backups van gewijzigde bestanden. Archive bit wordt niet gereset.
Incremental; maakt alleen backups van gewijzigde bestanden. Archive bit wordt wel gereset.
Archive bit is een flag op bestanden die wordt op 1 gezet zodra er een wijziging is geweest. Op deze manier kan een backup systeem zien welke bestanden er op tape moeten. Doordat incremental deze reset naar 0 zal een bestand de dag erna niet nog een keer op tape komen. Differential reset deze niet waardoor hij op iedere tape komt tot er weer een full wordt gemaakt.
In a nutshell; op diff tapes staan alle wijzigingen sinds de full. Op een incr tape staan alle wijzigingen sinds de vorige incremental.
In de praktijk verschil tussen incremental en differential; neem bijvoorbeeld deze situatie:
code:
1
2
3
4
5
| 100GB aan data in totaal.
Ma 5GB gewijzigd
Di 10GB gewijzigd
Wo 0GB gewijzigd
Do 8GB gewijzigd |
Stel dat je op vrijdag een full op vrijdag doet en de rest van de week
incrementals ziet de data op de tapes er alsvolgt uit:
code:
1
2
3
4
5
6
| Vr 100GB
Ma 5GB
Di 10GB
Wo 0GB
Do 8GB
Vr 100GB (er vanuitgaande dat het om gewijzigde data gaat, geen toevoegingen) |
Voordeel is dat de dag tapes alleen de wijzigingen bevatten ten opzichte van de dag ervoor. Minimaal data verschuiven dus. Nadeel is dat als je op donderdag een restore wilt doen heb je alle tapes nodig. Je restored de full en 'patched' hem daarna bij met de ma,di,wo en do tape. Als je een tape mist heb je een probleem.
Stel dat je op vrijdag een full op vrijdag doet en de rest van de week
differentials ziet de data op de tapes er alsvolgt uit:
code:
1
2
3
4
5
6
| Vr 100GB
Ma 5GB
Di 15GB
Wo 15GB
Do 23GB
Vr 100GB (er vanuitgaande dat het om gewijzigde data gaat, geen toevoegingen) |
Nadeel is dat je backup iedere dag groter wordt. Als er een dag geen wijziging is zal de backup even groot zijn als de dag daarvoor. Voordeel is dat je altijd maar 2 tapes nodig hebt bij een restore; als je op donderdag een restore doet gebruik je de full en vervolgens 'patch' je die met de do tape.
Ook vaak moet data lang bewaard worden dus kan het zijn dat er tapes offsite gaan. Wij doen vrijdag een full op 4 LTO4 tapes, die loopt tot zaterdag eind van de middag. Dan doen we ma-do incrementals omdat we toch een robotlibrary hebben, die houdt zelf bij welke data op welke tape staat dus geen tape zoektochten als we moeten restoren. Alle tapes gaan offsite in een 4 weken roulatieschema, die komen dus weer terug. Alleen de laatste vrijdag tapes van iedere maand blijven 'pemanent' offsite.
Stel dat ik iedere dag een backup moet maken van een heel groot bestand wat iedere dag wijzigd is het nogal nutteloos om een full(diff/incr) schema te maken. Dat bestand gaat toch iedere dag naar tape. Je zou er voor kiezen om iedere dag een full te doen.
Stel dat je heel veel data heb waar niet veel wijzigd zou je vrijdag een full maken (op 4 tapes bijvoorbeeld) en de rest van de week diffs/incr. Stel dat een incr en een diff ten allertijden gemakkelijk op 1 tape passen doe je natuurlijk diffs. Als diffs halverwege de week te groot zouden worden en een tweede tape vereisen zou je nadenken over incremental.
En zo zijn er heel veel afwegingen om rekening mee te houden: hoeveel data heb je, hoeveel wijzigd er per dag, hoe vaak moet je een restore doen, heb je een tape library of moet je handmatig wisselen, hoe lang loopt de backup, etc. etc.
Hoe de backup op jouw stage is ingericht is voor ons natuurlijk koffiedik kijken maar dit is de theorie.
Lang verhaal, maar dit is een beetje het idee.
http://en.wikipedia.org/wiki/Differential_backup bevat een grafiekje die het eea duidelijk maakt.
[
Voor 27% gewijzigd door
Pakjebakmeel op 25-04-2014 10:31
]