localhost schreef op 14 augustus 2002 @ 06:42:
De performance van de backup zakt voornamelijk in elkaar als we bij de dataservers aankomen (en die zijn niet traag) ik denk dat dit komt door de enorme hoeveelheden kleine files (van 1 kbyte) en daar heb ik zo'n 10 tot 20 GB mee vol staan op beide servers. Het is niet anders, we hebben het nodig.
Bij een restore is het al niet anders - het aanmaken van de vele inodes kost buitensporig veel tijd. Het enige wat helpt is een goed getuned filesystem (kom ik *zelden* tegen) en veel write cache op de disk controllers. Als het om RAID gaat dan kun je wellicht experimenteren met de blocksize van de raidset. Voor tapedrives geldt dat de beste waarden zijn: DDS 16K, DLT 64K, LTO 256K.
En ja, in geval van brand restoren op nieuwe hardware. Dat gaat lang duren vrees ik, men heeft tot nu toe geen uitwijkplan willen maken/uitvoeren. Dus we zullen maar eens beginnen met het zoeken van enkele stuks hardware en bedrijfsruimte als het zover komt.
Da's nu precies mijn werk, uitwijkplannen opstellen

Ik kan daar dus verder geen commentaar op geven zonder te vervallen in reclame uitingen, sorry. Wel wil ik kwijt dat het op voorhand niet nodig is om zelf ruimte en apparatuur aan te schaffen voor die doeleinden.
Vraagje1: Heb je ook ervaringen (tijdens de restores dan) met de fabrikant van de paketten?
Ja, en die ervaringen zijn even triest als die van jou. Buiten veel zoeken in hun knowledgebases ('Will be solved in the next release') en af en toe een blauwe blazer in een Alfa 147 ('Tsja, dit is natuurlijk unsupported') ben ik nog geen leverancier tegengekomen die simpelweg een aantal losse tips kon uitdelen. Wel hebben wij zelf een lijst met tips & trucs voor een aantal pakketten en hardware (voornamelijk gericht op recovery). Die is te groot om lukraak hier neer te zetten, maar als je specifieke vragen hebt, vraag maar raak. Een tip die meestal wat verstopt zit in de manuals van de backuppakketten: zorg dat de database van het backuppakket na elke backup op een *aparte* tape wordt gezet. Arcserve zet het standaard als aparte sessie achteraan de backup, waardoor je de gehele tape eerst moet scannen voordat je de database kunt restoren. Netbackup en Omniback kunnen een database weer opbouwen vanaf de backuptapes (net als 'merge' in Arcserve), bij TSM/Tivoli mag de database nimmer verloren gaan.
Vraagje2: Hoe makkelijk is het toevoegen van extra filesystemen (Unix) of disken (NT) aan een backup. Zien Omniback en Netbackup dit automatisch?
Beide pakketten maken bij Unix gebruik van naar keuze het gehele systeem (alles onder een nodenaam), fysieke disken (raw devices), volumegroups of logical volumes (HP-UX en AIX hebben beiden LVM tenslotte) of databases. Bij databases kun je onderscheid maken tussen online en offline backups, journal logs en wat al niet meer. Het is standaard dus mogelijk om periodiek (bijvoorbeeld zondag) automatisch een offline backup te maken van een database en de rest van de week een online backup met alle logfiles. Bij een restore kun je dan simpelweg de offline restoren, de online d'erover heen gooien en tot de laatste minuut een roll forward te doen.
Bij nieuwe filesystemen hangt het af welk niveau je hebt gekozen. Als je bijvoorbeeld van een systeem alle mountpoints backupt, dan moet je zelf een nieuw mountpoint toevoegen aan de backup. Ga je bijvoorbeeld per volumegroup, dan zullen alle nieuwe mountpoints, lvols en raw devices automatisch meegaan.
Tip tussendoor, kijk even naar Ignite UX bij de HP-UX systemen - snel en gemakkelijk op te zetten en een prima manier om snel vg00 te restoren in geval van nood.
En NT/Win2K/Novell ... tsja, daar zul je per volume/driveletter/directorie moeten werken of het hele systeem, een tussenweg (vg, lvol) is er niet.
Bij Win2K/Novell kennen alle pakketten tegenwoordig het verschil tussen NDS/AD, system state en data, die daarom in de praktijk vrij goed te restoren zijn.
Vraagje3: Omdat ons huidelige backup window al bijna 24 uur is, doen we dus incrementals op weekdagen. Hoe gaan Omniback en Netbackup om met incrementals op Unix?
Geen enkel probleem. Incrementals, differentials, vanaf een bepaald tijdstip, alles is eenvoudig in te stellen voor elke backup. Mag ik opmerken dat een backup window van bijna 24 uur naar mijn maatstaven te lang is voor een bedrijf dat 24/7 in de lucht wil/moet zijn?
De door iemand anders al genoemde TSM pool kan een oplossing zijn, evenals de 'snapshot' technologie, bij de leveranciers bekend onder namen als snapshot, TDMF Open, Data Protector, Data Mover enz. In principe doet de backupserver dan een 'freeze' van alle systemen, maakt van alle filesystemen een 'snapshot', laat alles systemen weer lopen en gaat vervolgens rustig de snapshot op tape zetten. Deze methode is vooral geschikt als je een (remote) mirror hebt natuurlijk, dan kun je ook de bekende methode gebruiken van: freeze systemen / breek mirror / unfreeze systemen / mount en backup mirror / resync mirror.
Nou ehm ... dat was weer genoeg getypt voor vanavond, ik hoop dat je er wat aan hebt