Check alle échte Black Friday-deals Ook zo moe van nepaanbiedingen? Wij laten alleen échte deals zien

Backup / File duplication van veel bestanden

Pagina: 1
Acties:

  • P-e-t-j-e
  • Registratie: Juli 2005
  • Laatst online: 23-11 19:57

P-e-t-j-e

dapper oranje: wortheldje

Topicstarter
Beste medetweakers,

we hebben een klant die een map met foto'tjes heeft waarvan er elke dag zo'n 10000 bijkomen. Er staan er nu al een paar honderduizend in (misschien wel miljoen+), welke ook moeten blijven staan omdat deze realtime geraadpleegd moeten kunnen worden... Helaas heb ik geen controle over hoe de files worden opgeslagen omdat dit via de software van een externe partij gaat en dit proces is niet simpel aan te passen en mag niet verstoord worden.

Een volledige backup van de data naar tape via backup exec duurt meer dan 3 dagen terwijl we een dagelijkse backup moeten hebben.

Op basis van een backup van de volledige schijf naar disk (zodat we niet naar de individuele bestanden hoeven te kijken) kan wel, die we vervolgens naar tape kunnen backuppen. Bij een restore moeten we dan echter de complete kopie restoren van tape terug naar disk om vervolgens een bestandje van 50kb terug te zetten. Dat proces is te ingewikkeld en duurt te lang. Tevens moeten we dan TB's aan ruimte hebben om de backup naar te maken/restoren.

We hebben een backupschema bedacht waarin we elke dag alleen bestanden van de laatste 30 dagen backuppen en dan 1x per maand een maandtape. Andere variant is hetzelfde maar dan met 90 dagen en een kwartaal tape. Ik ga in deze vraagstelling even uit van 30 dagen.

Probleem is hierbij dat je dan moet gaan backuppen op basis van datum van de file. We gebruiken backup exec 2014, maar deze is ook 3-4 dagen bezig om alle bestanden te doorlopen om de datum te checken.

Volgende oplossing die we bedacht hadden: via robocopy elke dag de bestanden van de afgelopen 30 dagen naar een 'tussenmap' kopieren zodat deze in de backup meegenomen kunnen worden. We hoeven na de initiele kopie dus alleen elke dag 1 dag aan foto's weg te gooien (die is 31 dagen oud) en 1 dag erbij te zetten. Dat laatste gaat weer via robocopy. Probleem is dat robocopy weer ALLE bestanden doormoet om te kijken welke files van de laatste dag zijn en dus weer 2-3 dagen nodig heeft.

We zitten dus een beetje op een dood spoor met het 'filteren' van de bestanden.

Nu dacht ik (ik heb in Delphi geprogrammeerd) dat er vast wel een tool moet zijn die een hook binnen NTFS aansturing van windows kan maken zodat bestanden die in de map met foto's worden gemaakt automatisch worden gedupliceerd naar een andere map. Dus geen service of progje dat de map scant, want dan lopen we weer tegen het probleem van de hoeveelheid bestanden aan. We kunnen dan met robocopy elke dag de bestanden van ouder dan 30 dagen verwijderen waardoor we netjes een up2date kopie houden van de bestanden van de laatste 30 dagen. Is hier een betrouwbare oplossing voor (liefst freeware, maar betrouwbaar heeft prio. Indien niet gratis dan een trialware zodat we kunnen testen)?

Ik hoop dat er goede ideeen zijn!

doe wat je niet laten kunt en laat wat je niet doen kunt


  • Question Mark
  • Registratie: Mei 2003
  • Laatst online: 28-11 16:59

Question Mark

Moderator SSC/WOS

F7 - Nee - Ja

Is het dagelijks maken van een synthentic backup, in combinatie met "previous versions" (op je fileserver) een optie?

Dan heb je gewoon een full backup van het complete systeem, en met behulp van previous versions kan ontzettend snel een enkel bestandje teruggezet worden.

Welk OS wordt eigenlijk gebruikt?

[ Voor 3% gewijzigd door Question Mark op 04-12-2014 14:31 ]

MCSE NT4/2K/2K3, MCTS, MCITP, CCA, CCEA, CCEE, CCIA, CCNA, CCDA, CCNP, CCDP, VCP, CEH + zwemdiploma A & B


  • Killah_Priest
  • Registratie: Augustus 2001
  • Laatst online: 28-11 13:26
P-e-t-j-e schreef op donderdag 04 december 2014 @ 14:06:
Nu dacht ik (ik heb in Delphi geprogrammeerd) dat er vast wel een tool moet zijn die een hook binnen NTFS aansturing van windows kan maken zodat bestanden die in de map met foto's worden gemaakt automatisch worden gedupliceerd naar een andere map.
Dit bestaat al en heet DFSR.

  • P-e-t-j-e
  • Registratie: Juli 2005
  • Laatst online: 23-11 19:57

P-e-t-j-e

dapper oranje: wortheldje

Topicstarter
Dit is toch voor replicatie naar andere server, niet naar een andere map op dezelfde server? Of kan dat ook? En stel dat het kan, kan ik dan ook DFSR instellen voor alleen nieuwe bestanden en niet de bestaande?

[ Voor 16% gewijzigd door P-e-t-j-e op 05-12-2014 09:52 ]

doe wat je niet laten kunt en laat wat je niet doen kunt


  • P-e-t-j-e
  • Registratie: Juli 2005
  • Laatst online: 23-11 19:57

P-e-t-j-e

dapper oranje: wortheldje

Topicstarter
Sorry, details vergeten :) Hierbij wat meer inhoudelijke info:

Het zijn 2 identieke servers met hetzelfde probleem, dus hierbij info van 1 server:

Server OS: Server 2012 R2 Standard
HP Proliant DL380p Gen8
7TB in raid 10 OS en DATA - 3TB in raid 5 beschikbaar voor backup data
HP Storageworks Ultrium 6 SAS Tapedrive aangesloten via een H222 HBA

Fotomap is ongeveer 305GB en bestaat momenteel uit 9,2 miljoen bestanden

doe wat je niet laten kunt en laat wat je niet doen kunt


  • P-e-t-j-e
  • Registratie: Juli 2005
  • Laatst online: 23-11 19:57

P-e-t-j-e

dapper oranje: wortheldje

Topicstarter
Question Mark schreef op donderdag 04 december 2014 @ 14:30:
Is het dagelijks maken van een synthentic backup, in combinatie met "previous versions" (op je fileserver) een optie?

Dan heb je gewoon een full backup van het complete systeem, en met behulp van previous versions kan ontzettend snel een enkel bestandje teruggezet worden.

Welk OS wordt eigenlijk gebruikt?
Synthetische backups maken gebruik van incrementals. Hiervoor moeten dus alle bestanden nagelopen worden om te kijken welke er bij zijn gekomen. Met 10miljoen bestanden duurt dat dus dagen blijkbaar... Uiteraard gebruiken we binnen BE incremental backups, zoals beschreven middels weektapes/maandtapes. Na zo'n tape maken we weer een full backup. Het maken van de full backup duurt echter momenteel al dagen, waardoor er nog maar 1 of 2 incrementals in een week zouden kunnen worden gemaakt. Dan zitten we alweer bijna tegen de volgende full backup aan.

doe wat je niet laten kunt en laat wat je niet doen kunt


  • Powermage
  • Registratie: Juli 2001
  • Laatst online: 10:10
Ik zou eens kijken naar Idera backup, deze heeft CDP functies waardoor hij realtime back-upt.
enige nadeel is dat deze een complete scan uitvoert bij een reboot (die dan weer door je trage io enkele dagen duurt) maar je reguliere backups zouden snel moeten gaan.

Join the club


  • Question Mark
  • Registratie: Mei 2003
  • Laatst online: 28-11 16:59

Question Mark

Moderator SSC/WOS

F7 - Nee - Ja

P-e-t-j-e schreef op vrijdag 05 december 2014 @ 10:19:
[...]
Synthetische backups maken gebruik van incrementals.
Weet ik, ik dacht dat je enkel "full backups" maakte.
P-e-t-j-e schreef op donderdag 04 december 2014 @ 14:06:
Een volledige backup van de data naar tape via backup exec duurt meer dan 3 dagen terwijl we een dagelijkse backup moeten hebben.
Ik begreep uit bovenstaande dat je hier dus alleen maar "full backups" maakte. :)

Hebben jullie al eens getest om de huidige backupjob op te splitsen in meerdere kleinere? Deze kunnen dan concurrent draaien en zo wellicht de doorlooptijd verkorten.

Weet je overigens zeker dat je bottleneck in de hoeveelheid bestanden en Backup Exec zit? Je gebruikt een LTO 6 tapedrive. Dan moet je de data met minstens 54 MB/s aanleveren aan de drive, anders stort de performance in. Dat is ook de reden waarom vaak bij LTO 6 eerst een backup to disk gemaakt wordt, en dan pas naar tape.

[ Voor 3% gewijzigd door Question Mark op 05-12-2014 11:42 ]

MCSE NT4/2K/2K3, MCTS, MCITP, CCA, CCEA, CCEE, CCIA, CCNA, CCDA, CCNP, CCDP, VCP, CEH + zwemdiploma A & B


  • P-e-t-j-e
  • Registratie: Juli 2005
  • Laatst online: 23-11 19:57

P-e-t-j-e

dapper oranje: wortheldje

Topicstarter
Ik heb zojuist alles van tafel geveegd en ben opnieuw begonnen met het verzamelen van testresultaten aangezien mijn collega de reeds geteste opzetten niet heeft gedocumenteerd.

Het lijkt erop dat de klant de tapes niet consequent wisselt en daarnaast de data niet meer op 1 tape past waardoor de backups van dagen krijgen:"

dag 1: backup op tape 1
dag 2: backup op tape 2
dag 3: blijft wachten op tape 1 voor verify
dag x: backup wordt gecancelled wegens overschrijden maximale looptijd of door collega wegens 'te lang lopen'

Betreft je opmerking qua throughput, ik ben nu ook aan het kijken naar de drive config mbt de block size etc. Het is redelijk onbekend voor me maar ik heb begrepen dat een grotere buffer en blocksize aanzienlijke prestatiewinst op kan leveren bij kleine files. De lto drive ondersteund blocksize tot 16MB dus de maximale instelling (1mb) lijkt me het beste gezien de miljoenen kleine files. De server heeft 64GB geheugen waarvan 56% in gebruik dus ik heb hier genoeg ruimte in.

Iemand tips met betrekking tot de ideale instellingen? Ik denk aan het volgende:

Block size: 1MB
Buffer size: 1MB
Buffer count: 25 (?? wat is hier een goede regel voor?)
High water count: 0 (volgens gevonden info op 0 laten staan als deze default al o 0 staat)

doe wat je niet laten kunt en laat wat je niet doen kunt


  • Question Mark
  • Registratie: Mei 2003
  • Laatst online: 28-11 16:59

Question Mark

Moderator SSC/WOS

F7 - Nee - Ja

Is het niet handiger om eerst een backup naar (local) disk te maken, en die backup als één grote file op tape zetten? Je hebt 3 TB per server ruimte over voor backup. :)

Je zou het in elk geval eens een keer als test kunnen overwegen. Als dat net zo traag gaat, weet je dat je niet veel gaat winnen door het proberen te optimaliseren van de tape-drie instellingen.

Kijk ook nog eens naar mijn genoemde optie met betrekking tot het gaan gebruiken van previous versions voor het restoren van een enkele file.

MCSE NT4/2K/2K3, MCTS, MCITP, CCA, CCEA, CCEE, CCIA, CCNA, CCDA, CCNP, CCDP, VCP, CEH + zwemdiploma A & B


  • P-e-t-j-e
  • Registratie: Juli 2005
  • Laatst online: 23-11 19:57

P-e-t-j-e

dapper oranje: wortheldje

Topicstarter
Verwijderde bestanden kun je alleen terugzetten door de hele map te restoren naar een eerder punt? Is geen optie aangezien er dagelijks 10000 files bijkomen in de map. Als een gebruiker een map verwijderd moet ik deze ook los terug kunnen halen...

Betreft je backup in 1 file, hebben we overwogen en getest maar dan moeten we een file van 2,9TB terugzetten om een plaatje van 25kb te restoren :)

doe wat je niet laten kunt en laat wat je niet doen kunt


  • Killah_Priest
  • Registratie: Augustus 2001
  • Laatst online: 28-11 13:26
P-e-t-j-e schreef op vrijdag 05 december 2014 @ 14:51:
Verwijderde bestanden kun je alleen terugzetten door de hele map te restoren naar een eerder punt? Is geen optie aangezien er dagelijks 10000 files bijkomen in de map. Als een gebruiker een map verwijderd moet ik deze ook los terug kunnen halen...

Betreft je backup in 1 file, hebben we overwogen en getest maar dan moeten we een file van 2,9TB terugzetten om een plaatje van 25kb te restoren :)
Zie de opmerking hierboven, waarom geen shadow copies (previous versions) gebruiken voor een "quick restore" van een enkel bestand?
Dan zou je de huidige foto's altijd nog op een andere manier (eventueel in een VHD file) kunnen backuppen.

  • P-e-t-j-e
  • Registratie: Juli 2005
  • Laatst online: 23-11 19:57

P-e-t-j-e

dapper oranje: wortheldje

Topicstarter
Hoi KP, omdat je dan geen verwijderde bestanden terug kunt halen zonder de hele map te herstellen, waardoor andere files misschien overschreven worden met vorige versies? Of zie ik het vekeerd?

doe wat je niet laten kunt en laat wat je niet doen kunt


  • akimosan
  • Registratie: Augustus 2003
  • Niet online
Dat zie je verkeerd. Je kunt de Previous Version van de map gewoon openen in de Verkenner/Explorer (kies de datum en tijd van de Shadow Copy). Vervolgens selecteer je de bestanden en/of mappen die je nodig hebt en kopieert deze simpelweg terug (overschrijven) of naar een andere locatie.

[ Voor 16% gewijzigd door akimosan op 05-12-2014 19:11 ]


  • Question Mark
  • Registratie: Mei 2003
  • Laatst online: 28-11 16:59

Question Mark

Moderator SSC/WOS

F7 - Nee - Ja

^^ Yup, zie ook: Previous versions of files: frequently asked questions

Deze optie kun je gebruiken om snel een enkel bestand (of een oudere versie van een bestand) terug te zetten. Je reguliere backup kun je dan gebruiken voor disaster recovery.
P-e-t-j-e schreef op vrijdag 05 december 2014 @ 14:51:
Verwijderde bestanden kun je alleen terugzetten door de hele map te restoren naar een eerder punt? Is geen optie aangezien er dagelijks 10000 files bijkomen in de map. Als een gebruiker een map verwijderd moet ik deze ook los terug kunnen halen...

Betreft je backup in 1 file, hebben we overwogen en getest maar dan moeten we een file van 2,9TB terugzetten om een plaatje van 25kb te restoren :)
Dat hoeft dus niet... Wat was de performance van deze backup naar disk eigenlijk?

[ Voor 46% gewijzigd door Question Mark op 05-12-2014 19:22 ]

MCSE NT4/2K/2K3, MCTS, MCITP, CCA, CCEA, CCEE, CCIA, CCNA, CCDA, CCNP, CCDP, VCP, CEH + zwemdiploma A & B


  • Mud
  • Registratie: Februari 2007
  • Laatst online: 11:20

Mud

Indien je server virtueel is, is Veeam geen optie?

  • Mental
  • Registratie: Maart 2000
  • Laatst online: 20-10-2020
Of kijk eens naar Data Protection Manager binnen de system center suite (of een willekeurige andere backupoplossing die disk én tapebackups doet, bijvoorbeeld dag backups naar disk en weekbackups naar tape. (in beide gevallen kun je op fileniveau restoren).

Combineer dat met een tabe library (waar dus meerdere tapes inzitten die automatisch in de drive gestopt worden indien nodig) en je elimineert het probleem van het tapes wisselen. Elke dag naar tape backuppen is .. tsja, merkwaardig maar wellicht noodzakelijk maar het kan allemaal, als je het maar professioneel genoeg (lees: duur) aanpakt ;)
Pagina: 1