vso schreef op maandag 8 mei 2017 @ 00:34:
[...]
Pfff ik kan hier een boekwerk over schrijven

maar in het kort een magnetisch veld is een keer te zwak om uit gelezen te worden. een tape van 1 jaar heeft minder read errors dan dan een tape van 7 jaar. er zijn zoveel factoren die dit beinvloeden dat is gewoon niet leuk meer. (en oplossingen)
Klopt en daarom heeft tape, meer dan disk, error correction.
Het hele idee van tape is dat je data er betrouwbaar op kan worden weggeschreven en ook na lange periode kan worden teruggelezen. Dus ja, het magnetisch veld zal achteruit gaan, maar wat is de werkelijke shelf-life van een tape die 1x beschreven en teruggelezen (verify) is? En als de shelf-life mede afhankelijk is van het aantal keer dat je de data leest, hoe groot is die invloed precies?
Daarbij, disk hoeft daar niet noodzakelijkerwijs beter in te zijn. Ook disk kan op alle mogelijke manieren falen en heeft ook een magnetisch veld dat mogelijk in de loop der jaren achteruit gaat.
Ik weet niet of er op dit moment een medium is dat een onbeperkte shelf-life heeft.
Niks is een volwaardige oplossing,
Vergelijk het met inkt op papier, ook onder de beste condities vertraag je het verouderings proces en afhankelijk van de kwaliteit van zowel inkt als papier hoe beter de kwaliteit hoe langer het duurt voordat het onbruikbaar is.
maar dat gezegd, wie zit op kopie nummertje x.y.z van uitslagen van de voetbal uitslagen van vandaag te wachten

terwijl de foto van dierbare herinneringen maar op 1 a 2 mediums zit ..
Vandaar hoe meer kopie-en hoe beter.
Dat is ook het idee van snapshots en backups. Idealiter zou je iedere blob data forever bewaren maar uit kostenoverwegingen doe je dat niet. Dus backup je met intervals, maar gooi je in de regel ook na verloop van tijd je tussenliggende backups weg. De kans dat je daarmee belangrijke data weg gooit is aanwezig maar een gecalculeerd risico.
[...]
Puur kosten besparing, tape is kosten post (ICT is kostenpost) dus als je bezuinigt .. laat je je overhalen om "dure" tape + opslag te laten varen voor backup to disk (immers disk is cheaper en kan ook offsite)
Dat is dus een heel grote misvatting.
De reden waarom LTO nog steeds verder ontwikkeld word en juist de heel grote bedrijven op tape backuppen, is omdat het goedkoper is per T, ook als je de aanschaf, afschrijving en onderhoud van je library mee rekent.
Natuurlijk zijn er meer kosten, zoals opslag en transport maar die heb je met disk ook als je het op een vergelijkbare manier doet. Offline en juist het feit dat je data niet gededupliceerd word is daarbij heel belangrijk. Een offline opgeslagen tape heeft een veel betere bescherming tegen hacks dan online opgeslagen data. Bij data die over over meerdere tapesets verspreiden is, loop je een veel kleiner risico dat al je data weg is als er een beperkte set datadragers het begeeft.
Zet je backup data op een RAID array en bij 3 of 4 gecrashte disks of fikt die array uit is AL je data weg. Heb je 1 tapeset waar 3 of 4 tapes het begeven hebben is alleen die set weg en kun je terug naar de vorige.
Met backup naar disk kun je dat weer afvangen door je backup systeem dubbel of driedubbel uit te voeren. Nadeel daarvan: de prijs. Backup naar disk is per T als je naar een enkele disk schrijft al veel duurder, schrijf je dezelfde data weg naar meerdere disks vermenigvuldigt dat de prijs per opgeslagen T.
Wat je bijvoorbeeld ook niet moet vergeten is dat een backup naar disk systeem 24/7 stroom vreet en omdat daar in de regel heel wat disks in zitten, is dat relatief veel. Tape kost ook stroom, je hebt de aansturende server en de library. Maar de library gebruikt relatief weinig stroom, de server ook want heeft genoeg aan 2 disksjes voor het OS en je backup software. Opgeslagen tape kost geen stroom. (Ok, indirect wel. De ruimte waarin de tape opgeslagen word moet geconditioneerd zijn maar da's bij een server niet anders dus die kun je redelijk tegen elkaar weg strepen, waarbij als je dat niet doet, het voordeel voor tape is omdat je minder koeling nodig hebt. Opgeslagen tape word immers niet warm en heeft dus geen flinke airco's nodig.)
Ook interessant aan tape:
De prijs per T neemt af naarmate je meer data op slaat.
Bij disk neemt dat linear toe.
Een deel van de kosten van tape zitten immers in je library en backup server. Die kosten heb je maar 1x. Of je nu 100 of 1000 tapes nodig hebt om je data op te slaan.
Bij disk is dat niet zo. Op een gegeven moment zijn je disk en je server vol. Moet je nieuwe disks aanschaffen (die keren zo duur zijn per T als tape) en vrij snel moet je een 2e, 3e en 4e server aanschaffen waarbij best wat kosten gaan zitten in de behuizing. (Mainboard, CPU, netwerkpoorten, etc.)
Kortom, backup naar disk is niet goedkoper en niet beter dan backup naar tape. Het enige echte voordeel van backup naar disk is dat je in de regel kortere restortetijden hebt. Om die reden zie je dat backup naar disk vaak als extra oplossing gebruikt word. Eerst naar disk, daarna alsnog naar tape.
En de redenatie dat database/mail vaak een kopie bevat dus wat je kwijt raakt is aanvaardbaar. (fout maar zo word het gezien) ..
Het is gewoon wachten totdat 1 bedrijf dit de harde manier leert, die de wereld wakkers schud.
Ik denk juist omdat bedrijven begrijpen dat tape een goede oplossing is, de ontwikkeling van tape nog steeds door gaat. Zoals boven beschreven, backup naar tape is goedkoop en retentie is eenvoudiger op te bouwen.
[...]
ZFS gaat meer Bitrot tegen, geen enkele software is slim genoeg om te bepalen of de wijziging van je data kwaadwillig of goedwillig is.
Dus als je niet tijdig bij een wijzig bent van je data, is je kans groot dat je alles kwijt bent.
Met ZFS kun je snapshots maken en DIE helpen wel degelijk tegen onbedoelde wijziging van je data.
De extra feature van ZFS is bitrot protection, dat niet veel andere filesystems hebben.
[...]
hangt af van je data, ik ben voor 1tb online + 1tb (dualdisk) + simple dual disk synology nas + ups veel minder kwijt

Hangt van je gekozen oplossing af. Doe je zoiets bij TransIP met BigStorage, kost je dat 30 EUR per maand.
CrashPlan en BackBlaze zijn volgens mij goedkoper, maar hebben onder andere als nadeel dat je niet weet waar je data staat. Ik weet niet of ik per-se mijn data in de USA wil hebben staan zeg maar...
[...]
Prive, bouw je alleen data op (het groeit) en zal niet snel verminderen ..
Zakelijk is je data eigenlijk relatief consistent en groeit naarmate je bedrijf en technologie-en groeien.
De meeste bedrijven *maken* data en gooien zelden iets weg. Ook zakelijk gezien groeit data over het algemeen en dus de behoefte aan opslag en backup volume.
Als ik kijk naar ons datavolume op kantoor, groeien we redelijk consistent met 100G per week. Soms zien we plots een dip van een paar honderd G en we proberen als het kan op te ruimen. Oude vm's en data faseren we uit (zetten we op disk, disk gaat in de kluis, data van het systeem) en we horen vaak van projecten dat als het project is afgerond, de data om dat op te bouwen verwijderd word. (Maar het eindresultaat staat uiteraard wel op het systeem.)
- Als je iets in de cloud zet, hoe gaat je cloud provider ermee om en hoeveel kan je "verhalen" als hij de data onbruikbaar maakt ?
- welke data heb je nodig om je bedrijf "levensvatbaar" te houden (aka mission critical) dit is vaak een klanten bestand en een x aantal tijd van specifieke data ..
Vaak neemt men alle data = mission critical, omdat simpelweg niet weet wat relevant is. Wat weer extra kosten resulteerd. hierom moet je ook je data splitsen in een soort lagen model waarbij je duidelijk kan specificeren wat waar en hoe gebackuped word. en helaas zit er altijd wel iemand bij die dit extreem goed of extreem slecht bepaald er tussenin.
De enige reden om te splitsen zijn de kosten.
Zou je niet op het geld hoeven te letten, is er geen reden om niet al je data te backuppen.
Je moet hierin dus een overweging maken en soms is het goedkoper om gewoon alle data te backuppen, dan die splitsing aan te brengen. Immers, met splitsen loop je risico's (namelijk dat iemand data ten onrechte als onbelangrijk classificeerd) en het splitsen as-such kost ook geld. Mensen moeten er immers over nadenken, de splitsing constant houden, bij nieuwe data bepalen waar die word opgeslagen, je backup systemen moeten er op worden aangepast, etc, etc, etc.
Het hoeft dus niet zo te zijn dat het splitsen van data een kostenbesparing oplevert.

Even ter afsluiter, bij een brand welke data & kennis is dan nodig om je bedrijf op een backup locatie (die ook nodig is) weer operationeel te krijgen met het bare minimum.. (en wat zijn dan de lange termijn kosten die gemaakt moeten worden om naar 100% te komen)
Idealiter denk je daar tevoren over na. Ik heb die kosten niet in beeld maar weet wel met grote zekerheid dat er heel wat moet gebeuren willen wij onze data niet binnen redelijke tijd terug kunnen halen.
Ik gok dat we binnen een week min of meer volledig operationeel kunnen zijn, bij totale uitval van alle datadragende systemen waarbij we 100% moeten terugvallen op tape.
Die tijd is aanzienlijk korter als we niet op tape zijn aangewezen.
Die week zal wel betekenen dat we samen met wat externe partijen zo'n beetje 7 dagen lang, 24/7 moeten doorwerken om de boel werkend te krijgen, maar het kan. Denk ik.
Ná Scaoll. - Don’t Panic.