Back-updeskundigen die hun vak verstaan zijn al jaren geleden overgestapt op de schijf als primaire back-up. Gisteren schreven we in dit artikel waarom tape nog steeds groot is voor langetermijnopslag. Maar tape is problematisch voor dagelijkse operationele back-up en recovery. Vandaag staan we stil bij de redenen waarom schijf tape met gemak versloeg.
Random-access
Als je schijf en tape vergelijkt is er vooral één groot voordeel dat disk heeft boven tape: random-acces, het idee dat een apparaat data kan uitlezen op een willekeurige plek op het apparaat (een gericht doel) in plaats van sequentieel blokken uit te lezen. Je zou zeggen dat tape het voordeel heeft, omdat back-up in principe een proces is met een stroom data die zich prima zou moeten lenen voor seriële toegang.
Maar het probleem met de back-up is dat de stream te traag is om te voldoen aan moderne tape-drives. (In het artikel gisteren lichtten we dat nader toe, de korte versie is dat tapes een constante hoge snelheid hebben en die snelheid niet kunnen aanpassen.) Een random access-apparaat daarentegen kan een langzamere datastroom makkelijk verwerken, omdat het beschikbare gegevens kan wegschrijven, even kan pauzeren en dan het volgende stukje schrijft. Dat heeft ook zijn recovery-voordelen, waar we hieronder op ingaan.
Meerdere gelijktijdige operaties
Een tapedrive heeft een enkele lees/schrijf-kop die op elk moment één blok data kan schrijven. Harde schijven hebben meerdere koppen die tegelijkertijd meerdere datastromen kunnen schrijven. Koppel dit aan random-access-mogelijkheden en een schijf kan tientallen gelijktijdige schrijfacties uitvoeren op verschillende snelheden, zonder prestaties te moeten opofferen.
Het is als die circusartiesten die verschillende borden tegelijk op steeltjes draaien, terwijl er maar één bediener is. Dat is in feite wat een harde schijf ook doet: hij ontvangt tientallen back-ups tegelijk en schrijft ze allemaal snel genoeg dat een back-up er niets van merkt dat het slechts een van vele operaties is die wordt uitgevoerd door de schijf.
Schijven kunnen dingen die tape niet kan
Deduplicatie is een interessante technologie die wordt vereist en mogelijk is door schijven. Deduppen was noodzakelijk bij schijfgebaseerde back-ups, omdat schijven veel kostbaarder zijn dan tape. Daarnaast is deduplicatie veel makkelijker op schijf, dus je zou kunnen stellen dat dit concept bestaat bij de gratie van schijftechnologie.
Maar deduplicatie doet veel meer dan het verkleinen van de effectieve kosten van de schijven. Zonder deduplicatie zou de enige mogelijkheid voor de meeste klanten om hun back-ups te benaderen door fysiek een doos tapes weg te brengen. Door de hoeveelheid data die nodig is om een back-up te schrijven te verkleinen, kunnen mensen hun back-ups via een WAN-verbinding versturen.
Sommige klanten doe dit met een duplicatiegebaseerde back-up die een tweede back-up op een andere locatie kan opslaan. Anderen doen dit met brongebaseerde deduplicatie doe back-ups direct naar een dienstverlener kunnen versturen via internet. Hoe dan ook, het voornaamste punt is dat deduplicatie ervoor zorgt dat je geautomatiseerd back-ups kunt verzenden.
Als je je back-ups kunt dedupliceren en ze kunt overzetten naar een fysiek andere locatie zonder dat je met tapes hoeft te sjouwen, betekent dat ook dat je een kopie van je omgeving extern kunt opslaan die onmiddellijk kan worden geactiveerd bij een calamiteit. Zonder schijf, deduplicatie en elektronisch verzenden van back-ups is het simpelweg niet mogelijk om een cloudgebaseerd disasterrecoverysysteem te hebben die het werk van je datacenter met één druk op de knop kan overnemen. Maar nu is dat vrij eenvoudig met veel back-upsystemen.
Een apparaat dat random-access gebruikt kan ook een live recovery ondersteunen, waarbij een een virtuele machine direct vanaf zijn back-up kunt draaien. Dat kun je om verschillende redenen willen doen. Misschien hoeft je geen hele calamiteit te behandelen of wellicht heb je gewoon toegang nodig tot een oudere versie van een VM. Met een instant recovery kun je dat doen zonder dat er een traditionele herstelactie aan te pas hoeft te komen. De producten die instant recovery momenteel ondersteunen kunnen maar een paar VM's tegelijk aan, maar met tape kun je dit helemaal niet doen.
Het idee om alle back-ups op een centrale plek op te slaan die je willekeurig kunt benaderen geeft een extra toegevoegde waarde aan deze back-ups. Zo ondersteunen bijvoorbeeld sommige systemen continue analytics om bepaalde trends als ransomware te ontwaren. Als ransomware wordt gedetecteerd, kun je met schijfgebaseerde back-up de getroffen back-ups verwijderen zonder andere back-ups te raken.
Disk won met gemak van tape
Tape blijft de baas als je het hebt over langetermijnopslag en archivering, maar voor back-up doeleinden is het voor de meeste omgevingen steeds lastiger om tape te verdedigen als de beste aanpak.
Schijf is duurder, maar functioneler voor verschillende doeleinden. je kunt meerdere back-ups tegelijk voeren op welke snelheid dan ook, gegevens direct delen tussen locaties zonder fysiek transport, recovery in de cloud, instant recovery van VM's en de voordelen van scannen en analyse van back-up-data. Tape is geenszins dood, maar ik zie het niet terugkomen als operationeel back-up en recovery-systeem.
hmm, tape meer geschikt voor langere duur ??
de tape kan op ten duur ook corrosie vertonen,en dan is het ding ook waardeloos.
Tape is gewoon onverslaanbaaar als archiefmedium. Het is goedkoop, compact en snell en bovendien licht en energiezuinig, omdat bij de zgn. Winchester disc de drive en de schijf onlosmakelijk zijn samengevoegd. Weinig is onhandiger dan een pakhuis vol harde schijven, maar voor databases die voortdurend worden bijgewerkt moet je wel.
Tegenwoordig zie je voor massaopslag ook dat men overgaat op stapels harde schijven waarvan de voedingsspaning wordt uitgeschakeld als ze even nie aktief zijn. Dat maakt de toegangstijd een stuk langer, maar bespaart energie.
Harde schijven zijn niet zo snel als er veel niet-sequnenti'ele oegang vereist, zoals voor databases; als snelheid vereist is, wint de SSD, voor langdurige betrouwbare opslag is tape beter. End anders maak je een combinatie van die twee.
Netwerken zijn mooi om kleine hoeveelheden data naar wisselende bestemmingen te verzenden met korte wachttijd. Voor grotere hoeveelheden data wordt een vrachtwagen vol tapes enkel verslagen door een vliegtuig, trein of schip met dezelfde banden.
AWS snowmobile! Maar inderdaad, zo werken cloudaanbieders a hter de schermen ook gewoon. Handig aan de cloud vind ik wel dat je dit allemaal weg-abstraheert achter een simpele API die pay-as-you-go is. Glacier/S3 zijn best een gouden greep in veel van wat ik doe.
Reageer
Preview