Tape groeit de laatste jaren door. In 2017 werd meer dan één miljoen petabyte aan LTO-tapecapaciteit geproduceerd, meer dan vijf keer zoveel als in 2008. In dezelfde periode is tapeless back-up en recovery de norm geworden. Elke back-updeskundige die ik spreek raadt disk aan als primair middel voor reservekopieën.
Waar komt dan die tape-groei vandaan? Het antwoord is wellicht verrassend en om een beeld te schetsen waar die interesse vandaan komt en tape een goede toekomst tegemoet heeft, kijken we vandaag naar de redenen waarom tape soms de voorkeur verdient en in welke scenario's schijven beter functioneren voor het doel.
Tape-opslag is goedkoop
Zelfs met alle vooruitgang qua deduplicatie - wat primair op schijven gebeurt - is tape nog steeds goedkoper per gigabyte om een aantal redenen. Met tape scheidt je het medium van het schrijvende apparaat, waardoor je een een klein aantal drives en duizenden tapes kunt inzetten. Deze tapes hebben geen stroom of koeling nodig om data te behouden.
Sommige mensen beargumenteren dat zelfs als schijven gratis waren, ze nog steeds duurder zouden zijn dan tape vanwege de kosten in het energieverbruik. De reden dat tape minder prijzig is dan alternatieven is een van de redenen dat we het nog steeds hebben over tape. Maar er is meer.
Tape schrijft data beter
Als je bitjes wegschrijft naar opslag, gebeurt voltrekt zich eens in de zoveel gigabyte een unrecoverable bit error, wat een dure term is voor het opslaan van een nul in plaats van een één of andersom en het wordt niet afgevangen door foutcorrectie. Wat veel mensen niet beseffen over tape is dat het daadwerkelijk een betere Bit Error Rate (BER) heeft dan andere opslagmedia.
LTO-7 en 8, en Oracle T10000 tapedrives hebben unrecoverable BER's van 1:1019, wat neerkomt op één error elke 1,25 exabyte (een miljoen terabyte). Enterprise HDD's hebben een BRE van 1:1015, oftewel een fout elke 125 terabyte. Dat betekent dat in feite tape duizend keer effectiever is in het schrijven van enen en nullen dan de beste harde schijven.
Voor het geval je nieuwsgierig bent naar hoe SSD's zich verhouden, die hebben een BRE van 1:1016 tot 1:1018 wat betekent dat in het beste geval tape nog steeds tien keer beter is met het schrijven van data. De verschillen tussen schijven en tape kun je verkleinen met betere checks op de datakwaliteit, maar het feit blijft dat tape simpelweg beter is in het schrijven van data.
Tape is beter in het vasthouden van data
Een van de minst begrepen elementen van tape is waarom het goed is in het bewaren van data, wat een kwestie van vrij eenvoudige natuurkunde is. Magnetische bitjes verliezen na verloop van tijd coherentie, de vraag is alleen hoe snel dat gebeurt. Ontwerpers gebruiken een methode om ervoor te zorgen dat een magnetisch bitje zijn positie niet verandert na verloop van tijd. In de formule KuV/kT zijn de relevante variabelen V, het volume van het magnetische deeltje, en k, de temperatuur waarbij het wordt bewaard. Hoe groter het magnetische deeltje en hoe lager de temperatuur waarbij het wordt bewaard, hoe beter.
Tape drives gebruiken vrij grote magnetische deeltjes en tape wordt opgeslagen op normale temperatuur. Schijven gebruiken kleinere deeltjes en draaien doorlopend op hogere temperaturen dan de omgeving waarin tape wordt opgeslagen. Het resultaat is dat tape veel beter de lading vasthouden gedurende een langere periode. Aangeraden wordt om gegevens niet langer dan vijf jaar te bewaren op een schijf, terwijl hetzelfde bestand op tape dertig jaar intact blijft.
Schijven hebben een snellere random-access time
Mensen zijn er aan gewend geraakt dat hun gegevens altijd direct beschikbaar zijn en dat data doorlopend wordt beschermd. Dat kan met de lagere random-access time van schijven. Een schijf is letterlijk duizend keer sneller in het verkrijgen van toegang tot het eerste datablok dat gelezen moet worden. Afhankelijk van hoe je tape gebruikt, kan het een minuut tot enkele uren duren om gegevens uit te kezen. Als je herstelsoftware veel zoekacties uitvoert tijdens recovery, kan de langere tijd tot deze toegang ellendig uitpakken.
Schijven passen snelheid makkelijk aan
Het grootste probleem van tape is dat het niet overeenkomt met de snelheid van de meeste back-ups: het is zelfs te snel. De gecomprimeerde doorvoersnelheid van een LTO-8-tapeapparaat is 750 MB per seconde. Hij werkt erg goed met die snelheid, maar erg slecht voor een lagere snelheid. De meeste back-ups zijn tussenliggende back-ups die stukjes verder bouwen op de vorige en deze zogenoemde incremental back-ups gaan met een paar MB per seconde en die snelheid werkt simpelweg niet met tape.
Een schijf kan met enkele megabytes per seconde werken - of zelfs enkele kilobytes mocht dat nodig zijn - en het kan ook nog eens honderden back-ups gelijktijdig uitvoeren op die snelheid, terwijl elke back-up nog steeds op een aparte locatie wordt opgeslagen. Dat kan tape niet en maakt schijf geschikter voor de meeste back-ups dan tape.
Waarom al die tape?
Als mensen tape niet gebruiken voor hun back-upsystemen, wie gebruikt het dan allemaal? Het antwoord ligt in secundaire opslag. Tape wordt steeds meer gebruikt voor de opslag van grote hoeveelheden referentiedata die betrouwbaar gedurende een lange periode moeten worden bewaard tegen een zo laag mogelijke prijs. Bedrijven in de entertainmentindustrie of de biotech-sector gebruiken enorme bestanden (waar de tijd tot toegang minder relevant is) en kopen grote tapevoorraad om bibliotheken te vullen met duizenden tapes.
Wat voor veel mensen misschien het verrassendst is, is dat cloudleveranciers tape gebruiken voor hetzelfde doel. Waarom denk je dat het vaak langer duurt om je data via minder dure diensten te bereiken? Sommige bedrijven gebruiken absoluut tape in de backend om betrouwbare langetermijnopslag te hebben van data die niet vaak aangesproken wordt.
Wat veel mensen zien als de toekomst is vaak gebouwd op iets dat men ziet als iets ouds. Denk daar maar aan de volgende keer dat iemand je vertelt dat een technologie dood is.
Reageer
Preview