Nye plattformer. Hvis du spør den tidligere kongressmannen Anthony Weiner, kan digitale nedtegnelser – spesielt de på internett – virke nærmest umulig å bli kvitt. Når et bilde eller et dokument reduseres til en rekke 1-tall og 0-er, blir det mulig å sende, kopiere, laste ned og lagre. Du kan ikke brenne opp digitale bøker, og ideer som skylagring gjør det mulig å ha en sikkerhetskopi på flere ulike steder. Det er en forsikring mot at selv en brann ikke gjør masteroppgaven eller bryllupsbildene til aske. Digitaliseringen av data beskytter dem mot fysiske katastrofer. Men slik situasjonen er nå, er de langt fra evigvarende. Problemet er ikke først og fremst at dataene i seg selv kan forsvinne, men at det ikke vil være mulig å lese dem.
Problemet er ikke først og fremst at dataene i seg selv kan forsvinne, men at det ikke vil være mulig å lese dem.
Prøv å åpne et WordPerfect-dokument i Windows Vista 7 eller 8 for eksempel, og du finner raskt ut at Microsoft har sluttet å støtte denne programvaren. På samme måte har ikke Apple støttet Claris Works siden 2004, da de kastet sitt gamle kontorverktøy etter 13 år. Og Playstation 4, som kom ut sent i 2013, kan ikke lese den originale «Crash Bandicoot» på CD-ROM fra 1996 (noe som er virkelig deprimerende siden det var et fantastisk spill). Og vi får bare håpe du aldri får behov for å finne tilbake til noe du har lagret på en diskett.
«Det å lagre bits er ikke så vanskelig. Spørsmålet er hva bitsene betyr?» sier Vint Cerf, en av internetts grunnleggere og Googles fremste «internettevangelist».
Det har bare gått rundt 50 år siden disketten ble oppfunnet, og mange moderne laptoper har allerede droppet etterfølgeren, CD-ROM. Plutselig ser papirdokumentets lange levetid lovende ut.
«Hvis vi ikke finner en løsning på dette problemet, vil det 21. århundret bli et sort hull når det gjelder informasjon.» Vint Cerf, amerikansk internettpionér
«Hvis vi tenker 1000 år, eller 3000 år frem i tid, må vi spørre oss selv: Hvordan bevarer vi alle bitsene vi tenger for å lese de digitale filene vi skaper, på en korrekt måte?», sier Cerf. «Hvis vi ikke finner en løsning på dette problemet, vil det 21. århundret bli et sort hull når det gjelder informasjon.»
Plutselig ser papirdokumentets lange levetid lovende ut.
I konstant endring. Selv om det er en herlig (og trist) ironi i det at «informasjonsalderens» innbyggere ikke etterlater seg noe brukbar informasjon, er det i alle fall én person som har bestemt seg for at det ikke skal skje.
Ved Carnegie Mellon har Mahadev Satyanarayanan, eller Satya som de fleste kaller ham, begynt å utvikle en plattform som er designet for å katalogisere og lagre både de digitale objektene vi skaper og, helt essensielt, beskrivelser av programvaren og hardwaren som gjør at de kan tolkes. Kjent som Olive Archive er Satyas plattform designet for å ta seg av noen av de vanskeligste dataene man kan bevare: eksekverbare filer (filer med instruksjoner som får en datamaskin til å utføre bestemte oppgaver, red.anm.)
Det å arkivere statisk data, som et bilde eller et tekstdokument, er én ting, men mye av dagens viktige digitale informasjon er dynamisk.
Det å arkivere statiske data, som et bilde eller et tekstdokument, er én ting, men mye av dagens viktige digitale informasjon er dynamisk. Videospill, interaktive databaser og applikasjoner er vanskeligere å bevare fordi de ikke bare er avhengige av at en datamaskin er i stand til å lese bits og bytes, men krever også at den fremtidige hardwaren er i stand til å legge til kommandoer og tolke endringer i programmet. Crash Bandicoot snurrer rundt når en spiller trykker på firkanttasten på en Playstation-kontroll.
Men selv om all koden fra spillet ble bevart i et arkiv, så har ikke en vanlig datamaskin noen firkanttast. Den samme typen problem vil ramme fremtidens datamaskiner ettersom mikroprosessorer som CPU-er, GPU-er, hovedkort og annen hardware fortsetter å utvikle seg.
Én løsning vil være å bevare et eksemplar av all hardware. Selv om det kanskje ville være å gå for langt, ville det latt oss gjenskape økosystemet tilhørende de dataene vi skulle ønske å få frem.
Virtuell etterligning. Én løsning vil være å bevare et eksemplar av all hardware. Selv om det kanskje ville være å gå for langt, ville det latt oss gjenskape økosystemet tilhørende de dataene vi skulle ønske å få frem. Olive Archive tar sikte på å oppnå den samme typen bevaring, men deres tilnærming er langt mer elegant og vil ikke kreve et enormt lager fullt av eldgammel hardware, som trolig ville gått i stykker i løpet av noen år uansett. Satya ønsker å skape «virtuelle maskiner»: kart eller beskrivelser av hardwaren som vil muliggjøre at gamle programmer gjenskapes ved hjelp av programvare. Det å etterligne tidligere hardware med nåtidens programvare er ingen ny idé (faktisk kan alle med en Android smarttelefon laste ned en Playstation-etterligner og spille «Crash Bandicroot» i dag), men ideen om å bygge et arkiv som er i stand til å åpne og få et hvilket som helst digitalt objekt til å fungere, er en enorm oppgave.
Så hva skal til for å lagre for eksempel en artikkel fra en nettside så den overlever i tusen år? Satya foreslår først å lagre den som PDF for å gjøre den enklere å lagre. En PDF krever Adobe Reader for å kunne åpnes, så fremtidsmenneskene vil måtte ha den samme versjonen av programmet som det ble lagret i. Adobe Reader fungerer imidlertid bare innen et operativsystem, så en versjon av Windows (eller Mac OS eller Linux) som er kompatibel med PDF-leseren vår, vil måtte inkluderes i den virtuelle maskinen.
Operativsystemet kjøres dessuten på en eller annen type hardware. Den virtuelle maskinen kan etterligne hardwaren på en konkret datamaskin, men en hvilken som helst PC som kan kjøre en versjon av Windows som er kompatibel med Adobe Reader, ville fungert.
Hver eneste lille mengde data i en digital fil eksisterer i et økosystem bestående av programvare, operativsystem og hardware. Satyas mål er å skape et arkiv av alle disse komponentene som kan settes sammen etter behov, lastes opp på en server og være tilgjengelig for brukerne via internett. «Filformater skapes ikke i isolasjon – de går hånd i hånd med programvaren som benytter de samme formatene», sier han.
Olive åpnes i nettleseren din omtrent på samme måte som en YouTube-video, forskjellen er at programvaren som kjøres gjennom Olive, etterligner hele økosystemet, så du kan klikke, skrive og gjøre endringer akkurat som om du faktisk bruker den gamle hardwaren og programvaren.
Lag på lag på lag. Siden de først begynte arbeidet i 2013, har Olive Archive allerede arkivert ting som Windows 3.11, flere tiår gamle spill som «Oregon Trail» og «DOOM», og til og med ligningsprogrammet «TurboTax 1997», hvis noen tilfeldigvis skulle være 18 år for sent ute med å levere selvangivelsen for det året. Ifølge Satya er Olives potensial til å arkivere digitale objekter nesten ubegrenset. Systemet skal være i stand til å holde tritt med enorme omveltninger i dataverdenen, som utviklingen av kvantecomputere eller til og med bortfallet av det binære systemet.
For å kjøre noen foreldede dataprogrammer, vil en datamaskin i fremtiden ganske enkelt etterligne hardwaren som opprinnelig etterlignet det gamle programmet da det ble lagt inn i arkivet.
I dag er det Intels x86-kompatible hardware som hersker over hele verden. Nesten alle PC-er bruker i dag en eller annen variant av x86-arkitekturen – et sett instruksjoner som styrer nesten alle grunnleggende hardwarefunksjoner, som spenner fra det å lese kildekode til å fordele minne.
Ut av ren nødvendighet har Intel gjort arkitekturen fullt ut kompatibel bakover. Satya mener at på grunn av x86s absolutte allestedsnærvær, vil det fortsette å være viktig i den nære fremtid. Om tusen år vil imidlertid alt være mulig. Olive skal imidlertid være i stand til å fortsette arkiveringen ved å legge til nye lag av etterligninger.
«Vi tror at uansett hva som erstatter Intel x86, så er det så mye nedarvet programvare som er skrevet for dette, at det helt sikkert vil lages en etterligner for x86. Hvis ingen andre gjør det, vil de som da forvalter Olive, kunne gjøre det», sier han. «Så lenge man har etterligningsprogrammer, kan man legge dem lag på lag. I 5000 e.Kr., hvis vi forsøker å kjøre et program som ble skrevet i 2015, vil vi kanskje bruke fem lag med etterligninger.»
All den datakraften … så langt inn i fremtiden … bare for å løpe gjennom jungelen som en oransje punggrevling iført dongerishorts.
Publisert på nautil.us 30. mars 2015.