Arvesølvet i berget
I et hvelv, langt inne i et fjell, finner vi hele Stavanger Aftenblad.
Det er rart med aviser. I hundrevis av år har avisen brakt oss nyheter, annonser, værmeldinger, kommentarer, underholdning. Hver dag.
Når en avis blir noen uker gammel, er den uaktuell, og mister verdien. Men det rare er at når den blir enda eldre, får den en helt ny verdi. Som et historisk dokument — der vi kan få et innblikk i hvordan verden fortonte seg for folk akkurat der og da.
Og alle disse avissidene til sammen danner en enorm database med informasjon.
Noen har selvfølgelig forutsett dette, og laget et system for det. I Norge er det Nasjonalbiblioteket som tar på seg jobben å samle alt som publiseres i landet.
Ikke rart da at volumet blir stort. I hovedkvarteret til Nasjonalbiblioteket i Mo i Rana har de sprengt plass til magasinet i et fjell, og nå holder det på å bli for lite, så nå utvides hvelvet der inne i berget.— Her har vi nå 41000 hyllemeter med bøker og 11000 med aviser, forklarer Gunhild Myrbakk, seksjonsleder for logistikken.
Alt dette ligger der for å bli bevart for ettertiden. For vår generasjon og for de som kommer etter oss. Men hvordan skal en interessert stakkar klare å finne fram til noe han eller hun er interessert i?
Det må vel ha vært en tanke som har slått nasjonalbibliotekarene titt og ofte på den daglige reolvandringen opp gjennom årene. Vel hadde arkivarer prøvd seg med nye teknologier, mikrofilm og noe som ble kalt fiche, men likevel var en avhengig av at kunden nokså sikkert visste hvor informasjonen befant seg for å finne det. Ellers ble det å sitte kvalm og halvveis sjøsyk foran mikrofilmskjermen og "bla", eller "browse", som vi nå sier. I timevis. Mange studenter og historikere på sytti- og åttitallet har vaklet bleke ut av arkivene etter slike skjellsettende opplevelser.
Men så kom dataen. Så kom internettet. Og en helt ny verden åpenbarer seg. Nå blir det teknisk mulig å kunne søke i alt uten å bla gjennom mengder med papirsider eller mikrofilm. Nå går det.
Og dette tar Nasjonalbiblioteket naturligvis hys på. Digitaliseringsprosjektet blir født,— det som tar sikte på å overføre alt som er publisert på gamlemåten til digital informasjon. Og for så vidt også tilbake igjen - kunden skal kunne søke etter ord, datoer, etc. digitalt, og så få opp et bilde av avissiden slik den så ut originalt.
Et stort prosjekt, som er hjulpet av en teknologi som ble oppfunnet ganske tidlig, patentert faktisk i 1929, og som kalles OCR, optical character recognition. Det går i dag ut på at bokstaver som står på et ark som for eksempel er skannet, blir gjenkjent og overført til en datafil. Her ligger nøkkelen til søket, og her ligger også svakheten. For ikke alle bilder av avisene er like gode, det gjelder kanskje spesielt noe av det som ligger på film, og dermed kan OCR-programmet misforstå. Et annet problem er de gotiske bokstavene som blant andre Stavanger Aftenblad brukte i de første årgangene.
Med andre ord: Det er ikke hundre prosent sikkert. Men åttifem er likevel bedre enn null.Med OCRen som fremste våpen går Nasjonalbiblioteket ut i striden det er å digitalisere ALT de har på papir og film. Og nå er de også i gang der oppe med å digitalisere alt av lyd, bilder og video, for å gjøre alt innholdet i berget søkbart over formatgrensene.
Dette går seint. Det må det gjøre, faren for å ødelegge noe er ganske stor. Spesielt gjelder dette dessverre aviser fra rundt århundreskiftet (da snakker vi om FORRIGE århundreskifte), som var trykt på dårlig papir, som nå lett smuldrer opp.
— Det er en stor jobb å konservere disse avisene, sier konservator Anders Myrbakk. - Spesielt dårlig ser det ut for 1895- og 1896-årgangene.Stavanger Aftenblad kom for øvrig ut for første gang i 1893. — Mye av dette kan ramle fra hverandre hvis vi prøver å løfte det over på en skanner, sier Kjetil Iversen. Han er seksjonsleder for objektidigitaliseringen, og kommer over all verdens papirkvaliteter i arbeidet. Noe er så bra at det kan kjøres maskinelt, også blaingen i sidene, noe må strykes med strykejern for å glattes ut, og det dårligste må i verste fall konserveres før en i det hele tatt tar i det.
Kvaliteten på film er også så som så av og til, derfor har Nasjonalbiblioteket egne folk til å kvalitetssikre filmene.
— Vi har det meste på film fram til 2007, resten er i papir, forklarer han.Og de nyeste årgangene har de fleste avisene allerede elektronisk, som pdf-utgaver som er en kopi av papiravisene.
Aftenbladet skrev avtale med Nasjonalbiblioteket om å få tilgang til dataene for å bruke dem i vårt eget søkbare elektroniske arkiv.
I 2011 begynte vi å få over data fra Mo i Rana, og arbeidet med å bearbeide dem for vårt bruk var ferdig i 2014. Det tok lang tid fordi datamengdene er enorme, og fordi konverteringsprogrammet vi bruker avdekket en del feil som måtte rettes på.
Etter denne konverteringen er filene blitt sendt til selskapet Visiolink i Aarhus i Danmark.
— Hvis du ikke kan søke, har du ikke et arkiv, sier Frank Andersen. Og det er ikke så rart han sier det. Det er selve forretningsideen for firmaet han driver, Visiolink. Det vil si, det er ikke HELE ideen, Visiolink har spesialisert seg på å gjøre papir-printprodukter tilgjengelig på digitale plattformer, det vil for det meste si pc/mac, nettbrett og mobiltelefon.Her har Aftenbladet henvendt seg med arkiv-dataene, for å gjøre dem synlige og søkbare for kunder som deg og meg. Og det er her, i et hvelv i Herning, at filene til slutt fysisk blir liggende.
Visiolinks løsning er at vi skal kunne gå inn med et søkeord eller en frase, avgrense søket på dato, hvis det er nødvendig, og så få opp bilder av de sidene ordene opptrer. Det trenger ikke bare være artikler, det kan være bildetekster også. Og annonser, for den del.
Dette ligger altså bak presentasjonen av Aftenbladets elektronisk søkbare avisarkiv. Noen utgaver mangler, og feil kan det være her og der, men i det store og det hele skal arvesølvet vårt nå være tilgjengelig for alle med tilgang til en datamaskin, et nettbrett, eller en mobiltelefon.