haku Agricola - Suomen historiaverkko kartta
uutta hakemisto


Tietoyhteiskunnan katoava muisti
AGRICOLA



Milloin otit viimeksi varmuuskopion omista tiedostoistasi? Oletko varma että joskus vuosia sitten tekemäsi työt ovat edelleen luettavissa? Digitaalisesti tallennettu tieto on epävakaata ja hankalasti säilytettävää, nykyaikaiset tallennusmenetelmät vanhenevat nopeaan tahtiin. Ellei huolelliseen arkistointiin ja käännöstyöhön kiinnitetä tarpeeksi huomiota korvaamattoman arvokkaita tietoja häviää peruuttamattomasti. Tietoyhteiskunnan muisti on lyhyt ja haavoittuva.

Varmuuskopioinnin merkitystä, tiedon siirrettävyyttä ja tallennusta on käsitelty jo vuosien ajan eri tiedotusvälineissä. Tavallisesti julkaistuista jutuista on kuitenkin puuttunut historiallinen perspektiivi. MikroBitin 4/2003 numerossa julkaistiin Jukka Kauppisen oivallinen artikkeli Digitieto katoaa, jossa hän selvitti laajasti digitaalisten tallennusmenetelmien historiaa ja esitteli myös nykyisin käynnissä olevia digitaalisen tiedon pelastushankkeita. Liitteenä oli myös synkältä vaikuttava lista merkittävistä tapauksista, joissa historiallisesti arvokasta tietoa on hävinnyt eikä niiden palauttaminen ole enää mahdollista. Esimerkiksi Australia on menettänyt 1970-luvulla tehdyt maan kattavat geologiset kartat, koska alkuperäisiä magneettikeloja ei pystytä enää lukemaan. Yhdysvalloissa puolestaan osa Vietnamin sodan aikaisista sotilastiedostoista ovat hävinneet ja viidennes Viking-luotaimen keräämistä Mars-tiedostoista ovat myös käyttökelvottomia.

Kauppisen historiallisesti painottuneen artikkeli herätti ajatuksia siitä, miten suunnitella luotettavia ja turvallisia menetelmiä digitaalisen tiedon arkistointiin. Digitaalisen tiedon tallennus, ja siirrettävyys eivät ole kysymyksiä, joista pelkästään tietotekniikka-alan asiantuntijoiden tulisi olla huolissaan. Tietoisuus digitiedon haavoittuvuudesta pitäisi ulottua aivan asiantuntijataholta tavalliseen käyttäjään asti. Muussa tapauksessa piittaamattomuus ja tietämättömyys voi johtaa varsin ikäviin yllätyksiin seuraavien vuosikymmenten aikana. Viime aikoina on puhuttu runsaasti vanhojen lehtien ja arkistoaineiston digitalisoinnin tärkeydestä, mutta varsin vähän on kohdistettu huomiota tietotekniikalla jo tuotettujen valtavien aineistojen siirrettävyyteen ja säilyvyyteen. Historiantutkimuksen kannalta kysymys on ensiarvoisesta digitaalisen menneisyyden säilyttämiseen liittyvistä haasteista ja mahdollisuuksista.

Digitaalisen tiedon tallennuksen historiaa

Tiedontallennusmenetelmät ovat muuttunut lukuisia kertoja tietotekniikan lyhyen historian aikana. Monet näistä menetelmistä ovat olleet käytössä vuosikymmeniä. Tavallisessa nykyaikaisessa PC-koneessa on käytössä useiden eri sukupolvien tallennusvälineitä. Yleisin pitkäaikaisen tiedon varastoijana on kiintolevy, jotka yleistyivät kotimikroissakin 1980-luvun loppupuolelta lähtien. Vanhin edelleen laajassa käytössä oleva tallennuslaite on 3,5 tuuman levykeasema, joka tuli markkinoilla jo vuonna 1980. "Korppuaseman" lopullisesta häviämisestä on tehty ennusteita viimeistään 1990-luvun loppupuolelta lähtien. Suurin syy on levykkeen liian pieni tallennuskapasiteetti. Vielä 1980-luvun lopussa 1,44 megan kapasiteetti oli varsin riittävä, mutta nykyään yksi iso word-tiedosto saattaa toisinaan täyttää levykkeen kokonaan. Korjaavaksi on esitetty esimerkiksi USB-tallentimia, mutta toistaiseksi siirtymäkauden pituudesta ei ole mitään tietoa.

Nykyisin yhä laajemmin tiedon tallennusta ja siirtoa varten käytetään kirjoittavia CD--asemia. Harvemmin näkee enää niiden rinnalla vielä parisen vuotta sitten käytettyjä ZIP-asemia. Suomessa kirjoittavat asemat alkoivat yleistyä kulutuselektroniikka markkinoilla vasta aivan 1990-luvun lopussa. Nykyään näiden korvaavaksi tarjotaan kirjoittavia DVD-asemia, joiden ensimmäistä yleistymispiikkiä odotetaan aivan lähivuosina.

Tallennetun tiedon ikä on pitkälti riippuvainen käytetyn tallennusformaatin laadusta ja säilytysolosuhteista. Huolellisesti lämmöltä, kosteudelta ja auringon valolta suojatut levykkeet voivat säilyä lukukelpoisina periaatteessa vuosikymmeniä. CD-R -levyjen eli romppujen säilytysiästä ei ole toistaiseksi varmaa tietoa saatavilla. Mikäli valmistajien puheisiin on uskomista niin rompun eliniän haitari on välillä 30-100 vuotta. Tuleville DVD-levyille luvataan vieläkin pidempää elinkaarta. Tällä hetkellä vaikutta siltä, että kotipolttoiset romput ovat toistaiseksi riittävän hyviä tiedostojen pitkäaikaissäilytykseen. Sisällöltään todella tärkeistä rompuista kannattaa silti ottaa uudet kopiot vähintään viiden vuoden välein.

Tavallisen tiedon arkistoijan kannalta suurin ongelma ei ole levykkeen tai rompun säilyvyys. Pelkän tiedon tallentaminen ei riitä vaan myös laitteistot ja tietoja lukevat ohjelmat tulisi säilyttää. Ennemmin tai myöhemmin mikä tahansa tiedosto ei ole enää luettavissa, mikäli alkuperäisiä ohjelmia ja laitteistoja ei ole saatavilla. Tietotekniikan historia tarjoaa lukuisia esimerkkejä siitä kuinka tekniikan kehittymisen vuoksi lukuisten laite- ja ohjelmistosukupolvien häviäminen on tuottanut merkittäviä hankaluuksia. Aikoinaan tiedon tallentamisessa käytetyt mekaaniset reikäkortit ja -nauhat lienevät tästä varhaisin esimerkki. Korteilla ja nauhoilla olevan tiedon siirtäminen digitaaliseen muotoon on tällä hetkellä lähes salatiedettä.

Toisaalta käytännön esimerkkejä löytyy myös lähihistoriasta. Esimerkiksi 1970- ja 1980-luvulla mikrotietokonealalla tiedon tallentamisessa puuttuivat selvät yhteiset standardit. Käyttöjärjestelmistä Microsoftin DOS oli vain yksi monien joukosta. Suomessa käytettiin vielä 1980-luvun alussa laajasti CP/M -käyttöjärjestelmää yrityksissä, korkeakouluissa ja valtion virastoissa. Tavalla tai toisella yhteensopimattomia tietokonemalleja oli markkinoilla kymmenittäin. Tallennukseen oli mitä erilaisimpia magneettikeloja, nauhoja, kasetteja ja levykkeitä.

Muutamia vuosikymmeniä sitten tallennetun tiedon siirtäminen PC-koneille vaatii joka tapauksessa nykyään varsinaisia erikoistaitoja. Esimerkiksi harvinaisella kotimikron nauha-asemalle tallennetun tiedon siirtäminen onnistuu vain oikeiden laitteiden ja ohjelmien hankinnalla. Tämä merkitsee tavallisesti myös pakollista vierailua vanhojen koneiden ja ohjelmistojen keräilyyn erikoistuneilla verkkofoorumeilla. Toisinaan parikymmentä vuotta sitten tallennettua tietoa ei saada enää siirrettyä vaikka oikea toimiva laite ja ohjelmisto löydettäisiin. Esimerkiksi häiriöille alttiissa magneettikeloissa ja -nauhoissa tallennettu tieto on jo saattanut hävitä kokonaan taustakohinaan.

PC-koneiden tiedostojen tallennuksessa on olemassa omat ongelmansa. Esimerkiksi PC-koneilla viiden tuuman levykkeet olivat vielä yleisessä käytössä 1990-luvun puoliväliin asti. Tänä päivänä näitä levyjä lukemaan kykeneviä asemia löytää lähinnä atk-laitteistojen romutus ja kierrätyspisteistä. Nyt erityisen suuressa vaaravyöhykkeessä ovat vanhat DOS-ohjelmistoilla tallennetut tiedostot, joiden siirtäminen Windows-ympäristöön voi tuottaa yllättäviä hankaluuksia. Tekstitiedostojen kanssa ongelmat eivät ole toistaiseksi olleet kovin pahoja, mutta vaikeudet kasvavat siirryttäessä rakenteeltaan monimutkaisempiin tiedostoihin.

Digitaalisen tiedon pelastushankkeita on ollut käynnissä myös Suomessa, mutta toistaiseksi toiminta ei ole ollut mitenkään yhtenäistä. Ehkä arvokkainta ja pyyteettömintä tähän alaan liittyvää työtä harjoitetaan tietotekniikka-alan ammattilaisten perustamissa yhdistyksissä. Yksi näistä on Jyväskylässä majapaikkaansa pitävä ja vuonna 1996 perustettu Suomen tietojenkäsittelymuseoyhdistys ry. Vanhojen tietokoneiden ja muiden laitteiden keräilyn ja näyttelytoiminnan lisäksi jäsenet ovat harjoittaneet eri laitesukupolville laadittujen tallennus- ja tiedostoformaattien muuntamista yhteensopivaan muotoon. Olemassaolonsa aikana yhdistys on tehnyt tiedon konservointityötä useille eri instituutioille. Yksi mielenkiintoisimmista hankkeista liittyi Suomen ilmavoimien Hornet-hävittäjien hankintoihin. Amerikkalaiset toimittivat hävittäjien varaosaluettelon reikäkorteilla ja armeijan oli turvauduttava yhdistyksen palveluihin, jotta tiedot saatiin noukittua talteen.

Tietojenkäsittelymuseoyhdistyksen jäsenten edustama tietotaito on lähes katoavaa kansanperinnettä. Historiantutkimuksenkin kannalta olisi tärkeää, että menneeseen tietojenkäsittelyyn liittyvät laitteet ja tiedot säilytettäisiin tuleville sukupolville. On yllättävää kuinka omalla tietoteknisellä osaamisellaan ylpeilevässä Suomessa on kiinnitetty huomiota vanhojen laitteistojen ja ohjelmistojen hallintaan ja ylläpitoon. Lisäksi tekniikka-alan museohankkeet ovat valitettavasti viime aikoina olleet rahoituksensa puolesta vastatuulessa.

Digitaalinen tieto ja historiantutkimus

Vanhojen tietokoneiden ja ohjelmistojen tietojen pelastaminen antaa vain esimakua tulevista vaikeuksista. Historia-alan ammattilaisille digitaalisen tiedon arkistointi ja säilyttäminen on tuonut selvästi uusia tutkimuksellisia haasteita. Erilaiset arkistot ja kirjastot ovat eri puolilla maailmaa aloittaneet laajojen paperien, lehtien, kirjojen ja mikrofilmien digitointihankkeita. Suomessa digimuotoon ollaan saattamassa esimerkiksi kaikki vuosina 1771-1860 julkaistut sanomalehdet. Kansallisarkistossa on käynnissä digitaalimuodossa olevien tietoaineistojen käsittelyyn ja pitkäaikaissäilytykseen keskittyvä hankeprojekti SÄHKE.

Suomessa vapaakappalelain uudistus on ollut myös merkittävä, koska jatkossa säilytettäviin lähteisiin luetaan myös digitaaliset dokumentit. Maailmalla on kiinnitetty myös huomiota miljardien verkkosivujen arkistointiin, joihin tarkoitetuista tietokannoista tärkein on toistaiseksi Internet Archive. Suomessa omien kansallisten verkkosivujen arkistointi on myös aloitettu. (kts. näistä lisää: Tapio Onnela:Internet-arkisto avattu - aikamatka Internetin 1990-luvulle Agricolan Tietosanomat 2/2001
ja Tapio Onnela: Internetarkistot tulevat ja tallentavat kaiken Agricolan Tietosanomat2/2000

Vanhan tiedon saatavuus esimerkiksi verkosta on selvästi helpottanut tutkimustyötä, mutta nostanut myös esiin kysymyksiä niistä järkevistä ja tehokkaista digitaalisen tiedon jäsentämisen ja keruun menetelmistä. Pelkkä keräily ja arkistointi ei kuitenkaan yksistään riitä, vaan samaan aikaan on mietittävä myös tiedon siirrettävyyden ongelmaa. Nykyinen yhä lisääntyvä digitaalisen tiedon vyöry aiheuttaa tiettyjä selviä rajoituksia. Minkä digitaalisen tiedon pelastaminen on tarpeellista? Mihin tätä kaikkea tiedon määrää voidaan tulevaisuudessa käyttää? Mitkä tahot huolehtivat tiedon kierrätettävyydestä ja kuinka paljon voimavaroja siihen ollaan valmiita panostamaan?

Digitaalisen tiedon arkistoinnista ja siirrettävyydestä on tullut paitsi tutkimukseen ja arkistointiin myös jokapäiväiseen työntekoon liittyvä haaste. Tavallisen mikrotietokoneen käyttäjän kannalta työn jatkuva varmuuskopiointi ja tasaisin väliajoin tapahtuma tietojen siirrettävyys on välttämättömyys. Tietokoneet ovat myös laitteina tavattoman herkkiä rikkoontumaan ja siksi tiedostojen säilyttämistä pääasiassa kiintolevyllä ei voi missään nimessä suositella. Mutta ovatko word tai wp-tiedostoni ovat yhä luettavissa kymmenen vuoden päästä? Entä miten käy kuvien, tietokantojen ja taulukoiden kanssa? Erityisesti ongelmalliseksi on muodostunut sähköpostiviestien säilyvyys. Työtiedostoista voi löytyä varmuuskopiot, mutta sähköpostiviestien kohdalla tilanne voi olla toinen. Lisäksi harvinaisen mutta vanhentuneen ohjelman käyttäjä voi kohdata merkittäviä hankaluuksia siirtäessään viestejään uuteen sähköpostiohjelmaan.

Tiedon tallennukseen ja ylläpitoon tulee suhtautua vakavasti, vaikka turhaan kyynisyyteen ei tarvitse turvautua. Digitiedon menneisyys ja tulevaisuus näyttää joka tapauksessa lähes loppumattomalta työmaalta. Tulevaisuudessa suuret arkistot ja kirjastot tulevat mitä todennäköisemmin tarvitsemaan yhä enemmän digitiedon tallennukseen ja siirrettävyyteen erikoistuneita työntekijöitä. Vanhan ja jo katoamassa olevan digitaalisen tiedon esiin kaivaminen puolestaan vaatii "digitaalisen tiedon arkeologeiksi" kutsuttavia asiantuntijoita.

Petri Saarikoski

Otsikkokuva: Seattle-Tacoma maanjäristyksen vaikutuksia Boeing yhtiön tietokonenauhavarastossa vuonna 1965.

Linkkejä

  • Using CD-R and DVD-R for Digital Preservation
    Käytännön tietoa erityisesti CD-R ja DVD-levyjen käytöstä digitaalisen tiedon pitkäaikaistallennuksessa

    Agricolan Tietosanomien pääsivulle

    Tämän numeron pääsivulle
    Lehden arkisto
    Lehden toimituskunta
    Kaikkien numeroiden sisällysluettelot yhtenä tiedostona


  • Agricolaverkon vintti