haku Agricola - Suomen historiaverkko kartta
uutta hakemisto


Internet-arkisto avattu ­ aikamatka Internetin 1990-luvulle
AGRICOLA


Brewster Kahlon vuonna 1996 perustama Internet Archive on lunastanut lupauksensa saattaa varhaisen Internetin ajan sivustot 1990-luvulta lähtien yleisön nähtäville.

Agricolan Tietosanomien numerossa 2/2000 esitelty idea Internet -arkistosta on nyt toteutunut ja arkisto on avattu yleisölle. Tämän Wayback Machine -nimisen palvelun, kautta voi tarkastella Internet-sivustoja aina vuodesta 1996 lähtien. Brewster Kahlon Amazon.comille myyty Alexa-niminen Internet-yritys ei onnistunut liikeyrityksenä tekemään rahaa (ainakaan vielä) menneisyyden Internet-sivuilla, mutta julkisena palveluna idea toimii paljon paremmin.

Ajatuksena on ollut koota kaikki julkisessa Internetissä oleva aineisto ja tarjota eräänlaisia "aikamatkoja" menneisyyden verkkoon. Kyseessä on siis eräänlainen Internetin Aleksandrian kirjasto, jonne on tallennettu kaikki vapaasti saatavillla oleva tieto.

Arkiston tietokoneiden haravointiohjelmat ovat ahkeroineet ja tallentaneet "kaikki" saatavilla olevat verkkosivustot noin vuodesta 1996 lähtien. Kokoelmaan eivät kuitenkaan kuulu esimerkiksi sellaiset sivustot joille pääsy on salasanan takana.

Toistaiseksi arkistoon on kertynyt huikea, yli 10 miljardin sivun kokoelma, jo kauan sitten unohdetuiksi luulluista verkkosivuista. Materiaali on kiinnostava ja ainutlaatuinen lähdeaineisto 1900-luvun lopun historiaa tutkivalle historioitsijalle, joka sen avulla pystyy jäljittämään Internet-huuman ja digitaalisen kulttuurin nousun alkuvaiheet.

Arkisto on kasvaa jatkuvasti noin 12 teratavua kuukaudessa. Fyysisesti arkisto sijaitsee vanhassa Yhdysvaltain armeijan rakennuksessa. Satojen tietokoneiden verkko toimii FreeBSD ja Linux-käyttöjärjestelmillä.

Internet Archiven mukaan kyseessä on maailman suurin tunnettu tietovarasto. Arkistoon on varastoitu dataa nyt noin 100 terabittiä, kasvuvauhdin ollessa 12 terabittiä kuukaudessa. Vertailun vuoksi: on arvioitu, että koko Yhdysvaltain kongressin kirjaston tallettama materiaali olisi bitteinä noin 20 terabittiä. Yksi terabitti on 1000 gigabittiä ja yhteen gigabittiin mahtuu noin 1000 kirjaa eli yhteen terabittiin mahtuu noin miljoona kirjaa.

Muuallakin maailmassa on tehty vastaavanlaisia haravointeja, myös esimerkiksi Ruotsissa ja Suomessa nämä aineistot vain eivät ole, ainakaan vielä, yleisön saatavilla.

Mutta löytyykö arkistosta sitä mitä luvataan? Yllättävän hyvin. Löysin esimerkiksi Agricolan varhaiset sivut vuodelta 1997 ja jopa Agricolan edeltäjän SHEK:in eli Suomalaisen historiantutkimuksen elektronisen keskuksen viimeiset sivut.

Myös legendarinen Trojan Room Coffee Machine löytyy vielä verkosta. Kyseessä on Cambridgen yliopiston tietokonekeskuksen kahvipannu, joka oli Internetin ensimmäinen ns. WebCam eli verkkokamera, josta tietokonekeskuksen koodinvääntäjät pystyivät näkemään, oliko alakerran kahvihuoneessa tarjolla kahvia vai ei.

Kahlo ei ole rajoittunut pelkän datan lapioimiseen kovalevyille. Internet-arkistossa on erikoiskokoelmia Yhdysvaltain presidentivaaleista, sekä syyskuun 11. päivän tapahtumien aiheuttamasta mediamyrskystä Internetissä. Arkiston huima saavutus on myös saattaa yleisön nähtäville yli 1000 elokuvaa.

Internet-arkisto on ehdottomasti pistäytymisen arvoinen, vaikka palvelu on ajoittain, varsinkin iltaisin, hieman tukkoinen, eikä sivuja silloin oikein tahdo löytyä. Paras hetki harrastaa aikasurffailua 1990-luvulle on varhainen aamu. Kannattaa tutustua tähän palveluun ennen kuin mahdolliset kiistat tekijänoikeuksista sulkevat sen.


Tapio Onnela

Agricolan Tietosanomien pääsivulle
Agricolan Tietosanomien Numero 2/2001 pääsivulle
Lehden arkisto
Lehden toimituskunta
Kaikkien numeroidensisällysluettelot yhtenä tiedostona


Agricolaverkon vintti