Arkistoitavan digitaalisen tiedon säilyttäminen

Digitaalisen tiedon säilyttämisen, arkistoinnin ja pitkäaikaissäilytyksen tavoitteet ja keinot tukevat toisiaan. Arkikielessä säilyttämisellä tarkoitetaan usein asiakirjojen ja tietoaineistojen säilyvyyden varmistamista riippumatta siitä, onko kyse arkistoinnista vai tiedon säilyttämisestä alkuperäiseen tai siihen rinnastettavaan käyttötarkoitukseen. 

Digitaalisen tiedon säilyttäminen, arkistointi ja pitkäaikaissäilytys

Ennen kuin arkistoitava tieto siirtyy elinkaaressaan arkistovaiheeseen, sitä voidaan käyttää ja säilyttää alkuperäisessä tai siihen rinnastettavassa käyttötarkoituksessa hyvin pitkään. Vaihtoehtoisesti aika voi olla melko lyhyt. Myös koko tietojärjestelmän elinkaari voi päättyä ennen sen sisältämän aineiston arkistovaihetta.

Arkistovaiheessa olevaa tietoa voidaan säilyttää syntyjärjestelmässään tai esimerkiksi erillisessä säilytysjärjestelmässä. Toimijan on kuitenkin aina turvattava arkistoitavaksi määrättyjen asiakirjallisten tietojen todistusvoimaisuus, säilyminen ja käytettävyys siihen saakka, että aineisto siirretään arkisto-organisaatioon, joka huolehtii tiedon pitkäaikaissäilyttämisestä ja tarjoamisesta tutkimuskäyttöön.

Arkistoitua tietoa pitää pystyä hyödyntämään, vaikka käyttäjä ei tuntisi aineistoa, sen historiaa ja alkuperäisiä käyttötapoja. Siksi arkistoinnissa käytetään muiden digitaalisen tiedonhallinnan keinojen rinnalla erityisesti tiedon luokittelua, kuvailua ja dokumentointia. Samat näkökohdat on huomioitava myös silloin, kun tiedon säilytysaika sen alkuperäisessä käyttötarkoituksessa tai esimerkiksi todisteena oikeuksista ja velvollisuuksista on hyvin pitkä.

Tiedonhallintalautakunnan Suosituskokoelma tiettyjen tietoturvallisuussäännösten soveltamisesta (pdf) käsittelee myös tiedon säilyttämistä ja siihen liittyvien riskien hallintaa. 

Arkistovaiheessa oleva tieto on eheää ja todistusvoimaista

  • Tieto dokumentoi kattavasti ja virheettömästi niitä toimenpiteitä, tehtäviä tai tosiasioita, joista sitä säilytetään todisteena. Dokumentointi ei ole puutteellista, ristiriitaista tai valikoivaa.
  • Tiedosta käy ilmi, mikä taho tai tietojärjestelmä ja milloin on tiedon luonut, muuttanut sitä tai rekisteröinyt sen.
  • Tieto on suojattu luvattomilta lisäyksiltä, poistoilta ja muutoksilta. Tahattomat muutokset voidaan havaita, yksilöidä ja jäljittää.
  • Tieto on luokittelun, metatiedon ja dokumentoinnin avulla asetettu tarvittaviin asiayhteyksiin (konteksti) niin, että se pystytään paikallistamaan ja hakemaan.
  • Tieto on ajantasaisten käyttöoikeuksien mukaisesti käytettävissä.
  • Tieto on luokittelun, metatiedon ja dokumentoinnin avulla asetettu tarvittaviin asiayhteyksiin (konteksti) niin, että sitä pystytään hyödyntämään ja tulkitsemaan.
  • Tieto on hyväksytyissä ja tuetuissa tietorakenteissa ja formaateissa.

Arkistoitavien aineistojen tiedostomuodot (formaatit)

Sähköinen pitkäaikaissäilyttäminen perustuu hallittuihin migraatioihin (muunnoksiin), joissa aineistot aina tarvittaessa muunnetaan häviöttömästi uuteen, säilytyskelpoiseen muotoon.

Migraatio, jossa tiedoston kaikki keskeiset ominaisuudet säilyvät luotettavasti, perustuu tiedostomuotostandardien tarkkaan noudattamiseen ja automaattiseen laadunvarmistukseen. Siksi aineisto pitää siirtää arkistoon pitkäaikaisesti säilytettäväksi sellaisessa tiedostomuodossa, jolle tarvittavat muunnokset pystytään tekemään.

Tietoja pitkäaikaissäilytykseen hyväksytyistä tiedostomuodoista päivitetään teknisen kehityksen ja digitaalisen aineiston vastaanotosta ja säilyttämisestä saatujen kokemusten perusteella. Kehitystä on hyvä seurata ja pyrkiä suunnittelemaan omaa digitaalisen tiedon säilyttämistä ja hallintaa myös sen näkökulmasta.

Tiedostojen pitää lisäksi aina olla hyödynnettävissä itsenäisesti; niiden hyödyntäminen tai tulkinta ei toisin sanoen saa olla riippuvaista sellaisista ulkoisista tietovarannoista, sovelluksista tai palveluista, joita ei säilytetä tiedoston yhteydessä.

Kaikki tietoaineiston elinkaaren aikana tehtävät muunnokset voivat vaarantaa tiedon säilymisen teknisesti tai sisällöllisesti eheänä. Ylimääräisiä tiedostomuunnoksia on hyvä välttää, eikä tiedostoja ole arkistoinnin vuoksi tarpeen muuntaa rutiininomaisesti toiseen tiedostomuotoon. Kun harkittuja tiedostomuunnoksia tehdään, niiden laatua tulee valvoa tarkasti.

Mahdollisen arkistoversion (esimerkiksi PDF/A-versio) rinnalla on suositeltavaa säilyttää alkuperäinen tiedostomuoto. Se voi käytettävyyden lisäksi olla tietosisällön, pitkäaikaissäilyttämisen ja arkistoinnin näkökulmasta arkistovaiheessa paras vaihtoehto. Lue lisää pdf-tallennusmuodosta.

Kansallisarkiston Sähköisen arkistoinnin palvelun verkkosivuilla on Kansallisarkistoon vastaanotettavien formaattien päivittyvä luettelo (pdf). Listausta voi hyödyntää, vaikka organisaation aineistoja ei oltaisikaan juuri nyt siirtämässä Kansallisarkistoon. Tällä hetkellä esimerkiksi monet tavallisimmat toimisto-ohjelmistoilla tuotetut formaatit ovat Kansallisarkistoon vastaanotettavien tiedostomuotojen joukossa.