Sisältöhaku yli 7 miljoonaan tiedostoon! Tule testaamaan ensimmäisten joukossa
Uusi työkalu mullistaa tuomiokirjojen kahlaamisen: nyt voit tehdä tekstihakuja yli 7 miljoonaan tiedostoon renovoituihin tuomiokirjoihin.
Uusi työkalu mullistaa tuomiokirjojen kahlaamisen: nyt voit tehdä tekstihakuja yli 7 miljoonaan tiedostoon renovoituihin tuomiokirjoihin.
Mistä on kyse?
Sisältöhaku on palvelu tekstihakujen tekemiseen Kansallisarkiston aineistoihin. Tekoäly on lukenut aineistojen vanhan käsialan ja muuttanut sen haettavaksi tekstiksi. Palvelussa on tällä hetkellä haettavana yli 7 miljoonaa tiedostoa renovoituja, eli puhtaaksikirjoitettuja, tuomiokirjoja 1600–1900-luvuilta.
Sisältöhaku päivittyy säännöllisesti uudella materiaalilla. Kansallisarkistossa luetaan tekoälyn avulla jatkuvasti uutta käsin kirjoitettua arkistoaineistoa ja sitä lisätään Sisältöhakuun sitä mukaa, kun tekstitunnistukset valmistuvat. Sisältöhakuun lisätään pian esimerkiksi lääninhallitusten ja maistraattien aineistoja.
Sisältöhaussa on täysin uusia sisältötunnistettuja aineistoja. Tuomiokirjahaun 3 miljoonaa tiedostoa tekstitunnistettuja tuomiokirjoja lisätään mukaan mahdollisimman pian.
Kokeilutyökalu on osa Astian haun kehitystä
Sisältöhaku on väliaikainen ratkaisu tilanteeseen, jossa Kansallisarkiston aineistohaku Astian hakutoiminnallisuudet eivät vielä tue tekstitunnistettuun sisältöön tehtyjä hakuja useammasta arkistoyksiköstä. Haluamme kuitenkin tarjota Kansallisarkiston asiakkaille jo nyt mahdollisuuden hyödyntää tekstintunnistusteknologian tuomia mahdollisuuksia. Pääset nyt etulinjassa kokeilemaan, mitä Astian hakuominaisuudet voivat olla tulevaisuudessa!
Näin käytät hakutyökalua:
- Mene kokeilun omalla verkkosivulle: https://sisaltohaku.demo.kansallisarkisto.fi/
- Kirjoita sinua kiinnostava aihe tekstikenttään, esimerkiksi ”bastu” tai ”kissa”. Voit rajata hakua vasemman reunan suodattimilla.
- Tutki osumia joko sivustossa tai Astia-linkin kautta alkuperäisenä tiedostona. Voit myös ladata dokumentteja omalle koneellesi.
Koska palvelu on vielä kokeiluvaiheessa, se on toiminnallisuuksiltaan rajattu. Sisältöhaussa voi tehdä tekstihakuja arkistoaineistoihin esimerkiksi nimillä tai muilla asiasanoilla. Hakutuloksia voi rajata aineistokokonaisuuksittain ja ajan perusteella ja tulokset voi ladata palvelusta tekstimuodossa. Sisältöhaku tarjoaa käyttäjälle myös linkin aineiston tarkastelemiseen Astia-palvelussa.
Kansallisarkisto kehittää tutkimusta edistäviä työkaluja
Kansallisarkisto tarjoaa tällä hetkellä kolme eri työkalua tekoälyn avulla tekstitunnistettujen arkistoaineistojen tutkimiseen: Tuomiokirjahaku, Sisältöhaku sekä tekstintunnistustyökalu.
Linkkejä työkaluihin
Tuomiokirjahaku ja Sisältöhaku ovat käyttöliittymiä tekstitunnistetun aineiston hakemiseen ja selaamiseen. Niiden sisältämät aineistot ja toiminnallisuudet liitetään Astia-palveluun tulevaisuudessa. Tekstintunnistustyökalu taas on prototyyppi, jonka avulla voi tehdä tekstintunnistuksen mihin tahansa kuvaan käyttäen Kansallisarkiston käsialamallia.
Lisätietoja
Ilkka Jokipii
Yksikönpäällikkö, Tutkimus ja innovaatiot
[email protected]
Tutustu myös
-
12.5.2026 13:47
Ilmoittaudu viranomaisinfoon 28.5.2026
Ohjelmassa tietoa mm. uuden arkistointilain toimeenpanosta.
-
11.5.2026 9:55
Digitaalisen toimittamisen kuulumisia Hämeenlinnasta, Turusta ja Vaasasta
Digitaalinen toimittaminen pyörii jo rutiinilla Hämeenlinnassa ja on lähtenyt hyvin käyntiin sekä Turussa että Vaasassa. Digitaalisen toimittamisen tilastoinneista saamme pientä näkökulmaa siihen, miten palvelu on otettu vastaan asiakkaidemme keskuudessa, mitkä aineistot kiinnostavat ja missä päin Suomea.
-
7.5.2026 15:16
Ilmoittaudu Digitaalisen tiedon kesäkouluun!
Tiedon huoltovarmuudella turvatumpi tulevaisuus -hanke osallistuu perjantaina 28.8.2026 Helsingissä tutkimuskeskus Digitalian järjestämään Digitaalisen tiedon kesäkoulu 2026 -tapahtumaan otsikolla ”Digitaalinen tieto vaarassa”.