Kansallisarkisto etsii talkoolaisia sotapäiväkirjojen puhtaaksikirjoittajiksi – tavoitteena opettaa tekoälyä ymmärtämään 26 589 sotapäiväkirjan merkintöjä
Haluatko tutustua talvi-, jatko- ja Lapin sotien alkuperäislähteisiin ja samalla edistää digitaalista historiantutkimusta? Entäpä kiinnostaisiko tutustua joukkoistamiseen ja edistää sen hyödyntämistä Kansallisarkistolla? Vai kaipaatko kesäksi vain mukavaa historia-aiheista tekemistä?
Haluatko tutustua talvi-, jatko- ja Lapin sotien alkuperäislähteisiin ja samalla edistää digitaalista historiantutkimusta? Entäpä kiinnostaisiko tutustua joukkoistamiseen ja edistää sen hyödyntämistä Kansallisarkistolla? Vai kaipaatko kesäksi vain mukavaa historia-aiheista tekemistä?
Kansallisarkisto etsii vapaaehtoisia sotapäiväkirjatalkoot-projektiin, jonka tarkoituksena on kehittää tekstintunnistusmalli viime sotien sotapäiväkirjojen koneluennan mahdollistamiseksi.
Joukkoistamiseen osallistuvien vapaaehtoisten tehtävänä on tuottaa opetusmateriaalia, jonka avulla tekoälyä “opetetaan” lukemaan sotapäiväkirjoissa käytettyjä käsialoja. Käytännössä tämä siis tarkoittaa alkuperäisten, käsin kirjoitettujen sotapäiväkirjojen puhtaaksikirjoittamista tekoälylle ymmärrettäväksi tekstiksi.
Ihmisen tulkitseman opetusmateriaalin avulla tekoäly kehittyy lopulta ymmärtämään sota-aikaista käsialaa sujuvasti. Lopullinen, saavutettava tarkkuus on suoraan riippuvainen käytettävän opetusaineiston määrästä – mitä enemmän, sen parempi. Useista kirjoittajista ja siten laajalti vaihtelevista käsialoista johtuen sotapäiväkirjojen tekstintunnistusmalli vaatii todennäköisesti melko suuren määrän opetusaineistoa.
Digitoituna yhteensä 26 589 sotapäiväkirjaa
Sotapäiväkirjat ovat rintamalla tehtyjä muistiinpanoja, jotka sisältävät päivittäin laaditun kertomuksen sen laatineen yksikön toiminnasta. Perusmerkintöjen lisäksi päiväkirjat saattavat sisältää esimerkiksi taistelukertomuksia, saatuja ja annettuja käskyjä sekä jopa piirroksia: tarkempi sisältö vaihtelee suuresti kirjoittajasta ja joukon toimintaympäristöstä riippuen.
Mikäli aikaa oli runsaammin käytössä, esimerkiksi asemasotavaiheen aikana, sotapäiväkirjoihin kirjoitettiin perusteellisemmin. Mikäli taistelutilanne oli kriittinen, esimerkiksi kesän 1944 vetäytymistaisteluiden aikana, merkinnät jäivät luonnollisestikin niukemmiksi.
Kansallisarkistolla on digitoituna yhteensä 26 589 sotapäiväkirjaa, jotka käsittävät kaiken kaikkiaan noin 1,2 miljoonaa kuvaa. Koneluennan avulla sotapäiväkirjat olisi aikanaan mahdollista muuttaa digitaaliseksi tekstiksi, joka puolestaan mahdollistaisi verkossa olevan hakupalvelun suoraan sotapäiväkirjojen sisältöön.
Tutkijoiden ja muiden talvi-, jatko- ja Lapin sodista kiinnostuneiden olisi siis mahdollista etsiä esimerkiksi sotapäiväkirjoissa esiintyviä henkilöitä, tiettyjä tapahtumia tai vaikkapa rangaistustietoja. Tämä helpottaisi tiedonetsintää tästä laajasta ja kiinnostavasta aineistosta sekä mahdollistaisi uudenlaista historiantutkimusta viime sotiimme liittyen.
Talkoisiin voi osallistua kuka tahansa
Kuka tahansa aiheesta ja aineistosta kiinnostunut voi osallistua talkoisiin, teknistä erityisosaamista tai aiempaa kokemusta sotapäiväkirjoista ei vaadita! Aineistossa esiintyvät käsialat ovat pääosin helppoja ja sotapäiväkirjojen tapahtumat ovat takuulla kiinnostavia.
Sotapäiväkirjatalkoiden ensimmäisessä vaiheessa rekrytoidaan vain rajallinen määrä vapaaehtoisia, sillä testaamme samalla joukkoistamisprosessin toimivuutta.
Ilmoittaudu siis nopeasti, mikäli haluat varmistaa paikkasi ensimmäisten vapaaehtoisten joukossa!
Vapaaehtoisille järjestetään infotilaisuus Kansallisarkiston Rauhankadun toimipisteen luentosalissa torstaina 5.5.2022 klo. 11.00. Infotilaisuuteen voi osallistua myös etänä verkon kautta. Itse joukkoistaminen kestää 31.7.2022 asti.
Lisätietoja
Tutkija Ilkka Jokipii, ilkka.jokipii(at)kansallisarkisto.fi
Tutkija Jan-Erik Engren, jan-erik.engren(at)kansallisarkisto.fi
Tutustu myös
-
9.5.2025 15:59
Digitaalisen toimittamisen vakiinnuttaminen Hämeenlinnassa suunnitteilla
Suunnittelu palvelun laajentamiseksi Turkuun ja Vaasaan on käynnistymässä.
-
30.4.2025 13:39
Kansallisarkiston kestävyysraportti 2024 julkaistu
Kansallisarkiston vuoden 2024 kestävyysraportti on julkaistu. Raportissa käydään läpi Kansallisarkiston tavoitteita ja niiden toteutumista.
-
28.4.2025 18:15
Kansallisarkiston Astia-palvelu uudistui! Aineistojen hakeminen ja käyttäminen entistä helpompaa
Katso käyttäjäopastuksen tallenne.