Juuri ilmestyneessä selvityksessä Sisällönkuvailun automatisoinnin haasteita ja ratkaisuja kulttuuriperintöorganisaatiossa esitellään tekstiaineistojen automaattisen sisällönkuvailun ohjelmiston tuotantokäytön haasteita ja ratkaisuja erityisesti KAM-sektorin (kirjastot, arkistot ja museot) organisaatioiden näkökulmasta. Esimerkkinä käytetään Kansalliskirjastossa kehitettävää automaattisen sisällönkuvailun työkalua Annifia, teknisinä käyttöympäristöinä puolestaan toimivat Kansalliskirjaston ja Tieteen tietotekniikan keskus CSC:n ympäristöt. Selvitys on tuotettu osana CSC:n, Kansalliskirjaston ja Kansallisarkiston yhteistä High-Performance Digitisation -hanketta.
Automaattisen sisällönkuvailun ratkaisuilla pyritään sujuvoittamaan esimerkiksi kirjastoissa tehtävää julkaisujen (kirjat, artikkelit ym.) kuvailutyötä ja toisaalta saattamaan kuvailun piiriin sellaisia aineistoja, jotka muuten jäisivät kuvailematta. Tarvetta automatisoinnille luo aineiston määrä, joka kasvaa mm. digitalisaation ja elektronisen aineiston karttumisen myötä. Suuren aineistomäärän käsittely ihmisvoimin on haasteellista, ja kuvailematon aineisto on käytännössä tiedonhakijan saavuttamattomissa. Automatisointi palvelee siis myös aineiston loppukäyttäjiä. Kuvailun automatisoinnin tarkoitus ei välttämättä ole poistaa ihmistyötä kuvailusta kokonaan, vaan helpottaa työtä ja vapauttaa henkilöstöresursseja tehtäviin, joissa asiantuntemus on kaikkein kriittisintä.
Lue selvitys täältä: Sisällönkuvailun automatisoinnin haasteita ja ratkaisuja kulttuuriperintöorganisaatiossa
Hankkeen ensimmäinen julkaisu: Automaattisen kuvailun palvelun integroiminen Kansalliskirjaston järjestelmäkokonaisuuteen – tietovirrat ja prosessit. Tekstissä käsitellään automaattisen kuvailun työkalun Annifin hyödyntämistä Kansalliskirjastossa ja kuvataan Kansalliskirjaston järjestelmiä Annif-integraation näkökulmasta.
HPD-hankkeen loppuwebinaari järjestettiin 19.1.2021. Ohjelmasivulta löytyvät myös webinaarin esitykset.
Tags: Annif, automaattinen sisällönkuvailu, High Performance Digitisation, kirjastot, metadata, sisällönkuvailu