Automaattisen sisällönkuvailun palvelu Finto AI julkaistu

Finto on jo yli kuuden vuoden ajan tukenut sisällönkuvailutyötä tarjoamalla pääsyn keskeisiin sanastoihin ja ontologioihin. Nyt Finto laajenee automaattisen sisällönkuvailun palveluihin Finto AI -työkalun ja sen rajapintapalvelun myötä. Nimen kirjainyhdistelmä AI viittaa sekä käyttötarkoitukseen, eli automaattiseen indeksointiin, että sen toteuttamisessa käytettyyn tekoälyteknologiaan. Palvelu tukee suomen-, ruotsin- ja englanninkielisen tekstin automaattista sisällönkuvailua.

Finto AI on saatavilla osoitteessa ai.finto.fi, josta löytyvän lomakkeen avulla palvelua voi kokeilla ja käyttää. Automaattinen sisällönkuvailu toimii parhaiten opinnäytetyö- ja tietokirja-aineistoissa. Lomakkeelle syötetään tekstiä, jolle palvelu ehdottaa asiasanoja. Sama toiminnallisuus on tarjolla myös rajapinnan (REST) muodossa, joten sen voi myös tarvittaessa integroida omaan järjestelmään, jolloin vältytään dokumenttien ja asiasanojen kopioinnilta järjestelmästä toiseen.

Annif jo kuvailun apuna opinnäytetöissä ja asiasanoituksessa

Annif on jo käytössä Jyväskylän yliopiston JYX-julkaisuarkistossa, jossa sitä käytetään opinnäytetöiden kuvailun apuna. Opinnäytetyönsä järjestelmään jättävä opiskelija saa nähtäväkseen Annifin ehdottamat asiasanat, joita hän voi halutessaan muokata. Lopulliset asiasanat hyväksyy kirjastovirkailija tarkistuksen jälkeen. Vastaavanlaista käyttöä pilotoidaan tällä hetkellä mm. Vaasan yliopiston Osuva-julkaisuarkistossa.

Myös Kirjavälitys Oy käyttää rajapintapalvelua vielä julkaisemattomien kirjojen asiasanoitukseen kustantajan esittelytekstin pohjalta. “Annif on tuttavuutemme aikana kehittynyt selvästi, ja sen seuraaminen on ollut todella mielenkiintoista. Erityisesti tietokirjojen esittelyteksteihin perustuvaan asiasanoitukseen se pystyy usein tarjoamaan YSO-termejä tarkasti, melko usein myös kattavasti”, kertoo Anna Tuominen Kirjavälityksen tuotetietopalveluista. Yleinen suomalainen ontologia YSO on kolmikielinen (suomi, ruotsi, englanti) ontologia, eli käsitehierarkiaa, joka kuvaa jonkin aihealueen käsitteet ja niiden väliset suhteet koneymmärrettävässä muodossa. Se koostuu pääasiassa yleiskäsitteistä mutta sisältää runsaasti myös eri alojen erikoiskäsitteistöä, on rakennettu suomalaisen kulttuuripiirin sisällönkuvailutarpeiden ja käsitteistön pohjalta, ja on tarkoitettu käytettäväksi kuvailuun erityisesti silloin, kun kuvailtavien aineistojen aihealueet ovat monipuolisia.

Automaattista sisällönkuvailua erilaisilla sanasto- ja kieliyhdistelmillä ja monentyyppisillä aineistoilla on jo pitkään kokeiltu Annifin kehityksen osana. Tällä hetkellä käytössä oleva toiminnallisuus perustuu useiden algoritmien yhdistelmään, jolla on saatu hyviä tuloksia. Koneoppimisalgoritmeja on opetettu pääosin Finnasta kerätyillä viitetiedoilla, mutta myös kokotekstidokumentteja on käytetty näiden algoritmien ehdotusten hienosäätöön.

Algoritmien ja opetusaineistojen kehitys jatkuu yhä ja sitä mukaa kun toimivia ratkaisuja löytyy, niitä viedään osaksi Finto AI -palvelua.

Katso esittelyvideo: https://youtu.be/ZKN22mXKMm8

Lisää aiheesta

Lehtinen Mona, Inkinen Juho & Suominen Osma (2019). Aaveita koneessa: Automaattisen sisällönkuvailun arviointia Kirjastoverkkopäivillä 2019. Tietolinja, 2019(2). Pysyvä osoite: http://urn.fi/URN:NBN:fi-fe2019120445612
Finto-palvelu http://finto.fi/fi/

Lisätietoja

Mona Lehtinen, tietoasiantuntija, Automaattinen kuvailu
Juho Inkinen, tietojärjestelmäasiantuntija, Automaattinen kuvailu
Osma Suominen, tietojärjestelmäasiantuntija, Automaattinen kuvailu

[email protected]

 

Tags: , , , , , , , ,