{"id":8503,"date":"2020-09-29T13:50:54","date_gmt":"2020-09-29T10:50:54","guid":{"rendered":"https:\/\/www.digime.fi\/?p=8503"},"modified":"2020-09-29T14:12:22","modified_gmt":"2020-09-29T11:12:22","slug":"high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun","status":"publish","type":"post","link":"https:\/\/www.digime.fi\/sv\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/","title":{"rendered":"High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun"},"content":{"rendered":"<p>Digitaalisten aineistojen m\u00e4\u00e4r\u00e4 kasvaa jatkuvasti: toisaalta paperiarkistojen laajamittainen digitointi ja toisaalta syntyj\u00e4\u00e4n digitaalisen materiaalin aktiivisempi arkistointi synnytt\u00e4v\u00e4t alati kasvavia aineistokokoelmia. Koneluettava aineisto avaa uudenlaisia mahdollisuuksia yhdistelyyn, rikastamiseen ja muuhun jatkojalostukseen. Massadatan hy\u00f6dyt lunastava rikastus vaatii kuitenkin kehittynytt\u00e4 automatisointia, koska ihmisen tekem\u00e4n\u00e4 ty\u00f6n\u00e4 aineiston k\u00e4sittely j\u00e4\u00e4 auttamattomasti j\u00e4lkeen digitaalisen aineiston tuotannosta. Teko\u00e4lyn menetelm\u00e4t ovat keskeisess\u00e4 roolissa aineiston kuvailun ja muun k\u00e4sittelyn ty\u00f6voiden automatisoinnissa.<\/p>\n<p>CSC:n, Kansalliskirjaston ja Kansallisarkiston <strong>High Performance Digitisation<\/strong> -hanke tarttuu yhteisvoimin teko\u00e4lyn ja aineiston k\u00e4sittelyn haasteeseen. Hankkeen tarkoitus on luoda muistiorganisaatioiden k\u00e4ytt\u00f6\u00f6n palvelu, joka helpottaa aineiston k\u00e4sittely\u00e4: digitaalisen aineiston hy\u00f6dynnett\u00e4vyytt\u00e4 heikent\u00e4\u00e4 metatietojen puute tai vajavaisuus ja heikot hakutoiminnot. Hankkeen tavoite on luoda \u00e4lyk\u00e4s annotaatioputki arkistoitujen aineistojen \uff0d\u00a0 esimerkiksi sanomalehtien, kirjojen ja asiakirjojen \uff0d puoliautomaattiseen annotointiin (l. metatietojen lis\u00e4\u00e4miseen) ja rikastukseen.<\/p>\n<p>Teko\u00e4ly\u00e4 hy\u00f6dynt\u00e4v\u00e4 annotaatioputki toteutetaan <a href=\"https:\/\/research.csc.fi\/computing\" target=\"_blank\" rel=\"noopener noreferrer\">CSC:n supertietokoneymp\u00e4rist\u00f6ss\u00e4<\/a>, josta sit\u00e4 voidaan tarjota palveluna muistiorganisaatioille tai monistaa muistiorganisaatioiden ymp\u00e4rist\u00f6\u00f6n. Automaattisen asiasanoituksen ja luokittelun ty\u00f6kaluna putkessa toimii Kansalliskirjastossa kehitetty Annif-ohjelmisto. Annifista voi lukea lis\u00e4\u00e4 sivulta annif.org.<\/p>\n<h1>Yhteisty\u00f6ll\u00e4 parempiin tuloksiin<\/h1>\n<p>Hankkeessa Kansalliskirjasto on toimittanut ja hankkinut aineistoa CSC:lle testik\u00e4ytt\u00f6\u00f6n. CSC puolestaan on tehnyt suurteholaskentaa vaativia testej\u00e4 n\u00e4ill\u00e4 aineistoilla ja suositellut toimivia ratkaisuja sek\u00e4 uusia algoritmeja k\u00e4ytett\u00e4v\u00e4ksi Annifissa. N\u00e4in on p\u00e4\u00e4sty kartoittamaan ja parantamaan Annifin suorituskyky\u00e4: asiasanaehdotusten laatu on parantunut merkitt\u00e4v\u00e4sti mm. hankkeen my\u00f6t\u00e4 k\u00e4ytt\u00f6\u00f6n otettujen <a href=\"https:\/\/github.com\/tomtung\/omikuji\" target=\"_blank\" rel=\"noopener noreferrer\">Omikuji-algoritmien<\/a> ansiosta.<\/p>\n<p>Hankkeessa on tekeill\u00e4 my\u00f6s k\u00e4yt\u00e4nn\u00f6nl\u00e4heinen selvitys (konseptitodistus, Proof of Concept) Annifin integroimisesta Kansalliskirjaston olemassa oleviin kuvailuprosesseihin. T\u00e4m\u00e4 on linjassa my\u00f6s Kansalliskirjaston metatietovision kanssa, jonka mukaan kuvailussa tulisi suosia puoliautomaattisia j\u00e4rjestelmi\u00e4 \u2013\u00a0 joilla ei siis korvata ihmist\u00e4, vaan tarkoitus on sujuvoittaa kuvailuty\u00f6t\u00e4. Metatietovision mukaan n\u00e4iden j\u00e4rjestelmien tulisi my\u00f6s k\u00e4ytett\u00e4ess\u00e4 oppia ihmisen valitsemista k\u00e4sitteist\u00e4.<\/p>\n<p>Selvityksess\u00e4 kartoitetaan nykyiset prosessit ja tehd\u00e4\u00e4n ehdotuksia Annifin roolista osana niit\u00e4. Lis\u00e4ksi selvitys kuvaa palvelun parhaat p\u00e4ivitysprosessit, mallien ja sanastojen muutostenhallinnan ja k\u00e4ytt\u00f6oikeuksien hallinnan. Selvitys toimii jatkossa alustavana ty\u00f6suunnitelmana k\u00e4yt\u00e4nn\u00f6n k\u00e4ytt\u00f6\u00f6nottoty\u00f6lle.<\/p>\n<p>Kansalliskirjasto ja CSC laativat yhteisty\u00f6ss\u00e4 my\u00f6s yleistasoisen kuvauksen (nk. whitepaper) koneoppimisen menetelmien k\u00e4yt\u00f6st\u00e4 automaattisen kuvailun palvelussa osana Kansalliskirjaston ja muiden muistiorganisaatioiden toimintaa. Kansallisarkiston tavoitteena hankkeessa on massadigitoinnin yhteydess\u00e4 (esim. automaattisen tekstintunnistuksen kautta) syntyv\u00e4n materiaalin k\u00e4sittelyn menetelmien kehitt\u00e4minen.<\/p>\n<p>High Performance Digitisation -hanke on yhteisrahoitettu Euroopan unionin Verkkojen Eurooppa -rahoitusv\u00e4lineest\u00e4. CSC:n hallinnoiman hankkeen lis\u00e4ksi Kansalliskirjasto ja Kansallisarkisto ovat ty\u00f6skennelleet omaa rahoitustaan k\u00e4ytt\u00e4en. Hankkeen tuotokset ovatkin sovellettavissa my\u00f6s laajemmin eurooppalaisissa muistiorganisaatioissa ja kuvailutietojen osalta huomioidaan Euroopan Dataportaalin Metadata Quality Assurance (MQA) -vaatimukset.<\/p>\n<p>Hankkeen tavoitteena on automaattisen sis\u00e4ll\u00f6nkuvailun palvelun kehitt\u00e4minen ja k\u00e4ytt\u00f6\u00f6notto Kansalliskirjastossa. Annif on ollut testik\u00e4yt\u00f6ss\u00e4 kev\u00e4\u00e4st\u00e4 2020 alkaen Vaasan yliopiston julkaisuarkistossa Osuvassa, jota Kansalliskirjasto yll\u00e4pit\u00e4\u00e4. Integraation j\u00e4lkeen sy\u00f6tt\u00f6lomakkeen k\u00e4ytt\u00f6 etenee seuraavasti: opiskelija (tai tutkija tai muu kirjoittaja) sy\u00f6tt\u00e4\u00e4 tekstin, joka l\u00e4hetet\u00e4\u00e4n rajapinnan kautta Annifille. Opiskelija voi hyv\u00e4ksy\u00e4 tai hyl\u00e4t\u00e4 Annifin ehdotukset sek\u00e4 lis\u00e4t\u00e4 omia asia- tai avainsanoja. Annifin ehdotusten laadunvarmennusta ja mahdollista jatkokoulutusta varten ehdotetut ja k\u00e4ytt\u00e4j\u00e4n valitsemat asiasanat tallennetaan.<\/p>\n<p><a href=\"http:\/\/urn.fi\/URN:NBN:fi-fe2020042219855\" target=\"_blank\" rel=\"noopener noreferrer\">Esittelyvideo<\/a> Osuva-integraatiosta on julkaistu Doriassa. Samankaltainen Annif-integraatio on ollut k\u00e4yt\u00f6ss\u00e4 pitk\u00e4\u00e4n Jyv\u00e4skyl\u00e4n yliopiston JYX-arkistossa, jonka antama palaute Annifin k\u00e4yt\u00f6st\u00e4 on ollut positiivista. JYX:in k\u00e4ytt\u00f6kokemuksista voi lukea lis\u00e4\u00e4 Ari H\u00e4yrisen Kirjastoverkkop\u00e4ivill\u00e4 2019 pit\u00e4m\u00e4st\u00e4 <a href=\"https:\/\/www.doria.fi\/bitstream\/handle\/10024\/173332\/Kivepa_Hayrinen_annif.pdf?sequence=1&amp;isAllowed=y\" target=\"_blank\" rel=\"noopener noreferrer\">esitelm\u00e4st\u00e4<\/a> (pdf).<\/p>\n<p>&nbsp;<\/p>\n<h1>Tulokset ja tulevaisuuden n\u00e4kym\u00e4t<\/h1>\n<p>Tulevaisuudessa Annif otetaan k\u00e4ytt\u00f6\u00f6n muissa Kansalliskirjaston yll\u00e4pit\u00e4miss\u00e4 julkaisuarkistoissa. Kansalliskirjasto on my\u00f6s lanseerannut Finto AI -palvelun, joka on Annifin tuotantok\u00e4ytt\u00f6versio. T\u00e4m\u00e4n laajempi Annifin k\u00e4ytt\u00f6, etenkin t\u00e4ss\u00e4 projektissa suunniteltu annotaatioputki, j\u00e4\u00e4 tarkemmin pohdittavaksi projektin jatkoon \u2013 toivomme toki projektin ymp\u00e4rille rakentuneen hyv\u00e4n yhteisty\u00f6n jatkuvan.<\/p>\n<p>Hankkeen taustalla ei ollut aiempaa automaattisen kuvailun yhteisty\u00f6t\u00e4 eri osapuolten v\u00e4lill\u00e4, joten nopeasti ja sujuvasti k\u00e4ynnistynyt yhteisty\u00f6 kertonee aiheen ajankohtaisuudesta ja erilaisten toimijoiden yhteisty\u00f6n tarpeellisuudesta. Hanke on edennyt ripe\u00e4sti ja pitk\u00e4lti aikataulussa, mutta valitettavasti tuotannollistamisen aloittaminen viiv\u00e4styi koronapandemian ja rekrytointihaasteiden vuoksi. N\u00e4ist\u00e4 syist\u00e4 hanketta jatkettiin vuoden 2020 loppuun asti ja t\u00e4ll\u00e4 hetkell\u00e4 osapuolet selvitt\u00e4v\u00e4tkin mahdollisuuksia hedelm\u00e4llisen yhteisty\u00f6n jatkamiseen.<\/p>\n<p>Luonnollisen kielen k\u00e4sittelyn (engl. natural language processing, NLP) -tekniikoiden kehitys hankkeen aikana on ollut huimaa. Suurimman palstatilan on vienyt OpenAI-yhteis\u00f6n GPT-neuroverkkomalli, mutta automaattisen kuvailun osalta oleellisempaa on ollut mm. BERT-mallien kehittyminen. Onkin odotettavissa, ett\u00e4 luonnollisen kielen k\u00e4sittelyn menetelmien tarkkuus ja kattavuus tulee kehittym\u00e4\u00e4n ripe\u00e4sti my\u00f6s jatkossakin ja t\u00e4ss\u00e4 kehityksess\u00e4 mukana oleminen mahdollistaa entist\u00e4 parempia automaattisen k\u00e4sittelyn ty\u00f6voiden kehitt\u00e4misen.<\/p>\n<p>Hankkeen aikana palvelun kehitt\u00e4minen saadaan viety\u00e4 pitk\u00e4lle ja k\u00e4ytt\u00f6\u00f6notosta saadaan alustavia kokemuksia. Varmasti kuitenkin teko\u00e4ly\u00e4 k\u00e4ytt\u00e4vien automaattisten prosessien osalta tie on vasta alussa: uudenlainen toimintamalli vaatii pitk\u00e4\u00e4 kehitysty\u00f6t\u00e4 ja jatkuvaa oppimista tulevien vuosien aikana. Ihmisten toimintaa tukevan teko\u00e4lyn integrointi osaksi muistiorganisaatioiden toimintaa ja toisaalta k\u00e4ytt\u00e4jien totuttuja ty\u00f6tapoja sis\u00e4lt\u00e4\u00e4 lukuisia tulevaisuuden haasteita.<\/p>\n<p><strong>Lis\u00e4tietoa:<\/strong><br \/>\nKehitysp\u00e4\u00e4llikk\u00f6 Aleksi Kallio, CSC \u2013 Tieteen tietotekniikan keskus, aleksi.kallio (at) csc.fi<br \/>\nTietoasiantuntija Mona Lehtinen, Kansalliskirjasto, mona.lehtinen (at) helsinki.fi<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Digitaalisten aineistojen m\u00e4\u00e4r\u00e4 kasvaa jatkuvasti: toisaalta paperiarkistojen laajamittainen digitointi ja toisaalta syntyj\u00e4\u00e4n digitaalisen materiaalin aktiivisempi arkistointi synnytt\u00e4v\u00e4t alati kasvavia aineistokokoelmia. Koneluettava aineisto avaa uudenlaisia mahdollisuuksia yhdistelyyn, rikastamiseen ja muuhun jatkojalostukseen.&hellip; <a class=\"continue\" href=\"https:\/\/www.digime.fi\/sv\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/\">Lue lis\u00e4\u00e4<span> High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun<\/span><\/a><\/p>\n","protected":false},"author":6,"featured_media":8504,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_jetpack_memberships_contains_paid_content":false,"footnotes":""},"categories":[3],"tags":[458,588,577,263,589,240,562,464,465,436,277,618],"class_list":["post-8503","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uutiset","tag-annif","tag-automaattinen-sisallonkuvailu","tag-csc","tag-digitaaliset-aineistot","tag-finto-ai","tag-kansalliskirjasto","tag-koneoppiminen","tag-kuvailu","tag-metatieto","tag-muistiorganisaatiot","tag-tekoaly","tag-verkkojen-eurooppa"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.6 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun - Digime<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/\" \/>\n<meta property=\"og:locale\" content=\"sv_SE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun - Digime\" \/>\n<meta property=\"og:description\" content=\"Digitaalisten aineistojen m\u00e4\u00e4r\u00e4 kasvaa jatkuvasti: toisaalta paperiarkistojen laajamittainen digitointi ja toisaalta syntyj\u00e4\u00e4n digitaalisen materiaalin aktiivisempi arkistointi synnytt\u00e4v\u00e4t alati kasvavia aineistokokoelmia. Koneluettava aineisto avaa uudenlaisia mahdollisuuksia yhdistelyyn, rikastamiseen ja muuhun jatkojalostukseen.&hellip; Lue lis\u00e4\u00e4 High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/\" \/>\n<meta property=\"og:site_name\" content=\"Digime\" \/>\n<meta property=\"article:published_time\" content=\"2020-09-29T10:50:54+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2020-09-29T11:12:22+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.digime.fi\/wp-content\/uploads\/2020\/09\/Verkkojen-Eurooppa.png\" \/>\n\t<meta property=\"og:image:width\" content=\"613\" \/>\n\t<meta property=\"og:image:height\" content=\"97\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Digime\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Skriven av\" \/>\n\t<meta name=\"twitter:data1\" content=\"Digime\" \/>\n\t<meta name=\"twitter:label2\" content=\"Ber\u00e4knad l\u00e4stid\" \/>\n\t<meta name=\"twitter:data2\" content=\"4 minuter\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/\"},\"author\":{\"name\":\"Digime\",\"@id\":\"https:\\\/\\\/www.digime.fi\\\/#\\\/schema\\\/person\\\/193f4f0a45508e2423be085515b901b5\"},\"headline\":\"High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun\",\"datePublished\":\"2020-09-29T10:50:54+00:00\",\"dateModified\":\"2020-09-29T11:12:22+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/\"},\"wordCount\":885,\"publisher\":{\"@id\":\"https:\\\/\\\/www.digime.fi\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.digime.fi\\\/wp-content\\\/uploads\\\/2020\\\/09\\\/Verkkojen-Eurooppa.png\",\"keywords\":[\"Annif\",\"automaattinen sis\u00e4ll\u00f6nkuvailu\",\"CSC\",\"digitaaliset aineistot\",\"Finto AI\",\"kansalliskirjasto\",\"koneoppiminen\",\"kuvailu\",\"metatieto\",\"muistiorganisaatiot\",\"teko\u00e4ly\",\"Verkkojen Eurooppa\"],\"articleSection\":[\"Uutiset\"],\"inLanguage\":\"sv-SE\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/\",\"url\":\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/\",\"name\":\"High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun - Digime\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.digime.fi\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.digime.fi\\\/wp-content\\\/uploads\\\/2020\\\/09\\\/Verkkojen-Eurooppa.png\",\"datePublished\":\"2020-09-29T10:50:54+00:00\",\"dateModified\":\"2020-09-29T11:12:22+00:00\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/#breadcrumb\"},\"inLanguage\":\"sv-SE\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"sv-SE\",\"@id\":\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/#primaryimage\",\"url\":\"https:\\\/\\\/www.digime.fi\\\/wp-content\\\/uploads\\\/2020\\\/09\\\/Verkkojen-Eurooppa.png\",\"contentUrl\":\"https:\\\/\\\/www.digime.fi\\\/wp-content\\\/uploads\\\/2020\\\/09\\\/Verkkojen-Eurooppa.png\",\"width\":613,\"height\":97},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/www.digime.fi\\\/2020\\\/09\\\/29\\\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Etusivu\",\"item\":\"https:\\\/\\\/www.digime.fi\\\/sv\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/www.digime.fi\\\/#website\",\"url\":\"https:\\\/\\\/www.digime.fi\\\/\",\"name\":\"Digime\",\"description\":\"\",\"publisher\":{\"@id\":\"https:\\\/\\\/www.digime.fi\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/www.digime.fi\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"sv-SE\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/www.digime.fi\\\/#organization\",\"name\":\"Digime\",\"url\":\"https:\\\/\\\/www.digime.fi\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"sv-SE\",\"@id\":\"https:\\\/\\\/www.digime.fi\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/www.digime.fi\\\/wp-content\\\/uploads\\\/2018\\\/05\\\/logo_vih_musta.png\",\"contentUrl\":\"https:\\\/\\\/www.digime.fi\\\/wp-content\\\/uploads\\\/2018\\\/05\\\/logo_vih_musta.png\",\"width\":240,\"height\":100,\"caption\":\"Digime\"},\"image\":{\"@id\":\"https:\\\/\\\/www.digime.fi\\\/#\\\/schema\\\/logo\\\/image\\\/\"}},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/www.digime.fi\\\/#\\\/schema\\\/person\\\/193f4f0a45508e2423be085515b901b5\",\"name\":\"Digime\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"sv-SE\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/7f44e612a5f023436957c5e8d72bbe3d1d23c65a49960186667eac511ff4cdc4?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/7f44e612a5f023436957c5e8d72bbe3d1d23c65a49960186667eac511ff4cdc4?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/7f44e612a5f023436957c5e8d72bbe3d1d23c65a49960186667eac511ff4cdc4?s=96&d=mm&r=g\",\"caption\":\"Digime\"},\"url\":\"https:\\\/\\\/www.digime.fi\\\/sv\\\/author\\\/annemjarv_hallinta\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun - Digime","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/","og_locale":"sv_SE","og_type":"article","og_title":"High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun - Digime","og_description":"Digitaalisten aineistojen m\u00e4\u00e4r\u00e4 kasvaa jatkuvasti: toisaalta paperiarkistojen laajamittainen digitointi ja toisaalta syntyj\u00e4\u00e4n digitaalisen materiaalin aktiivisempi arkistointi synnytt\u00e4v\u00e4t alati kasvavia aineistokokoelmia. Koneluettava aineisto avaa uudenlaisia mahdollisuuksia yhdistelyyn, rikastamiseen ja muuhun jatkojalostukseen.&hellip; Lue lis\u00e4\u00e4 High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun","og_url":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/","og_site_name":"Digime","article_published_time":"2020-09-29T10:50:54+00:00","article_modified_time":"2020-09-29T11:12:22+00:00","og_image":[{"width":613,"height":97,"url":"https:\/\/www.digime.fi\/wp-content\/uploads\/2020\/09\/Verkkojen-Eurooppa.png","type":"image\/png"}],"author":"Digime","twitter_card":"summary_large_image","twitter_misc":{"Skriven av":"Digime","Ber\u00e4knad l\u00e4stid":"4 minuter"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/#article","isPartOf":{"@id":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/"},"author":{"name":"Digime","@id":"https:\/\/www.digime.fi\/#\/schema\/person\/193f4f0a45508e2423be085515b901b5"},"headline":"High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun","datePublished":"2020-09-29T10:50:54+00:00","dateModified":"2020-09-29T11:12:22+00:00","mainEntityOfPage":{"@id":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/"},"wordCount":885,"publisher":{"@id":"https:\/\/www.digime.fi\/#organization"},"image":{"@id":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/#primaryimage"},"thumbnailUrl":"https:\/\/www.digime.fi\/wp-content\/uploads\/2020\/09\/Verkkojen-Eurooppa.png","keywords":["Annif","automaattinen sis\u00e4ll\u00f6nkuvailu","CSC","digitaaliset aineistot","Finto AI","kansalliskirjasto","koneoppiminen","kuvailu","metatieto","muistiorganisaatiot","teko\u00e4ly","Verkkojen Eurooppa"],"articleSection":["Uutiset"],"inLanguage":"sv-SE"},{"@type":"WebPage","@id":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/","url":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/","name":"High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun - Digime","isPartOf":{"@id":"https:\/\/www.digime.fi\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/#primaryimage"},"image":{"@id":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/#primaryimage"},"thumbnailUrl":"https:\/\/www.digime.fi\/wp-content\/uploads\/2020\/09\/Verkkojen-Eurooppa.png","datePublished":"2020-09-29T10:50:54+00:00","dateModified":"2020-09-29T11:12:22+00:00","breadcrumb":{"@id":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/#breadcrumb"},"inLanguage":"sv-SE","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/"]}]},{"@type":"ImageObject","inLanguage":"sv-SE","@id":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/#primaryimage","url":"https:\/\/www.digime.fi\/wp-content\/uploads\/2020\/09\/Verkkojen-Eurooppa.png","contentUrl":"https:\/\/www.digime.fi\/wp-content\/uploads\/2020\/09\/Verkkojen-Eurooppa.png","width":613,"height":97},{"@type":"BreadcrumbList","@id":"https:\/\/www.digime.fi\/2020\/09\/29\/high-performance-digitisation-hankkeella-vauhtia-digitaalisten-aineistojen-kuvailuun\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Etusivu","item":"https:\/\/www.digime.fi\/sv\/"},{"@type":"ListItem","position":2,"name":"High Performance Digitisation -hankkeella vauhtia digitaalisten aineistojen kuvailuun"}]},{"@type":"WebSite","@id":"https:\/\/www.digime.fi\/#website","url":"https:\/\/www.digime.fi\/","name":"Digime","description":"","publisher":{"@id":"https:\/\/www.digime.fi\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.digime.fi\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"sv-SE"},{"@type":"Organization","@id":"https:\/\/www.digime.fi\/#organization","name":"Digime","url":"https:\/\/www.digime.fi\/","logo":{"@type":"ImageObject","inLanguage":"sv-SE","@id":"https:\/\/www.digime.fi\/#\/schema\/logo\/image\/","url":"https:\/\/www.digime.fi\/wp-content\/uploads\/2018\/05\/logo_vih_musta.png","contentUrl":"https:\/\/www.digime.fi\/wp-content\/uploads\/2018\/05\/logo_vih_musta.png","width":240,"height":100,"caption":"Digime"},"image":{"@id":"https:\/\/www.digime.fi\/#\/schema\/logo\/image\/"}},{"@type":"Person","@id":"https:\/\/www.digime.fi\/#\/schema\/person\/193f4f0a45508e2423be085515b901b5","name":"Digime","image":{"@type":"ImageObject","inLanguage":"sv-SE","@id":"https:\/\/secure.gravatar.com\/avatar\/7f44e612a5f023436957c5e8d72bbe3d1d23c65a49960186667eac511ff4cdc4?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/7f44e612a5f023436957c5e8d72bbe3d1d23c65a49960186667eac511ff4cdc4?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/7f44e612a5f023436957c5e8d72bbe3d1d23c65a49960186667eac511ff4cdc4?s=96&d=mm&r=g","caption":"Digime"},"url":"https:\/\/www.digime.fi\/sv\/author\/annemjarv_hallinta\/"}]}},"jetpack_featured_media_url":"https:\/\/www.digime.fi\/wp-content\/uploads\/2020\/09\/Verkkojen-Eurooppa.png","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/www.digime.fi\/sv\/wp-json\/wp\/v2\/posts\/8503","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.digime.fi\/sv\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.digime.fi\/sv\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.digime.fi\/sv\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/www.digime.fi\/sv\/wp-json\/wp\/v2\/comments?post=8503"}],"version-history":[{"count":1,"href":"https:\/\/www.digime.fi\/sv\/wp-json\/wp\/v2\/posts\/8503\/revisions"}],"predecessor-version":[{"id":8507,"href":"https:\/\/www.digime.fi\/sv\/wp-json\/wp\/v2\/posts\/8503\/revisions\/8507"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.digime.fi\/sv\/wp-json\/wp\/v2\/media\/8504"}],"wp:attachment":[{"href":"https:\/\/www.digime.fi\/sv\/wp-json\/wp\/v2\/media?parent=8503"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.digime.fi\/sv\/wp-json\/wp\/v2\/categories?post=8503"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.digime.fi\/sv\/wp-json\/wp\/v2\/tags?post=8503"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}