1. maaliskuuta 2021

Taustatiedot kunnossa – Laadukas metadata auttaa menestymään verkossa

Verkossa menestyvä uutismedia tarvitsee laadukasta metadataa kuvailemaan artikkeleidensa sisältöä. Verkkosivujen personointi, sisällön suosittelu ja kävijäanalytiikka ovat keskeisimmät metadatan hyödyntämisen kohteet, ilmenee STT:n tekemästä selvityksestä.

Kaiken metatiedon pitäisi palvella sitä, että me pystyisimme digitaalisesti entistä paremmin tekemään Netflixit. Eli sanomaan, että jos tämä kiinnosti sinua, sinua saattaisi kiinnostaa myös tämä.

STT:n haastattelema verkkopäällikkö

Metadatalla tarkoitetaan sisällön kuvailua. Metadatalla voidaan kuvailla sanallisesti, mistä esim. artikkelissa tai kuvassa on kyse, tai sillä voidaan kertoa esim. jutun pituudesta tai tärkeydestä.

Avainsanoitusta ja paikkatietoa

Selvityksessä nousi esille erityisesti kaksi keskeistä metatietotyyppiä, joilla personointia tehdä ja analytiikkaa tulkita.

Mediat ovat jo pitkään avain- tai asiasanoittaneet artikkeleitaan ja kuviaan. Selvityksessä ilmeni, että tälle on edelleen tarvetta, mutta sen muoto on muuttunut ja muuttumassa yhä vapaaksi. Valmiiden sanastojen sijaan ollaan siirtymässä vapaampaan sanoittamiseen.

Jos jutussa on asiasana jääkiekko, sen ei välttämättä tarvitse tietää, että se kuuluu alalajiin pallopelit, joka on taas joukkueurheilun alalaji, joka taas sitten on urheilun alalaji, joka taas sitten on vapaa-ajan alalaji… Rakenne taustalla ei ole tärkeää. Riittää se, että jääkiekon jutut löytyvät.

STT:n haastattelema projektipäällikkö

Toinen muutos avainsanoittamisessa on automatisointi. Osa haastatelluista mediataloista käyttää jo jotakin työkalua luomaan avainsanoja artikkeleihinsa. Avainsanat kuitenkin tarkistetaan toimituksessa ennen jutun julkaisua.

Manuaalista, toimittajien tekemää avainsanoitusta pidetään epätasalaatuisena. Työtä on vaikea ohjeistaa niin, että jokainen kuvailisi sisältöä riittävän samankaltaisesti. Valmiita sanastoja on käytetty osaltaan tasalaatuistamaan luokittelua, mutta toimittajien on mahdoton osata ulkoa pitkiä asiasanalistoja.

Ne olivat aika vaikeita hahmottaa toimittajille. Kun vain jotakin pitää valita, niin otetaan aina joku human interest -tyyppinen.

STT:n haastattelema verkkopäällikkö

Mun kokemus on se, että iso asiasanan avaruus on hirveän vaikea ihmisille hallita ja miettiä sitä että mikä on oikea asiasana juuri tähän aiheeseen. Kone tekee perusehdotuksen paremmin ja pystyy löytämään yhdistäviä piirteitä helpommin kuin kouluttamaton ihminen.

STT:n haastattelema projektipäällikkö

Avainsanoituksen lisäksi erityisesti paikallisia ja maakunnallisia medioita edustavat haastatellut mainitsivat paikkatiedon tärkeänä metadatatyyppinä. Paikkatietoa ei vielä hyödynnetä siinä määrin kuin haastateltavat toivoisivat tai mitä heillä on suunnitelmissaan.

STT haastatteli viiden mediatalon edustajia syksyllä 2020. Edustettuina selvityksessä oli niin paikallisia, maakunnallisia kuin valtakunnallisia medioita. Enemmistö haastatelluista työskenteli maakunnallisessa mediassa. Osa haastatelluista edusti konsernia tai muuta laajempaa mediajoukkoa. Selvitys toteutettiin osana EU-rahoitteista Embeddia-projektikokonaisuutta.