Avatar photo

27. helmikuuta 2018

Mitä ihmettä ovat Pikkulintu, Scoopmatic ja U-Bot? – Esittelyssä uutisrobotiikka STT:ssä

Toimituksen rutiinitöiden siirtäminen uutisroboteille etenee STT:ssä kovaa vauhtia. Tässä tekstissä esittelemme kolme selkeimmin uutisrobotiikaksi määriteltävää projektia: Pikkulintu, Scoopmatic ja kokonaisuutta yhdistävä kattokäsite U-bot. Näiden lisäksi esimerkiksi urheilutoimituksen prosessia automatisoidaan SportEdit-tulosjärjestelmää kehittämällä.

Automaatio ei ole täysin uusi asia STT:n toimituksessa. Esimerkiksi valtakunnallisen hälytyspalvelun hälytykset on jo vuosia lukenut robotti. STT:n toimittajat syöttävät robotille yöllisiin isoihin uutisiin liittyvät tekstit. Tämän jälkeen robotti soittaa palvelun asiakkaille ja lukee tekstin heille.

Pikkulintu visertää verkkosivujen muutoksista

Pikkulintu-työkalu seuraa verkkosivuja. Käyttäjät voivat asettaa seurantaan joko koko verkkosivun tai jonkin sen osan. Pikkulinnun avulla voidaan seurata myös valittujen tietojen muutoksia verkkosivuilla. Lintunen osaa esimerkiksi kertoa, jos sähköttömien kotitalouksien määrä nousee yli 10 000:een.

Pikkulintu on ollut testikäytössä STT:n toimituksessa jo heti viime syksynä tehdystä ensimmäisestä kahden viikon kehitysjaksosta asti. Työkalu valmistuu kuluvan kevään aikana. Tuolloin nykyisen pilottiryhmän lisäksi koko STT:n toimitus pääsee ottamaan työkalun käyttöönsä.

Myöhemmin Pikkulintu on mahdollista ottaa käyttöön myös muiden medioiden toimituksissa. Työkalu sopii myös yrityksille, jotka haluavat säännöllisesti seurata esimerkiksi oman toimialansa kannalta olennaista tietoa verkossa. Koska Pikkulinnun toivotaan lentävän ulkomaillekin, se tunnetaan jo nyt myös englanninkielisellä nimellä Little Bird.

Scoopmatic ammentaa tekoälystä

Nimesimme tekoälystä ammentavan tekstirobottimme Scoopmaticiksi. Scoopmaticin pohjimmainen ajatus on sama kuin tähän asti tehdyissä tekstiä tuottavissa uutisroboteissa: tuottaa dataan perustuvia uutistekstejä nopeammin ja kattavammin. Scoopmatic-projektissa otetaan kuitenkin aivan kehityksen alusta asti aimo askel tekoälyn suuntaan.

Nykyiset uutisrobotit perustuvat käsin kirjoitettuihin tekstipohjiin. Kehittäjät ja toimittajat kirjoittavat tekstikatkelmia ja luovat sääntöjä, joiden perusteella näitä katkelmia yhdistellään. Tämä on työlästä ja aikaavievää. Vaikka tekstikatkelmien ja sääntöjen kirjo olisi kohtuullisen laaja, lopputuloksena on toistuvaa tekstiä. Suuren työmäärän vuoksi robottikkaa on ollut mahdollista ottaa käyttöön vain kohtullisen kapeissa aihepiireissä. Uuden aihealueen mukaan ottamisessa tekstikatkelmien ja sääntöjen luonti joudutaan aloittamaan käytännössä alusta.

STT haluaa poistaa tämän työvaiheen ainakin osin. Tämän mahdollistamiseksi STT kumppanoitui Turun Yliopiston kieliteknologian NLP-yksikön kanssa. TurkuNLP tuottaa projektiin moderniin kieliteknologiaan, tekoälyyn ja koneoppimiseen perustuvia komponentteja, joiden avulla tekstikatkelmien ja sääntöjen luominen siirretään sekin Scoopmatic-robotille. Uusien uutisten pohjana Scoopmatic käyttää aiemmin samasta aiheesta tehtyjä STT:n uutisia.

Tavoitteena on siis siirtää työläs työvaihe robotille ja mahdollistaa uusien aihealueiden nopeampi käyttöönotto. Samalla tavoitteena on nykyrobotteja rikkaampi kielellinen ilmaisu.

U-Bot sukeltaa toimitusprosessin pinnan alla

STT:n koko robotiikkakokonaisuus kulkee nimellä U-Bot, joka on ikään kuin lyhenne uutisbotista. Samalla se kuitenkin viittaa sukellusveneeseen, joka kulkee pinnan alla. Iso osa robotin työstä jää toimittajalle näkymättömäksi ja vain ajoittain pintaan nousee työn tuloksia.

Pikkulintu ja Scoopmatic ovat U-Botin osia. Niillä on myös mahdollisia yhtymäkohtia: Scoopmatic voi tulevaisuudessa kirjoittaa uutisia myös perustuen Pikkulinnun hälytyksiin. Myöhemmin U-Bot-kokonaisuus laajenee muilla uutisrobotiikan työkaluilla.

Uutisrobotiikalla voidaan tarkoittaa niin tekstin tuottamista kuin muitakin automatisoitavia toimitustyön vaiheita. STT:n pitkän aikavälin tavoitteena onkin automatisoida toimituksen prosesseja kaikissa niissä kohdissa, joissa se nopeuttaa työtä, vähentää virheitä ja antaa toimittajille aikaa keskittyä ajattelua ja analysointia vaativiin työvaiheisiin.

Lue lisää uutisrobotiikan hyödyistä

Lisätietoa STT:n robotiikkaprojekteista uutiskehittäjä Maija Paikkala, maija.paikkala(at)stt.fi