Avatar photo

27. syyskuuta 2022

Tekoäly ja journalismi – mistä on kyse?

Mistä puhutaan, kun puhutaan tekoälystä ja journalismista? Miten tekoäly liittyy datajournalismiin tai robottijournalismiin? Miten journalismin saralla on hyödynnetty tekoälyä ja millasia mahdollisuuksia vielä voisi olla? Näihin kysymyksiin löydät vastauksia tästä blogitekstistä.

Jos aihe kiinnostaa laajemmin, katso vinkkimme blogeista, podcasteista ja kirjoista:

Hypeä ja huonosti määriteltyjä käsitteitä

Datajournalismi, robottijournalismi, teköäly ja journalismi. Kaikkien näiden käsitteiden ympärillä on jossakin kohtaa ollut erityistä innostusta ja suuria odotuksia, ”hypeä”. Nämä käsitteet ovat toistensa jatkumoa ja ajoittain niitä näkee käytettävän lähes synonyymeinä. Ne eivät kuitenkaan tarkoita samaa.

Datajournalismia toisteltiin erityisesti noin 10 vuotta sitten. Sillä tarkoitetaan journalismia ja siihen liittyvää prosessia, jossa hyödynnetään dataa. Datajournalismi voi olla robottijournalismia ja siinä voidaan hyödyntää tekoälyä, mutta kyse voi olla myös toimittajan itse pyörittämästä datasta, josta hän kirjoittaa jutun.

Robottijournalismista puhuttiin paljon muutama vuosi sitten. Termi on monella tavalla ongelmallinen. Robotti viittaa periaatteessa fyysiseen ihmistyön osaa korvaavaan koneeseen. Robottijournalismia ei tokikaan tuota fyysinen robotti, vaan erilaiset ohjelmistot. Näitä voidaan kutsua boteiksi, joten täysin kaukaa haettu termi ei ole.

Kaksi lelurobottia, joista toiseen on liimattu STT:n logo, seisoo pöydällä.

Termin toinen ongelma liittyy siihen, että eri puhujat tarkoittavat sillä eri asioita. Toisille se on vain automaattista tekstin tuotantoa, toisilla kaikkea toimituksellisen työn automatisointia ja ohjelmistojen hyödyntämistä prosesseissa. STT on käyttänyt termiä jälkimmäisessä merkityksessä.

Tekoäly-termin käyttöön liittyy vastaavaa ongelmaa. Tekoälyn alle laitetaan usein sellaisiakin ohjelmistoja, algoritmeja ja projekteja, joissa ei ole tekoälyä hyödynnetty lainkaan. Sitä käytetään merkityksessä, joka on lähellä robottijournalismin laajaa merkitystä.

Tekoäly on kone, jolla on kyky käyttää ihmismäistä älyä, esimerkiksi oppia ja päätellä. Aivan tarkkaa, yleisesti hyväksyttyä määritelmää ei ole, joten siksikin termin alle on helppo laittaa kaikenlaista. Jos jokin kone hyödyntää koneoppimista tai neuroverkkoja, siinä on tekoälyä.

Ruutukaappaus STT Holvin käyttöliittymästä
STT testasi tekoälyn hyödyntämistä uutistekstien luomisessa Scoopmatic-projektissaan. Projekti keskittyi loppuvaiheessa jääkiekkouutisten kirjoittamiseen.

Tekoälyn hyödyntäminen journalismissa

Vaikka tekoälyn alle ajoittain päätyykin sinne kuulumattomia työkaluja ja sovelluksia, myös aitoja tekoälyn sovelluksia on journalismin alalla testattu ja otettu käyttöön. Tekoälyä voidaankin hyödyntää journalistisen prosessin eri vaiheissa eri tavoin.

  1. Tiedonhankinta

    Tekoäly pystyy kahlaamaan läpi valtavia datamassoja, etsimään niistä esim. trendejä ja poikkeuksia. Tekoälyn käsiteltäväksi annettu data voi olla esimerkiksi sosiaalisen median postauksia, suuria määriä tekstiä tai taulukkomuotoista numerodataa.

    Yksi esimerkki tästä on faktantarkistus ja valeuutisten tunnistaminen. Kone pystyy käymään läpi sosiaalista mediaa ja muuta internetin sisältöä ja päättelemään, mitkä sisällöstä vaikuttavat paikkaansapitämättömiltä.

  2. Sisällön luominen ja muokkaaminen (osiota täydennetty keväällä 2023)

    Myös itse sisältöä voidaan luoda koneellisesti ja hyödyntäen tekoälyä. Tekstiä luova tekoäly tuli kaikkien kuluttajien saataville loppuvuodesta 2022, kun ChatGPT:n ensimmäinen versio julkaistiin. Kuvaa tuottava DALL-E oli kuluttajien ulottuvissa jo aiemmin. Kevään 2023 aikana saatavilla olevien työkalujen määrä on kasvanut valtavasti.

    Suurin osa ensimmäisistä tekstiä tuottavista ”uutisroboteista” ei itse asiassa hyödyntänyt tekoälyä lainkaan, vaikka ajoittain sellainen mielikuva annettiin. STT:n Scoopmatic-projektissa tekoälyllä pyrittiin luomaan uutta sisältöä, mutta virheiden määrä jäi liian suureksi, kuten kirjoitimme projektin oppeja käsittelevässä blogissa.

    Uusien tekoälytyökalujen myötä sisältöjen luomista tekoälyllä on tarkasteltava kokonaan uudelleen. Mahdollisuuksia on paljon, vaikka hyödyntäminen tällä hetkellä onkin mediayrityksissä melko vaihtelevaa ja jopa vähäistä. Esimerkiksi otsikkoehdotukset tai tiivistelmien tekeminen ovat kuitenkin löytäneet paikkansa jo useassa mediatalossa.

    Myös sisältömuodon vaihtamisessa toiseen voidaan hyödyntää tekoälyä. Tekstin muuttaminen puheeksi tai puheen muuttaminen tekstiksi onnistuu jo monilla kielillä. Suomeksikin on olemassa ohjelmistoja, jotka muuttavat puhetta tekstiksi ja toisinpäin. Muutama vuosi sitten Yleisradio, Valtion kehittämisyhtiö Vake ja suomalaiset yliopistot keräsivät puhenäytteitä Lahjoita-puheprojektissa, jonka tavoitteena oli mahdollistaa suomenkielisten sovellusten kehittäminen entistä paremmaksi.

    Lisäksi tekoälyllä voidaan luoda esimerkiksi täysin virtuaalinen uutisten lukija, kuten kiinalainen uutistoimisto Xinhua on tehnyt. Tekoäly voi myös luoda kuvia, esimerkiksi kasvokuvia ihmisistä, joita ei todellisuudessa ole olemassa. DALL-E luo mistä tahansa käyttäjän antamista kuvailusanoista realistisen kuvan. Tekoälyn luomille kuville on kuitenkin toistaiseksi ollut hyvin vähän tilaa journalismissa, joka perustuu todellisten ihmisten ja paikkojen kuvaamiseen. Kuvituskuvaa hyödyntävissä aiheissa tekoälyä kuitenkin olisi mahdollista hyödyntää.

    Tekoäly voi myös täydentää sisältöön liittyviä metatietoja, joiden avulla kuvaillaan sisältöä. Tekoäly voi tunnistaa kuvasta ihmisiä tai aiheita. Tekoäly voi sisällön luokitella tekstin aihepiireittäin. Näin luotuja kuvailutietoja voidaan käyttää myös personoinnissa.

  3. Sisällön jakelu ja personointi

    Sisällön jakelussa ja personoinnissa on jo käytössä lukemattomia tekoälysovelluksia.

    Erimerkiksi Ylen Uutisvahti-sovellus suosittelee käyttäjälleen sisältöjä perustuen käyttäjän antamiin aihepainotuksiin ja siihen, mitä hän on lukenut aiemmin. Taustalla on koneoppimismenetelmiä. Vastaavat menetelmät ovat käytössä esimerkiksi sosiaalisen median palveluissa.

    Tekoäly voi myös avustaa esimerkiksi siinä, mikä olisi paras aika julkaista jokin tietty artikkeli. Kone pystyy huomioimaan lukuisia parametrejä samanaikaisesti.

  4. Journalistisen prosessin ympärillä

    Mediataloissa tekoälylle on käyttö myös monessa muussa kuin varsinaisessa journalistisessa prosessissa. Esimerkiksi mainonnassa voidaan hyödyntää tekoälyä.

    Myös verkkosivujen keskusteluiden moderoinnissa voidaan hyödyntää tekoälyä. Tekoäly voi suodattaa automaattisesti pois sellaiset kommentit, jotka eivät istu kyseisen median kommentointiperiaatteisiin. Tai tekoäly voi luokitella kommentit eri kategorioihin ihmismoderaattorin käsiteltäviksi. Tekoälyn käyttö moderoinnissa ei kuitenkaan ole aina ongelmatonta. Mm. Yleisradio luopui tekoälyn käytöstä moderoinnissa.