Maija Paikkala 27. syyskuuta 2022 Tekoäly ja journalismi – mistä on kyse? Mistä puhutaan, kun puhutaan tekoälystä ja journalismista? Miten tekoäly liittyy datajournalismiin tai robottijournalismiin? Miten journalismin saralla on hyödynnetty tekoälyä ja millasia mahdollisuuksia vielä voisi olla? Näihin kysymyksiin löydät vastauksia tästä blogitekstistä. Jos aihe kiinnostaa laajemmin, katso vinkkimme blogeista, podcasteista ja kirjoista: Vinkkilistamme blogeista, podcasteista ja kirjoista Hypeä ja huonosti määriteltyjä käsitteitä Datajournalismi, robottijournalismi, teköäly ja journalismi. Kaikkien näiden käsitteiden ympärillä on jossakin kohtaa ollut erityistä innostusta ja suuria odotuksia, ”hypeä”. Nämä käsitteet ovat toistensa jatkumoa ja ajoittain niitä näkee käytettävän lähes synonyymeinä. Ne eivät kuitenkaan tarkoita samaa. Datajournalismia toisteltiin erityisesti noin 10 vuotta sitten. Sillä tarkoitetaan journalismia ja siihen liittyvää prosessia, jossa hyödynnetään dataa. Datajournalismi voi olla robottijournalismia ja siinä voidaan hyödyntää tekoälyä, mutta kyse voi olla myös toimittajan itse pyörittämästä datasta, josta hän kirjoittaa jutun. Robottijournalismista puhuttiin paljon muutama vuosi sitten. Termi on monella tavalla ongelmallinen. Robotti viittaa periaatteessa fyysiseen ihmistyön osaa korvaavaan koneeseen. Robottijournalismia ei tokikaan tuota fyysinen robotti, vaan erilaiset ohjelmistot. Näitä voidaan kutsua boteiksi, joten täysin kaukaa haettu termi ei ole. Termin toinen ongelma liittyy siihen, että eri puhujat tarkoittavat sillä eri asioita. Toisille se on vain automaattista tekstin tuotantoa, toisilla kaikkea toimituksellisen työn automatisointia ja ohjelmistojen hyödyntämistä prosesseissa. STT on käyttänyt termiä jälkimmäisessä merkityksessä. Tekoäly-termin käyttöön liittyy vastaavaa ongelmaa. Tekoälyn alle laitetaan usein sellaisiakin ohjelmistoja, algoritmeja ja projekteja, joissa ei ole tekoälyä hyödynnetty lainkaan. Sitä käytetään merkityksessä, joka on lähellä robottijournalismin laajaa merkitystä. Tekoäly on kone, jolla on kyky käyttää ihmismäistä älyä, esimerkiksi oppia ja päätellä. Aivan tarkkaa, yleisesti hyväksyttyä määritelmää ei ole, joten siksikin termin alle on helppo laittaa kaikenlaista. Jos jokin kone hyödyntää koneoppimista tai neuroverkkoja, siinä on tekoälyä. STT testasi tekoälyn hyödyntämistä uutistekstien luomisessa Scoopmatic-projektissaan. Projekti keskittyi loppuvaiheessa jääkiekkouutisten kirjoittamiseen. Tekoälyn hyödyntäminen journalismissa Vaikka tekoälyn alle ajoittain päätyykin sinne kuulumattomia työkaluja ja sovelluksia, myös aitoja tekoälyn sovelluksia on journalismin alalla testattu ja otettu käyttöön. Tekoälyä voidaankin hyödyntää journalistisen prosessin eri vaiheissa eri tavoin. TiedonhankintaTekoäly pystyy kahlaamaan läpi valtavia datamassoja, etsimään niistä esim. trendejä ja poikkeuksia. Tekoälyn käsiteltäväksi annettu data voi olla esimerkiksi sosiaalisen median postauksia, suuria määriä tekstiä tai taulukkomuotoista numerodataa.Yksi esimerkki tästä on faktantarkistus ja valeuutisten tunnistaminen. Kone pystyy käymään läpi sosiaalista mediaa ja muuta internetin sisältöä ja päättelemään, mitkä sisällöstä vaikuttavat paikkaansapitämättömiltä. Sisällön luominen ja muokkaaminenMyös itse sisältöä voidaan luoda koneellisesti ja hyödyntäen tekoälyä.Usein tässä kategoriassa esitellyt toteutukset, kuten automaattisen tekstin tuotannon esimerkit, sisältävät todellisuudessa hyvin vähän tekoälyä. Journalismisen sisällön kannalta vapaasti mellestävä tekoäly on haastava kumppani, kuten kirjoitimme Scoopmatic-projektimme oppeja käsittelevässä blogissa.Tekoälyllä on kuitenkin paikkansa myös tässä kategoriassa. Vaikka tekstit tuotettaisiin ilman tekoälyä ihmisen kirjoittamien tekstikatkelmien ja sääntöjen avulla, käyttöön otettavien katkelmien valinnassa ja sääntöjen tulkinnassa voidaan hyödyntää tekoälyä. Tekoälyä voidaan käyttää myös tekemään tekstistä tiivistyksiä tai vaikkapa luomaan tekstille sopiva otsikko. Erilaisten otsikoiden menestystä verkkosivulla on myös mahdollista mitata tekoälyn avulla. Myös sisältömuodon vaihtamisessa toiseen voidaan hyödyntää tekoälyä. Tekstin muuttaminen puheeksi tai puheen muuttaminen tekstiksi onnistuu jo monilla kielillä. Suomeksikin on olemassa ohjelmistoja, jotka muuttavat puhetta tekstiksi ja toisinpäin. Muutama vuosi sitten Yleisradio, Valtion kehittämisyhtiö Vake ja suomalaiset yliopistot keräsivät puhenäytteitä Lahjoita-puheprojektissa, jonka tavoitteena oli mahdollistaa suomenkielisten sovellusten kehittäminen entistä paremmaksi.Lisäksi tekoälyllä voidaan luoda esimerkiksi täysin virtuaalinen uutisten lukija, kuten kiinalainen uutistoimisto Xinhua on tehnyt. Tekoäly voi myös luoda kuvia, esimerkiksi kasvokuvia ihmisistä, joita ei todellisuudessa ole olemassa. DALL-E luo mistä tahansa käyttäjän antamista kuvailusanoista realistisen kuvan. Tekoälyn luomille kuville on kuitenkin toistaiseksi ollut hyvin vähän tilaa journalismissa, joka perustuu todellisten ihmisten ja paikkojen kuvaamiseen. Kuvituskuvaa hyödyntävissä aiheissa tekoälyä kuitenkin olisi mahdollista hyödyntää.Tekoäly voi myös täydentää sisältöön liittyviä metatietoja, joiden avulla kuvaillaan sisältöä. Tekoäly voi tunnistaa kuvasta ihmisiä tai aiheita. Tekoäly voi sisällön luokitella tekstin aihepiireittäin. Näin luotuja kuvailutietoja voidaan käyttää myös personoinnissa.Sisällön jakelu ja personointiSisällön jakelussa ja personoinnissa on jo käytössä lukemattomia tekoälysovelluksia.Erimerkiksi Ylen Uutisvahti-sovellus suosittelee käyttäjälleen sisältöjä perustuen käyttäjän antamiin aihepainotuksiin ja siihen, mitä hän on lukenut aiemmin. Taustalla on koneoppimismenetelmiä. Vastaavat menetelmät ovat käytössä esimerkiksi sosiaalisen median palveluissa.Tekoäly voi myös avustaa esimerkiksi siinä, mikä olisi paras aika julkaista jokin tietty artikkeli. Kone pystyy huomioimaan lukuisia parametrejä samanaikaisesti.Journalistisen prosessin ympärilläMediataloissa tekoälylle on käyttö myös monessa muussa kuin varsinaisessa journalistisessa prosessissa. Esimerkiksi mainonnassa voidaan hyödyntää tekoälyä.Myös verkkosivujen keskusteluiden moderoinnissa voidaan hyödyntää tekoälyä. Tekoäly voi suodattaa automaattisesti pois sellaiset kommentit, jotka eivät istu kyseisen median kommentointiperiaatteisiin. Tai tekoäly voi luokitella kommentit eri kategorioihin ihmismoderaattorin käsiteltäviksi. Tekoälyn käyttö moderoinnissa ei kuitenkaan ole aina ongelmatonta. Mm. Yleisradio luopui tekoälyn käytöstä moderoinnissa. STT:n uutisarskisto saatavilla kehitystyöhön – esimerkiksi tekoälyn rakentamiseen