Maija Paikkala
27. syyskuuta 2022

Tekoäly ja journalismi – mistä on kyse?

Mistä puhutaan, kun puhutaan tekoälystä ja journalismista? Miten tekoäly liittyy datajournalismiin tai robottijournalismiin? Miten journalismin saralla on hyödynnetty tekoälyä ja millasia mahdollisuuksia vielä voisi olla? Näihin kysymyksiin löydät vastauksia tästä blogitekstistä.

Jos aihe kiinnostaa laajemmin, katso vinkkimme blogeista, podcasteista ja kirjoista:

Vinkkilistamme blogeista, podcasteista ja kirjoista

Hypeä ja huonosti määriteltyjä käsitteitä

Datajournalismi, robottijournalismi, teköäly ja journalismi. Kaikkien näiden käsitteiden ympärillä on jossakin kohtaa ollut erityistä innostusta ja suuria odotuksia, ”hypeä”. Nämä käsitteet ovat toistensa jatkumoa ja ajoittain niitä näkee käytettävän lähes synonyymeinä. Ne eivät kuitenkaan tarkoita samaa.

Datajournalismia toisteltiin erityisesti noin 10 vuotta sitten. Sillä tarkoitetaan journalismia ja siihen liittyvää prosessia, jossa hyödynnetään dataa. Datajournalismi voi olla robottijournalismia ja siinä voidaan hyödyntää tekoälyä, mutta kyse voi olla myös toimittajan itse pyörittämästä datasta, josta hän kirjoittaa jutun.

Robottijournalismista puhuttiin paljon muutama vuosi sitten. Termi on monella tavalla ongelmallinen. Robotti viittaa periaatteessa fyysiseen ihmistyön osaa korvaavaan koneeseen. Robottijournalismia ei tokikaan tuota fyysinen robotti, vaan erilaiset ohjelmistot. Näitä voidaan kutsua boteiksi, joten täysin kaukaa haettu termi ei ole.

Termin toinen ongelma liittyy siihen, että eri puhujat tarkoittavat sillä eri asioita. Toisille se on vain automaattista tekstin tuotantoa, toisilla kaikkea toimituksellisen työn automatisointia ja ohjelmistojen hyödyntämistä prosesseissa. STT on käyttänyt termiä jälkimmäisessä merkityksessä.

Tekoäly-termin käyttöön liittyy vastaavaa ongelmaa. Tekoälyn alle laitetaan usein sellaisiakin ohjelmistoja, algoritmeja ja projekteja, joissa ei ole tekoälyä hyödynnetty lainkaan. Sitä käytetään merkityksessä, joka on lähellä robottijournalismin laajaa merkitystä.

Tekoäly on kone, jolla on kyky käyttää ihmismäistä älyä, esimerkiksi oppia ja päätellä. Aivan tarkkaa, yleisesti hyväksyttyä määritelmää ei ole, joten siksikin termin alle on helppo laittaa kaikenlaista. Jos jokin kone hyödyntää koneoppimista tai neuroverkkoja, siinä on tekoälyä.

Ruutukaappaus STT Holvin käyttöliittymästä — STT testasi tekoälyn hyödyntämistä uutistekstien luomisessa Scoopmatic-projektissaan. Projekti keskittyi loppuvaiheessa jääkiekkouutisten kirjoittamiseen.

Tekoälyn hyödyntäminen journalismissa

Vaikka tekoälyn alle ajoittain päätyykin sinne kuulumattomia työkaluja ja sovelluksia, myös aitoja tekoälyn sovelluksia on journalismin alalla testattu ja otettu käyttöön. Tekoälyä voidaankin hyödyntää journalistisen prosessin eri vaiheissa eri tavoin.

Tiedonhankinta

Tekoäly pystyy kahlaamaan läpi valtavia datamassoja, etsimään niistä esim. trendejä ja poikkeuksia. Tekoälyn käsiteltäväksi annettu data voi olla esimerkiksi sosiaalisen median postauksia, suuria määriä tekstiä tai taulukkomuotoista numerodataa.

Yksi esimerkki tästä on faktantarkistus ja valeuutisten tunnistaminen. Kone pystyy käymään läpi sosiaalista mediaa ja muuta internetin sisältöä ja päättelemään, mitkä sisällöstä vaikuttavat paikkaansapitämättömiltä.
Sisällön luominen ja muokkaaminen (osiota täydennetty keväällä 2023)

Myös itse sisältöä voidaan luoda koneellisesti ja hyödyntäen tekoälyä. Tekstiä luova tekoäly tuli kaikkien kuluttajien saataville loppuvuodesta 2022, kun ChatGPT:n ensimmäinen versio julkaistiin. Kuvaa tuottava DALL-E oli kuluttajien ulottuvissa jo aiemmin. Kevään 2023 aikana saatavilla olevien työkalujen määrä on kasvanut valtavasti.

Suurin osa ensimmäisistä tekstiä tuottavista ”uutisroboteista” ei itse asiassa hyödyntänyt tekoälyä lainkaan, vaikka ajoittain sellainen mielikuva annettiin. STT:n Scoopmatic-projektissa tekoälyllä pyrittiin luomaan uutta sisältöä, mutta virheiden määrä jäi liian suureksi, kuten kirjoitimme projektin oppeja käsittelevässä blogissa.

Uusien tekoälytyökalujen myötä sisältöjen luomista tekoälyllä on tarkasteltava kokonaan uudelleen. Mahdollisuuksia on paljon, vaikka hyödyntäminen tällä hetkellä onkin mediayrityksissä melko vaihtelevaa ja jopa vähäistä. Esimerkiksi otsikkoehdotukset tai tiivistelmien tekeminen ovat kuitenkin löytäneet paikkansa jo useassa mediatalossa.

Myös sisältömuodon vaihtamisessa toiseen voidaan hyödyntää tekoälyä. Tekstin muuttaminen puheeksi tai puheen muuttaminen tekstiksi onnistuu jo monilla kielillä. Suomeksikin on olemassa ohjelmistoja, jotka muuttavat puhetta tekstiksi ja toisinpäin. Muutama vuosi sitten Yleisradio, Valtion kehittämisyhtiö Vake ja suomalaiset yliopistot keräsivät puhenäytteitä Lahjoita-puheprojektissa, jonka tavoitteena oli mahdollistaa suomenkielisten sovellusten kehittäminen entistä paremmaksi.

Lisäksi tekoälyllä voidaan luoda esimerkiksi täysin virtuaalinen uutisten lukija, kuten kiinalainen uutistoimisto Xinhua on tehnyt. Tekoäly voi myös luoda kuvia, esimerkiksi kasvokuvia ihmisistä, joita ei todellisuudessa ole olemassa. DALL-E luo mistä tahansa käyttäjän antamista kuvailusanoista realistisen kuvan. Tekoälyn luomille kuville on kuitenkin toistaiseksi ollut hyvin vähän tilaa journalismissa, joka perustuu todellisten ihmisten ja paikkojen kuvaamiseen. Kuvituskuvaa hyödyntävissä aiheissa tekoälyä kuitenkin olisi mahdollista hyödyntää.

Tekoäly voi myös täydentää sisältöön liittyviä metatietoja, joiden avulla kuvaillaan sisältöä. Tekoäly voi tunnistaa kuvasta ihmisiä tai aiheita. Tekoäly voi sisällön luokitella tekstin aihepiireittäin. Näin luotuja kuvailutietoja voidaan käyttää myös personoinnissa.
Sisällön jakelu ja personointi

Sisällön jakelussa ja personoinnissa on jo käytössä lukemattomia tekoälysovelluksia.

Erimerkiksi Ylen Uutisvahti-sovellus suosittelee käyttäjälleen sisältöjä perustuen käyttäjän antamiin aihepainotuksiin ja siihen, mitä hän on lukenut aiemmin. Taustalla on koneoppimismenetelmiä. Vastaavat menetelmät ovat käytössä esimerkiksi sosiaalisen median palveluissa.

Tekoäly voi myös avustaa esimerkiksi siinä, mikä olisi paras aika julkaista jokin tietty artikkeli. Kone pystyy huomioimaan lukuisia parametrejä samanaikaisesti.
Journalistisen prosessin ympärillä

Mediataloissa tekoälylle on käyttö myös monessa muussa kuin varsinaisessa journalistisessa prosessissa. Esimerkiksi mainonnassa voidaan hyödyntää tekoälyä.

Myös verkkosivujen keskusteluiden moderoinnissa voidaan hyödyntää tekoälyä. Tekoäly voi suodattaa automaattisesti pois sellaiset kommentit, jotka eivät istu kyseisen median kommentointiperiaatteisiin. Tai tekoäly voi luokitella kommentit eri kategorioihin ihmismoderaattorin käsiteltäviksi. Tekoälyn käyttö moderoinnissa ei kuitenkaan ole aina ongelmatonta. Mm. Yleisradio luopui tekoälyn käytöstä moderoinnissa.

STT:n uutisarkisto saatavilla kehitystyöhön – esimerkiksi tekoälyn rakentamiseen

Cookie	Kesto	Kuvaus
__Secure-ROLLOUT_TOKEN	6 months	Description is currently not available.
AWSALBAPP-0	7 days	Description is currently not available.
AWSALBAPP-1	7 days	Description is currently not available.
AWSALBAPP-2	7 days	Description is currently not available.
AWSALBAPP-3	7 days	Description is currently not available.
cookielawinfo-checkbox-valfria	1 year	Description is currently not available.

Cookie	Kesto	Kuvaus
__cf_bm	30 minutes	This cookie, set by Cloudflare, is used to support Cloudflare Bot Management.
DEVICE_INFO	5 months 27 days	No description
pll_language	1 year	Polylang sets this cookie to remember the language the user selects when returning to the website and get the language information when unavailable in another way.
sc_anonymous_id	9 years	This cookie allows users to embed files or other content onto the website, this function can be limited to specific visitors.
yt-remote-cast-installed	session	The yt-remote-cast-installed cookie is used to store the user's video player preferences using embedded YouTube video.
yt-remote-fast-check-period	session	The yt-remote-fast-check-period cookie is used by YouTube to store the user's video player preferences for embedded YouTube videos.
yt-remote-session-app	session	The yt-remote-session-app cookie is used by YouTube to store user preferences and information about the interface of the embedded YouTube video player.
yt-remote-session-name	session	The yt-remote-session-name cookie is used by YouTube to store the user's video player preferences using embedded YouTube video.
ytidb::LAST_RESULT_ENTRY_KEY	never	The cookie ytidb::LAST_RESULT_ENTRY_KEY is used by YouTube to store the last search result entry that was clicked by the user. This information is used to improve the user experience by providing more relevant search results in the future.

Tekoäly ja journalismi – mistä on kyse?

Hypeä ja huonosti määriteltyjä käsitteitä

Tekoälyn hyödyntäminen journalismissa

Uusimmat

Categories

Archives