Tekstintekijän uusi assistentti

Jo 1800-luvulla kirjailijat, tunnetuimpana Samuel Butler Erewhonissa, visioivat tietoisia, ihmisten lailla oppivia koneita. 1900-luvun avaruusseikkailutarinoissa oli tekoälyrobotteja, jotka hoitivat erilaisia tehtäviä ja olivat joko ihmisten hyväntahtoisia apureita tai edustivat vaarallista, ihmistä alistavaa voimaa. 

Kun vuonna 2023 puhutaan tekoälystä, tarkoitetaan tavallisesti generatiivista tekoälyä, joka tuottaa tekstiä tai kuvaa. Tekoälyä on kuitenkin jo pitkään käytetty eri teollisuudenaloilla, lääketieteessä, liikenteessä ja lähes kaikessa, mihin liittyy informaation käsittelyä. 

”Tekoälystä alettiin puhua laajemmin, kun se tuli luovien alojen, kuten tekstin ja kuvan tekijöiden tontille. Kaikki, jotka ovat käyttäneet esimerkiksi alustatalouden sovelluksia, ovat käyttäneet tekoälyä”, huomauttaa Helsingin yliopiston professori ja Kuluttajatutkimuskeskuksen tutkija Minna Ruckenstein

Generatiivinen tekoäly päätyikin suomenkieliseen kirjallisuuteen jo ennen kuin äppikauppoihin. Toimittaja Olavi Koistisen vuonna 2020 ilmestynyt satiirinen työelämäromaani Motivaatiojänis sisältää tekoälyn tuottamaa tekstiä. Vuonna 2019 nykyisen ChatGPT:n edeltäjä, GPT-2-kielimalli, piti asentaa omalle koneelle. Se tuotti suomen kieltä ja teoksen kirjoitustyyliä muistuttavaa tekstiä, jossa ei kuitenkaan ollut järkevää sisältöä eikä aina edes tunnistettavia sanoja. Tyhmälle tekoälylle oli helppo naureskella. 

Vitsi vanheni muutamassa vuodessa. OpenAI julkaisi syksyllä 2022 netin kautta ilmaiseksi käytettäväksi generatiivisen tekoälyn, kielimalli ChatGPT:n, joka osasi jo tuottaa ymmärrettävää suomea, vastata oikein moniin sille esitettyihin kysymyksiin ja yhdistellä luovasti erilaisia asioita. Vastaava botti avattiin myös Bing-hakukoneen kylkeen keväällä 2023.  

Generatiiviset kielimallit ennustavat kieltä. Ne laskevat, mikä sana todennäköisimmin tulisi tekstissä seuraavaksi, perustuen siihen, millä teksteillä niitä on koulutettu ja mitä käyttäjä syötteessään eli promptissaan haluaa. “Niiden tulokset eivät kerro maailmasta, vaan kielellisistä rakenteista”, Ruckenstein huomauttaa. 

Kuvaa tuottava generatiivinen tekoäly on kehittynyt vastaavalla tavalla. Ihmisen anatomiaa sekoittavalle kömpelölle tekoälytaiteelle naureskeltiin, kunnes muutamassa kuukaudessa kuvia tuottavat palvelut kehittyivät niin, että tekoälyllä tuotetulla kuvalla voitettiin valokuvakilpailu. Kuvan promptannut taitelija paljasti kuvan alkuperän eikä ottanut palkintoa vastaan. Hän kertoi halunneensa herätellä keskustelua tekoälyn etiikasta.

Tekoäly on muutakin kuin yksittäisiä uusia sovelluksia, jotka muuttavat kuluttamisen tai työn tekemisen tapoja. Se on kokonainen järjestelmä, joka muuttaa yhteiskunnan valtasuhteita ja tuo ratkaistavaksemme uusia eettisiä ongelmia. 

”Digitaalisesta asiantuntemuksesta on tullut yhä tärkeämpää. Datatyössä eriytyvät yhä vahvemmin erikoistumista vaativa asiantuntijatyö sekä helposti ulkoistettava suorittava työ. Tällaista työtä on esimerkiksi tekoälyn kouluttamiseen tarvittava ihmistyö, jota tehdään kehittyvissä maissa. Ennen ajateltiin, että tekoäly korvaa sen suorittavan työn, mutta näin ei välttämättä tapahdukaan”, Ruckenstein pohtii. 

Kehitys jakaa valtaa monin tavoin uudelleen. Uudet yritykset ohjaavat ihmisten toimintaa ja niiden yhteiskunnallinen valta kasvaa. 

Tietokirjailija ja vastuullisuusasiantuntija Suvi Auvinen on tehnyt podcast-sarjan tekoälystä työssään viestintätoimisto Ellun Kanoilla. Hän vertaa tekoälyn tuomaa muutosta sähköön, internetiin tai renessanssiin: sen myötä koko yhteiskunnan rakenne tulee muuttumaan. 

”Tarvitsemme nyt positiivisia visioita tekoälystä ohjaamaan sen kehitystä. Samalla tarvitsemme sen sääntelyä. Mitä kaikkea voimme ulkoistaa tekoälylle? Kenen on vastuu, kun tekoäly tekee huonon päätöksen?” Auvinen pohtii. 

Generatiivinen tekoäly tuottaa keskiarvoja 

Generatiivisia kielimalleja voi käyttää apuna kirjailijan työn eri vaiheissa kuten ideoinnissa, hahmojen ja maailmojen luomisessa, juonen analysoinnissa sekä tekstin tuottamisessa ja editoinnissa.

Nykyisten ilmaispalvelujen rajallisuus tulee kuitenkin nopeasti vastaan. Kohteliasta ja selkeää tekstiä tuottamaan koulutetuilla kielimalleilla on omat tunnistettavat kerrontatapansa sekä informaation saatavuuden ja käsittelyn rajoitteensa, jotka tulevat käyttäjälle pian selviksi. 

Tekstiä generoiva tekoäly tuottaa parhaiten keskinkertaisia tiivistelmiä siitä, mistä on kirjoitettu paljon, ja sellaisia tekstejä, joissa on selkeä rakenne. Ala kuitenkin kehittyy niin nopeasti, että mikä tänään on lähes mahdotonta, voi ensi kuussa olla jo palvelujen vakiotoimintona – ainakin maksullisissa versioissa. Ruckenstein ennustaa, että tekoälypalvelujen seuraava kehitysaskel on teksti- ja kuvageneraattorien yhdistäminen samaan palveluun. 

Kirjailija ja käsikirjoittaja Katri Manninen käyttää generatiivisia kielimalleja monella tavalla työnsä apuna: ”Ideointiprosessi nopeutuu, kun tekoälyllä saadaan tavallisimmat ideat alta pois. Niiden perusteella voidaan itse keksiä omaperäisempiä. Tekoälyyn kannattaa suhtautua kuin huonoon tuottajaan, jolta tulee keskinkertaisia ideoita, tai kaveriin, joka on lukenut kaiken, mutta muistaa välillä väärin ja sekoittaa asioita.”

Palveluita on koulutettu kaikenlaisella netistä löytyvällä informaatiolla, myös virheellisellä ja huonosti kirjoitetulla. Kielimalleilta saa sitä parempia vastauksia, mitä tarkempia pyyntöjä eli prompteja niille osaa antaa. Hyvä prompti kertoo tarkasti mitä halutaan, ja usein myös mitä ei haluta. Promptaus on oma taitonsa, jota pitää erikseen harjoitella.

Manninen vinkkaa, että tekoälyn tuottamaa vastausta voi rajata kertomalla promptissa, että haluaa palvelun matkivan jotakuta aiheesta hyvin tietävää. Esimerkiksi jos haluaa laadukasta psykologista ymmärrystä kirjoittamastaan hahmosta, voi laittaa promptiin, että “kerro kuin olisit huippupsykologi” ja sen jälkeen kuvailla tarkemmin mitä haluaa ja mitä hahmosta on jo keksinyt.  

Kirjailija Olavi Koistinen harrastaa larppaamista ja generoi tekoälyllä ideoita ja taustatietoa larppeihin. ”Esimerkiksi pyydän ensin miljöökuvauksen haluamastani paikasta, että mitä siellä voi olla, ja sitten luomaan esimerkiksi kahdeksan hahmoa ja määrittelemään jokaiselle yhden positiivisen ja negatiivisen ihmissuhteen johonkin toiseen hahmoon.”

Vastuullisuusasiantuntija Auvinen käyttää tekstigeneraattoreita muun muassa oman maailmankuvansa rajojen ylittämiseen. ”Käytän työssäni tekoälyä argumentoimaan omia ajatuksiani ja arvojani vastaan. On asiakkaidenkin etu, että vasta-argumentit on otettu esimerkiksi kampanjasuunnittelussa huomioon.

Auvinen kertoo testanneensa myös englanninkielisen scifin kirjoittamista tekoälyllä: ”Muutaman promptauskierroksen jälkeen siitä tuli yllättävän hyvää.” 

Millä tekoäly on koulutettu?

Tekoälyn käyttäjän tärkeä taito on saatujen vastausten arviointi. Kielimalli voi tuottaa uskottavan kuuloista, hyvin mieleen jäävää tekstiä, mutta sen perusteella ei voi tietää, vastaako koherentti tarina tai todenmukaisen kuuloinen teoria todellisuutta. 

”Faktoja ei kannata kysellä, jos ei tiedä tarkkaan mihin tekoälyn tuottama vastaus perustuu. Jos asiasta on kirjoitettu paljon, silloin siihen voi todennäköisemmin saada oikean vastauksen, mutta muuten kannattaa pyytää tekemään esimerkiksi tiivistelmiä luotettavista kirjoista tai tutkimuksista”, Manninen neuvoo. 

Aina ei myöskään pyritä todenmukaisuuteen, ja fiktiota generoivat muutkin kuin käsikirjoittajat ja romaanikirjailijat. Generatiivisen tekoälyn aikakaudella dis- ja misinformaationkin luomisesta tulee entistä helpompaa ja se leviää laajemmalle. Voi olla vaikea uskoa, ettei realistisen näköinen kuva tai uskottavalta kuulostava teksti olisi totta.  Kuinka paljon pohdimme tai jaksamme tarkistaa eteemme tulevan informaation taustoja?

”Ehkä elämme jo aikaa, jossa faktat eivät enää ole niin tärkeitä vaan tarinointi”, pohtii Ruckenstein.  

Generatiivisen tekoälyn tuottamiin vastauksiin vaikuttaa paljon data, jolla sitä on koulutettu. Nykyisten ilmaispalvelujen kielimallit on koulutettu tuottamaan kohteliasta tekstiä ja välttämään esimerkiksi seksuaalisuuteen, väkivaltaan tai rikosten tekemiseen liittyviä aiheita. Monet käyttäjät pyrkivät kiertämään palveluiden rajoituksia. 

Kielimallien rajat perustuvat ihmisten tekemään työhön. Time-lehti kertoi tammikuussa 2023, että ChatGPT:n koulutukseen käytetyn datan siivous seksistisestä, rasistisesta ja väkivaltaisesta sisällöstä ulkoistettiin Keniaan, jossa pienipalkkaiset työntekijät lukivat ja merkitsivät sopimattomaksi tällaista informaatiota. Moni traumatisoitui työstä, jossa joutui kuukaudesta toiseen käymään läpi esimerkiksi seksuaalista väkivaltaa kuvaavaa sisältöä.

”Tekoäly ei ole neutraalia koneälyä, vaan kuten kiinan kielessä ilmaistaan, ’ihmisen tekemää älyä’. Se toistaa tekijöidensä arvomaailmaa. Mitä nuo arvot ovat, kuka päättää miten ne vaikuttavat esimerkiksi datan käyttöön? Tekoälysovellusten algoritmit ovat liikesalaisuuksia, ja isot firmat kehittävät omia tekoälyjään. Paikalliset tavat valjastaa tekoälyä erilaisiin käyttöihin poikkeavat toisistaan. Kiinalainen tekoäly, venäläinen tekoäly ja yhdysvaltalainen tekoäly ovat tunnistettavasti erilaisia”, Ruckenstein jatkaa. 

Generatiivisen tekoälyn palveluja kehitetään nyt vinhasti eri tarkoituksiin. Tanskassa tekoälyä käytetään jo koulutuksen tukena. Tanskankielinen avoimeen lähdekoodiin perustuva SkoleGPT on tarkoitettu etenkin opiskelijoille ja opettajille. Sen palvelimet sijaitsevat Euroopassa, eikä se kerää dataa käyttäjistään. 

Suomessa suomalainen Silo AI kehittää yhdessä Turun yliopiston tutkijoiden kanssa generatiivista kielimallia esimerkiksi Ylen aineistoihin perustuen. Projektissa painotetaan lähtökohtien ja käytettävyyden avoimuutta. ja mallin halutaan ymmärtävän alueellisia erityispiirteitä. 

Myös taiteilijat ovat huolissaan tekoälyn kouluttamisesta. Moni huomauttaa, ettei ole antanut suostumustaan taiteensa käyttämiseen tekoälyn kouluttamiseen, varsinkin kun generaattoreilla voidaan luoda omaa tyyliä muistuttavaa tekstiä ja kuvaa. Kuvangenerointipalvelua tarjoava Stability AI onkin haastettu oikeuteen tekijänoikeudellisten kuvien luvattomasta käytöstä palvelun kehittämisessä. 

Ulkomaisissa verkkokaupoissa myydään kirjoja, jotka on generoitu tekoälyllä muistuttamaan jonkun muun kirjallista tyyliä. ”Tyyliä ei voi patentoida, ja pastissit ovat sallittuja”, Suvi Auvinen muistuttaa. 

Tekoälyn suhteessa tekijänoikeuksiin liittyy muitakin avoimia kysymyksiä. Esimerkiksi milloin tekoälyn avulla luodussa taiteessa ylittyy teoskynnys ja siten syntyy tekijänoikeus vastauksen promptaajalle? Mistä tietää tarjoaako tekoäly käyttäjälleen tekijänoikeuden alaista materiaalia ja rikkooko sitä käyttämällä tekijänoikeuksia?  

Käsikirjoittaja Manninen pohtii tekoälyllä tehdyn pastissitaiteen ja taiteilijan omien tekemisten eroa: ”Kyllähän se näin taiteilijan näkökulmasta haljulta tuntuu, että tekoälyllä voidaan tehdä tyyliäsi muistuttavia teoksia, mutta täytyy muistaa, että ne ovat keskiarvoja urastasi, eivät sitä, mitä nyt oikeasti tekisit. Taiteilija kehittyy tehdessään, eikä tekoäly voi ennustaa, mitä seuraavaksi teet.”  

Kirjailijan ja tekoälyn työnjako 

Kolmas tärkeä tekoälytaito onkin tunnistaa, mitä tekoäly ei – ainakaan vielä – tee, ja mitä ihminen tekee tekoälyä paremmin. 

”Tekoäly ei ole yhteydessä konkreettiseen maailmaan. Se ei haista, maista eikä tutki maailmaa. Onko tulevaisuuden kirjallisuudessa, jos sitä tehdään vahvasti tekoälyn avustamana, vähemmän tällaisia kuvauksia?” Ruckenstein pohtii. 

Suvi Auvinen ennakoi, että tulevaisuudessa genrekirjallisuutta tuotetaan tekoälyllä. Sellaisilla teoksilla ei olisi tekijää perinteisessä mielessä, vaan eri henkilöt kustantamossa muokkaisivat teosta sen eri vaiheissa. ”Tekoälyn käyttö kirjoittamisessa vastaa enemmän kustannustoimittajan kuin kirjailijan työtä. Mutta kenellä olisi tällaisen teokseen tekijänoikeus?” Auvinen pohtii. 

Katri Manninen ei kannata sitä, että viihdettä tuotetaan perustuen paljolti aiempaan viihteeseen. Opettaessaan Aalto-yliopistossa käsikirjoittamista hän neuvoo opiskelijoita: ”Mene ulos, elä, rakasta, särje sydämesi! Pohjaa tarinasi oikeaan elämään, tyyppeihin joita olet kohdannut, tunteisiin joita olet kokenut, silloin ne koskettavat muitakin ihmisiä.

Suvi Auvinenkin painottaa, että kirjailijan paikka on maailmaa tutkimassa: ”Tietokirjailijan pitää tutkia maailmaa, mennä sinne, missä ei ole vielä käyty, ja selvittää sitä mitä ei ole vielä selvitetty, luoda siitä tietoa. Maailmassa on esimerkiksi paljon vähemmistökulttuureita, joista ei ole paljon kirjoitettua tietoa.”  

Ruckensteininkin mielestä parhaita tietokirjoja ovat sellaiset, joissa kirjailija on mennyt paikan päälle ja kertoo näkemästään ja kokemastaan.

Tekoäly toimii sen sijaan hyvin esimerkiksi valmiin tekstin analysoinnissa tai tiivistelmien tekemisissä. Ruckenstein ja Manninen painottavat, että tekoälyn tuottama teksti pitää aina tarkistaa ja yleensä sitä pitää myös editoida, vaikka se olisi esimerkiksi tiivistelmä omasta työstä. Parhaimmillaan tekoälyn luoma palaute auttaa huomaamaan ja sen myötä korjaamaan tekstin heikkouksia. 

Auvinen uskoo, että generatiivinen tekoäly voi moninaistaa kirjallisuuden kenttää: ”Se auttaa heitä, joille tekstin tuottaminen on eri syistä hankalaa, kertomaan paremmin omia tarinoitaan. Ja kun kääntäminen helpottuu, saamme luettavaksemme enemmän eri kulttuureihin kuuluvien ihmisten tarinoita.”

Kysymys ihmisen paikasta oppivien koneiden maailmassa on myös laajempi, filosofinen: Jos tekoäly tekee kaiken, tai voi tehdä mitä vain, mikä silloin jää ihmisen tehtäväksi? 

”Tekoälyn lähtökohtaisena arvona on tehokkuus. Jos sille ei määritellä muita arvoja, niin mitä me tehostamme?” Ruckenstein kysyy. ”Mitä me haluamme tehdä? Millä on arvoa? Ja mihin tekoälyn tuomaa tuottoa käytetään?”



Prompti ChatGPT:lle: Kirjoita viiden lauseen infolaatikko generatiivisesta tekoälystä.

Vastaus: Generatiivinen tekoäly on kehittyneempi tekoälyn muoto, joka kykenee luomaan uutta sisältöä, kuten kuvia, tekstiä tai ääntä, autonomisesti. Se perustuu syväoppimisen algoritmeihin ja voi tuottaa realistisia ja monipuolisia luomuksia, jotka muistuttavat ihmisten tuottamaa sisältöä.
Generatiivisia tekoälysovelluksia voidaan käyttää esimerkiksi kuvanluomisessa, luovan kirjoittamisen tukemisessa ja puheentunnistuksen parantamisessa. Ne voivat myös tuottaa realistisia deepfake-videoita, mikä herättää eettisiä kysymyksiä liittyen väärinkäyttöön.
Tällaiset järjestelmät perustuvat suureen datamäärään ja vaativat monimutkaista koulutusta. Generatiivinen tekoäly tarjoaa valtavan potentiaalin luovuuden, viihteen ja monien muiden alojen kehittämisessä ja automatisoinnissa.

Jostain syystä ChatGPT:n antama vastaus oli kuuden lauseen mittainen.