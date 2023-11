Tekoälystä on tullut osa arkeamme. Sen kehittäminen ei ole avointa. Mikko Huotari

Ensimmäinen kerta on useimmille hämmentävä kokemus. Toisia se ällistyttää, toisia ahdistaa tai suututtaa. Tekoälysovellus Chat GPT:n kanssa käyty vuoropuhelu vaikuttaa ensi kokeiluilla niin inhimilliseltä, että tekee mieli kurkata, onko koneen sisällä joku.

– Ihmisiä hämää se, että Chat GPT käyttää kieltä. Ihmiselle kieli on ajattelevien olentojen kommunikoinnin väline, tietojenkäsittelytieteen professori Hannu Toivonen Helsingin yliopistosta sanoo.

Vanhastaan meille on tuttua, että koneet ovat ihmistä voimakkaampia ja tietokoneet pystyvät ällistyttävään laskentanopeuteen numeroiden kanssa, mutta kun kone alkaa luoda kieltä kuin ihminen, olemme hämillämme.

Chat GPT -sovellus avattiin yleisölle vuoden 2022 loppupuolella. Se pystyy ”ymmärtämään” ja tuottamaan ihmisille luontaista kieltä. Chat GPT on niin sanottu kielimalli, eli se on opetettu operoimaan kielen kanssa siten, että sille on syötetty valtavat määrät tekstejä, kirjoja, artikkeleita ja keskusteluja. Ohjelma on analysoinut, miten ihmiset ilmaisevat itseään ja käyvät keskustelua.

– Kielimallit pystyvät erittäin hyvin tuottamaan tekstiä, jossa ihminen näkee mielekkäitä merkityksiä, mutta itse ohjelma ei kuitenkaan niitä merkityksiä näe, Toivonen sanoo.

– Ihmiselle kielen tehtävänä on välittää merkityksiä. Ja nyt kun meillä on tietokoneohjelma, joka käyttää kieltä ja keskustelee meidän kanssamme kielen välityksellä, tulkitsemme vaistomaisesti, että siellä on toisella puolella ajatteleva olio, joka käsittelee merkityksiä kuten mekin.

Chat Gpt on vielä ”sirkuseläin”

Kielimalli osaa luoda kieliopillisesti melko hyvää tekstiä. Suureen aineistoon nojaten se ennustaa sana sanalta, kuinka teksti jatkuu. Yksinkertainen versio seuraavan sanan ennustamisesta on Googlen hakukenttä. Kun aloittaa kirjoittaa ”onko mahdollista”, niin hakukoneen tekoäly yrittää arvata seuraavaksi nakuteltavia sanoja aikaisemmin tehtyjen hakujen perusteella. Tällä kertaa sen ensimmäinen arvaus on: ”onko mahdollista nukkua silmät auki”. Chat GPT toimii siis samantapaisella idealla, mutta se on opetettu huomattavasti suuremmista aineistoista sekä pidemmistä teksteistä.

Chat GPT ei ole missään mielessä tietoinen eikä sillä ole omia ajatuksia, mutta se osaa matkia ihmisviestintää niin hyvin, että sen kanssa voi käydä sujuvan oloista keskustelua.

Kun Chat GPT:tä on käyttänyt jonkin aikaa, sen tuottama teksti alkaa tuntua innottomalta ja etäiseltä. Sen voi pyytää tekemään juhlapuheen tai lehtijutun, mutta jälki on loppujen lopuksi kovin geneeristä. On vaikea kuvitella, että esimerkiksi presidenttiehdokas käyttäisi kielimallin kirjoittamaa kampanjapuhetta ja ihmiset olisivat siitä haltioissaan. Toki puheen tekemisessä voi käyttää apunaan tekoälyä.

Chat GPT on kiinnostava sovellus, mutta tällä hetkellä vielä eräänlainen sirkuseläin, jota käydään ihmettelemässä, ihastelemassa ja naureskelemassa. Sosiaalisessa mediassa on julkaistu paljon esimerkkejä siitä, kuinka ”tyhmä” Chat GPT on. Se saattaa suoltaa välillä aivan täyttä potaskaa, vaikka muodollisesti kielioppi näyttää olevan kohdallaan. Sen ydinosaamista ei olekaan faktat ja niiden tarkastaminen, vaan sanojen asettaminen peräkkäin. Ohjelman nettisivulla ilmoitetaan selvästi: Chat GPT voi tehdä virheitä.

Toivosen mukaan koneoppimiseen perustuva ohjelma voi olla vain niin hyvä kuin sen opetusaineisto ja suunnittelu. Chat GPT ei pysty ymmärtämään tehtäviä samalla tavalla kuin ihminen. Se matkii saamaansa dataa, mutta pystyy tekemään sen erittäin taitavasti.

Mitä tekoäly on? Metafora.

Tekoäly on toistuvasti median otsikoissa. Ilmiöön ladataan ihmisten toiveita ja pelkoja. Sen toivotaan antavan supervoimat ja ratkaisevan ilmastonmuutoksen ongelmat tai sen pelätään vievän ihmisiltä työt ja jopa tuhoamaan maailman.

– Tekoäly on hirvittävän hankala ja laaja käsite, koska eri ihmiset tarkoittavat sillä eri asioita. Tekoäly-termissä erityisen vaikeaa on äly-sana, joka herättää erilaisia mielikuvia ja käsityksiä, Toivonen sanoo.

– Tutkijan näkökulmasta tekoäly on sateenvarjokäsite, joka kattaa tietyt tutkimusalueet, joiden tavoitteena on saada tietokoneet toimimaan mahdollisimman tarkoituksenmukaisesti.

Toivonen on kirjoittanut kirjan Mitä tekoäly on? (Teos, 2023), jossa hän avaa ilmiötä kansantajuisesti. Hän lähtee liikkeelle siitä, että tekoäly on metafora. Kielikuvan tarkoituksena on rinnastaa tietokoneohjelman toiminta inhimilliseen älykkääseen toimintaan. Metaforat voivat kuitenkin johtaa harhaan. Tietokoneohjelma ei ole samalla tavalla älykäs kuin ihminen.

(Juttu jatkuu kuvan alla.)

Tekoäly ei ole tieteisfantasiaa, vaan sitä on jo kaikkialla ja se vaikuttaa arkeemme monella tavalla. Tekoälyohjelmat auttavat karttaohjelmaa löytämään ripeimmin reitin päämäärään, kameran kasvontunnistus käyttää tekoälyä, sosiaalisen median palvelut soveltavat tekoälyä näyttäessään suosittuja päivityksiä käyttäjille. Nämä kaikki ovat jo niin tuttuja ja arkipäiväisiä ominaisuuksia, että niitä harvemmin edes mielletään tekoälyksi.

Useimmiten tekoälyllä viitataan kehitteillä oleviin sovelluksiin, jotka mahdollistavat jotain aivan uutta.

– Median otsikoissa annetaan usein myös kuva, että tekoäly on itsenäinen toimija. Otsikko voisi olla esimerkiksi: tekoäly urkkii salasanoja. Siinä on vain kolme sanaa, mutta otsikkoon mahtuu aika monta virhettä, Toivonen sanoo.

– Ensiksi, ei ole olemassa mitään yhtä tekoälyä, vaan on lukematon määrä erilaisia ohjelmia. Toiseksi, siinä sanotaan tekoälyn urkkivan eli olevan aktiivinen toimija, eli tietokoneohjelma päättäisi ryhtyä urkkimaan salasanoja. Todellisuudessa joku on tehnyt ohjelman, jolla voi urkkia salasanoja.

Sanavarastossamme ei ole tarkkoja termejä monille tietokoneohjelmien toiminnoille ja ominaisuuksille. Kun puhutaan esimerkiksi, kuinka tekoäly ymmärtää luonnollista kieltä, niin ymmärtäminen on tässä yhteydessä metafora.

– Ei ole olemassa selvää sanaa sille, mitä tietokone siinä tekee, ja sen vuoksi käytetään metaforaa: ymmärtäminen. Riski on se, että kuulijoilta ja puhujaltakin unohtuu se, että kyseessä on kielikuva, Toivonen sanoo.

– Tietokoneohjelma ei ymmärrä tekstiä samalla tavalla kuin ihminen ymmärtää. Luonnollisen kielen ”ymmärtäminen” tarkoittaa, että ohjelma osaa reagoida tarkoituksenmukaisella tavalla tekstiin, joka sille syötetään. Se ei välttämättä ymmärrä sen merkitystä.

Tekoälyn kehittäminen ei ole avointa

Tekoälyn vaikutukset alkavat levitä yhä laajemmin kaikille elämänalueille. Sen kehittäminen ja käyttäminen synnyttää entistä monimutkaisempia eettisiä kysymyksiä. Tekoäly on myös muutakin kuin kielimalleja. Tärkeitä kehityskohteita ovat muun muassa konenäkö ja neuroverkot, mutta kielimalleja kehitetään nyt kaikkein innokkaimmin.

Yhdysvaltalainen Time-lehti paljasti tammikuussa, että Chat GPT:n omistava Open AI oli käyttänyt kehitystyössä kenialaista halpatyövoimaa. Kielimalli piti opettaa tuottamaan vähemmän myrkyllistä tekstiä, koska aikaisempi versio oli satunnaisesti generoinut esimerkiksi rasistisia ja väkivaltaisia tekstejä. Kenialaiset työntekijät altistuivat traumatisoivalle materiaalille, kun joutuivat seulomaan väkivaltaa ja seksuaalista hyväksikäyttöä sisältäviä tekstejä alle kahden euron tuntipalkalla.

Työ oli tarpeellista, mutta sen teettäminen halpatyövoimalla oli vähintäänkin arveluttavaa.

Kielimalli on ikään kuin opetusaineistonsa peili. Jos se opetetaan internetin kaikella materiaalilla ilman seulontaa, se apinoisi myös vihapuhetta, seksismiä ja myös kaikkea muuta pimeää puolta, jota netistä löytyy.

Tekoälyn kehittäminen ei ole avointa.

– Chat GPT:n kehittäjät eivät kerro, mitä heidän opetusaineistonsa on. Emme saa siis tietää, kuinka tasapuolisesti siellä käsitellään eri sukupuolia, kulttuureja, ihmisryhmiä. He eivät myöskään kerro, miten varmistavat, että se olisi tasapuolinen. Toki he itse varmaan siihen pyrkivät, Toivonen sanoo.

Koneoppimisen perusideana on etsiä säännönmukaisuuksia sille syötetystä datasta. Koneen löytämistä säännönmukaisuuksista tehdään malli, jonka avulla kone voi suorittaa tarkoituksenmukaisia tehtäviä. Koneoppiminen toimii hyvin esimerkiksi silloin, kun röntgenkuvista etsitään rintasyöpää. Kone havaitsee jopa lääkäriä paremmin syövän.

Koneoppiminen voisi olla näppärä keino tutkia menneitä oikeudenkäyntejä ja niiden perusteella tehdä juridisia johtopäätöksiä. Se pystyy salamannopeasti käymään läpi ällistyttävän määrän tekstejä. Tässä tosin ongelmaksi nousee opetusaineisto. Menneisyydessä on sukupuoleen ja etniseen taustaan liittyvää syrjintää, joten kone toistaisi ja jopa korostaisi päätöksissään niitä samoja syrjiviä ratkaisuja.

Tekoälyn kehittäjät ja rahoittajat vaikuttavat vääjäämättä jonkin verran siihen, minkälaista jälkeä tekoäly tuottaa. Toivonen kirjoittaa kirjassaan, että tekoälyllä on sukupuoli ja jopa ihonväri. Se on valkoinen mies. Väittämä ei viittaa biologisiin tai fysiologisiin ominaisuuksiin, vaan siihen, että valkoiset miehet hallitsevat tekoälyn kehitystä ja aineistoa. Siksi tekoälyä käyttävät ohjelmat vastaavat heidän maailmankuvaansa ja kokemushorisonttiaan.

Laki suitsimaan tekoälyä

Tekoälyn käyttöä säädellään pian EU:ssa lailla, jos suunnitelmat toteutuvat. Siitä tulee maailman ensimmäinen kattava tekoälylaki. Tavoitteena on varmistaa, että uuden teknologian riskit ja haitat minimoidaan. Uusissa säännöissä asetetaan velvoitteita tekoälyjärjestelmien valmistajille ja käyttäjille.

Jos tekoälyjärjestelmä aiheuttaa uhan ihmiselle, sen käyttö kielletään. Tällainen uhka on esimerkiksi yksilöiden tai tiettyjen heikossa asemassa olevien ryhmien käytöksen manipuloiminen, kuten vaikkapa ääniaktivoituvat lelut, jotka kannustavat lapsia vaaralliseen käytökseen. Kiinassa käytössä oleva sosiaalinen pisteytys ja kasvojen etätunnistus on tarkoitus kieltää EU:ssa. Tunnistamisessa voi olla joitakin poikkeuksia, kun tutkitaan vakavia rikoksia.

– Asetusluonnoksen mukaan EU rajoittaa sovelluksia, joilla tekoälyä voidaan käyttää tarkoituksella toisia ihmisiä vastaan, tai joihin liittyy riskejä epätasa-arvoisesta kohtelusta. Sellaisesta olisi esimerkkinä tekoälyn tekemät opiskelijavalinnat tai rekrytointi, Toivonen sanoo.

– Tarkoituksena on varmistaa, että kansalaisiin vaikuttavat tekoälyohjelmat toimivat oikein ja että virhetilanteisiin on varauduttu. Samaan tapaan kuin asetetaan kriteerit lääkintälaitteille. Ne täytyy suunnitella, testata ja dokumentoida huolellisesti, Toivonen sanoo.

Tietoinen kone?

Lopuksi vielä ripaus tieteisfantasiaa. Milloin tekoäly kehittyy niin eteväksi, että se tulee tietoiseksi itsestään?

– Tietoisuutta on vaikea määritellä ja vielä vaikeampi mitata tai todentaa, Toivonen aloittaa vastaamisen.

– Jos ajatellaan tietoisuutta itsestä, niin täytyy varmaan olla olemassa jokin itse, joka on erillään jostain muusta.

Hän arvelee, että koneen tietoisuudelle ei ole mitään periaatteellista estettä. Ensin koneen pitäisi ehkä elää jossain ympäristössä, jossa se voisi tulla itsestään tietoiseksi.

Ihmisen tietoisuuden kannalta avainasemassa on sosiaalinen vuorovaikutus. Samanlaisen tietoisuuden saavuttaakseen koneen täytyisi elää kuin ihminen.

– Jos jokin tietokone tulee joskus tietoiseksi, niin ehkä sen tietoisuus on toisenlaista kuin meidän tietoisuutemme.