Tekoäly läpäisi Turingin testin

Petteri Pyyny

15. June, 2024 19:39

Brittiläinen matemaatikko Alan Turing kehitti nimeään kantavan Turingin testin vuonna 1950.

Testi oli vuosikymmeniä aikaansa edellä, sillä mikroprosessorien aikakauden alkuunkin oli vielä matkaa pienen ikuisuuden verran.

Turingin testissä pyritään arvioimaan sitä, onko tietokoneohjelma saavuttanut sellaisen uskottavuuden tason, että vastakumppani luulee keskustelevansa oikean ihmisen kanssa. Turingin testiä on pidetty tekoälytutkijoiden keskuudessa eräänlaisena maalina, johon tekoälyn kehityksessä on pyritty jo vuosikymmenten ajan.

Live Science tiedejulkaisun mukaan ryhmä tutkijoita laittoi uusimmat tekoälymallit tieteelliseen kokeeseen, jossa tutkittiin, läpäisisivätkö ne jo Turingin testin.

Testiryhmään kerättiin 500 ihmisosallistujaa. Jokainen testiin osallistunut keskusteli neljän eri "henkilön" kanssa, tietokoneen näppäimistön välityksellä, viiden minuutin ajan. Kunkin keskustelutuokion jälkeen osallistujan piti arvioida, oliko vastapuoli ihminen vai tietokoneohjelma.

Luonnollisesti ihmisten epäilys siitä, onko vastapuoli sittenkään oikea ihminen, on myös noussut valtavasti viimeisen puolentoista vuoden aikana, ChatGPT:n julkaisun jälkeen. Joten aivan ummikkoina eivät kokeeseen osallistujat siihen sännänneet.

Testissä neljä haastateltua koeyksilöä olivat OpenAI:n GPT3.5 -tekoäly, GPT4 -tekoäly, ELIZA-tietokoneohjelma sekä yksi oikea ihminen.

GPT3.5 oli se tekoälymalli, jolla ChatGPT julkaistiin vuoden 2022 lopulla. GPT4 on puolestaan ChatGPT:n maksullisen version nykyisin käyttämä tekoälymalli (kyseessä ei ollut kuitenkaan vielä uudempi GPT4o -tekoäly).

Hauskan vivahteen antoi ELIZAn ottaminen mukaan testiin. ELIZA oli ihmismäistä keskustelua matkiva ohjelma, joka julkaistiin 1960-luvull. Sen innoittamana syntyi myös vuonna 1982 julkaistu kotimainen Kalle Kotipsykiatri.

ELIZA ei siis ole ns. oikea tekoäly, vaan pikemminkin sääntöpohjaisesti vastauksia keskusteluun muodostava, perinteisellä logiikalla toimiva ohjelmisto.

Testissä ELIZA arvioitiin oikeaksi ihmiseksi 22 prosentissa tapauksista, GPT3.5 arvioitiin oikeaksi ihmiseksi tasan puolessa tapauksista ja GPT4:sta erehdyttiin luulemaan oikeaksi ihmiseksi 54 prosentissa tapauksista.

Vastaavasti oikeaa ihmistä arvioitiin oikeaksi ihmiseksi kahdella kerralla kolmesta (67%), joka kuvastanee viimeisen puolentoista vuoden aikana noussutta, hyvin skeptistä suhtautumista siihen, onkohan vastapuoli sittenkään enää ihminen.

Tutkijoiden mukaan Turingin testin läpäiseminen on tavallaan huolestuttava merkki tekoälyn kehityksessä, koska aina vain ihmismäisempään keskusteluun pystyvä tekoäly saattaa aiheuttaa "laajoja sosiaalisia ja taloudellisia vaikutuksia" yhteiskuntaamme.

Turingin testiä on myös kritisoitu voimakkaasti ja monet tutkijat ovat sitä mieltä, että sen tilalle pitäisi kehittää paremmin tekoälyn "älykkyyttä" mittaavia testejä.

TÄMÄN UUTISEN KOMMENTOINTI ON PÄÄTTYNYT