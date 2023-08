Maailman kenties tunnetuin sanomalehti The New York Times on kieltänyt uusituissa käyttöehdoissaan sisältönsä käytön tekoälyn koulutukseen.

Viimeisen vuoden aikana läpimurtonsa tehneiden suurten kielimallien eli LLM:ien suosio ja vahvuus pohjautuu siihen, että niille on syötetty valtava määrä sisältöä. LLM-tyyppinen ns. generatiivinen tekoäly oppii sisällöstä yhdistelemään sanoja ja asiayhteyksiä omien kaavojensa avulla. Tunnetuin LLM on tietysti ChatGPT.

Tällainen malli on äärimmäisen ongelmallinen nykyiselle lainsäädännölle, joka ei tunnista konseptia lainkaan. Sinänsä generatiivinen tekoäly ei kopioi sisältöä mistään, vaan yhdistelee asioita.

Onko se sitten laitonta? Samalla logiikalla voidaan sanoa, että kaikki maailman kirjat vain yhdistelevät sanakirjoista löytyviä sanoja, joten ne rikkovat sanakirjojen tekijänoikeuksia.



Mutta asiasta tultaneen vääntämään oikeutta tulevina vuosina pitkään ja hartaasti. Sitä odotellessa New York Times on siis nyt kieltänyt sivuiltaan löytyvien uutisten ja artikkelien käytön tekoälyjen koulutuksessa, ellei yhtiöltä pyydetä erikseen lupaa.

Aiemmin New York Timesin sisällöllä koulutetut mallit tietystikin ovat muutoksen ulottumattomissa - niihin on aikanaan sen hetken sisältö kaadettu sisään ja sitä ei sieltä enää pois oteta. Mutta tulevien kielimallien koulutuksessa puuttuu jatkossa yksi tunnetuimmista sanomalehdistä.