AfterDawn logo

Tekoälyfirmat löysivät eurooppalaiset antikvariaatit ja ostavat varastoja tyhjiksi

Petteri Pyyny Petteri Pyyny

Eurooppalaiset divariyrittäjät eli antikvariaattien omistajat ovat havahtuneet hämmentävään ilmiöön.

Amerikkalaiset ja kanadalaiset tuntemattomalta vaikuttavat firmat ovat ryhtyneet ostamaan niiden hyllyissä vuosia lojuneita kirjoja, jotka eivät ole kiinnostaneet ketään enää vuosikausiin.

Ja kirjoja ostetaan paljon.

Siis todella, todella paljon. Vähintäänkin satojatuhansia.

Kirjat eivät ole myöskään mitään varsinaisia klassikoita, vaan pääasiassa täysin sattumanvaraisilta vaikuttavia, vanhentuneita kirjoja, joilla ei oikeastaan ole minkäänlaista jälleenmyyntiarvoa - eli ne eivät kiinnostakaan ketään. Esimerkiksi muinaisia tietosanakirjasarjoja, vanhoja keittokirjoja, elämäkertoja ja niin edelleen.

Eli käytännössä kirjoja, jotka antikvariaatitkin olisivat pian kippaamassa kierrätysjätteeksi ja joita antikvariaatit eivät suostu enää itse ottamaan vastaan, edes ilmaiseksi.

Sveitsin yleisradio käy läpi (saksaksi) yhtä tällaista tapahtumaketjua, jossa kanadalainen firma nimeltä Zoom Books on ostanut lavatolkulla kirjoja pitkin Eurooppaa ja rahdannut ne valtameren yli itselleen.


Myyjien mukaan Zoom Booksin ostamat kirjat ovat juurikin sellaisia, joita kukaan ei ole ostanut vuosikausiin ja joille ei yksinkertaisesti ole enää lainkaan kysyntää.

Artikkelin mukaan varastoissa Zoom Booksille meneviä kirjoja on pelkästään Saksassa 700 000 ja ja ympäri maailmaa vähintäänkin kolme miljoonaa kirjaa odottaa eteenpäin lähetystä.

Taustalla on mitä ilmeisimmin Yhdysvaltain tekijänoikeuslainsäädännön mahdollistama porsaanreikä.

Digitaalisista teksteistä luvatta tekoälyn koulutukseen napattujen teosten omistajilla on hyvin vahva selkänoja tukenaan, jos he haluavat haastaa tekoälyfirmat oikeuteen teostensa luvattomasta käytöstä. Mutta mitä ilmeisimmin tekoälyfirmat ovat keksineet, että jos ne skannaavat fyysisiä kirjoja, joista ei ole enää tehty uusintapainoksia ja tuhoavat kyseiset kirjat sen jälkeen, niin toiminta sujahtaisi amerikkalaisen ns. fair use -käytännön alle, tehden siitä laillista.

Tosin tuo puolustus ei vaikuta olevan aivan aukoton: tekoälyjätti Anthropic joutui sovittelemaan 1,5 miljardilla eurolla oikeusjutun, jossa se oli skannannut vuoren kirjoja ilman tekijänoikeuksien omistajien lupaa.

"Kadonneita" kirjoja haalitaan tekoälyfirmojen käyttöön pääasiassa siksi, että kaikki verkossa oleva teksti on jo napattu tekoälyfirmojen suurten kielimallien koulutusmateriaaliksi.

Lisäksi uutta, vuoden 2022 joulukuun jälkeen verkkoon syntynyttä sisältöä ei uskalleta syöttää tekoälymallien koulutusmateriaaliksi. Syynä on tietysti se, että tuolloin julkaistiin ChatGPT ja sen jälkeen jatkuvasti kasvava osa verkon uudesta sisällöstä on luotu tekoälyn avulla.

Mikäli tekoälyä koulutetaan sen itse kirjoittamalla sisällöllä tarpeeksi kauan, päädytään tilanteeseen, jossa tekoälymallien laatu romahtaa täydellisesti. Tuota pistettä kutsutaan model collapseksi eli malliromahdukseksi.


Joten helpoin uuden, "puhtaan" koulutusmateriaalia lähde näyttäisivät olevan "tarpeettomat" vanhat kirjat, joita ei ole koskaan julkaistu verkossa eikä niitä löydy edes kirjastoista.

KOMMENTOI

Haluatko kommentoida tätä artikkelia?
Kirjaudu sisään tai Luo uusi käyttäjätunnus.

Seuraa! Kirjekuoren symboli
Uutiskirje
Threadsin logo
Threads
Blueskyn logo
Bluesky
Mastodonin logo
Mastodon
Sulje palkki