Petteri Pyyny
17. marraskuuta, 2023 21:06
Maailmassa on harvoja sukupolvien väliset kuilut täydellisesti ylittäviä asioita, mutta rauhallisella äänellä selostetut luontodokumentit ovat yksi merkittävä poikkeus, jonka lähes kaikki tunnistavat.
David Attenborough is now narrating my life
Ja maailman tunnetuin luontodokumenttien selostaja on tietysti brittiläinen David Attenborough, joka on isolta osaltaan itse muokannut sitä, millaisena luontodokumentit olemme oppineet tuntemaan.
Läpi vuosien ja vuosikymmenten aina toisinaan joku ihminen on pohtinut, millaista olisikaan, jos joku selostaisi omaa elämää taustalla - samalla tarkkuudella ja objektiivisuudella, jolla luontodokumentteja selostetaan.
Kiitos useiden eri tekoälyn jättiharppausten, se on nyt täysin mahdollista. Ei välttämättä täysin luvallista, mutta täysin mahdollista.
Itsekin tekoälyn parissa työskentelevä Charlie Holtz päätti yhdistää kahden eri yrityksen tekoälytuotteet, itse kehittämäänsä pieneen koodinpätkään ja lopputulos on hämmentävä.
Kamera seuraa Holtzin toimintaa ja kaiken aikaa taustalla Attenborough'n (ilman lupaa käytetty) ääni selostaa tapahtumia, hyvin, hyvin samaan tapaan kuin itse herra selostaisi luontodokumentin tapahtumia.
Mitenkö koko kokonaisuus toimii?
Holtzin oma skripti, nimeltään narrator eli selostaja, nappaa viiden sekunnin välein kuvan webbikamerasta, joka kuva Holtzia itseään. Sen jälkeen kuva lähetetään OpenAI:n GPT4V -tekoälylle, joka osaa tulkita kuvia. Kuvaa pyydetään tulkkaamaan promptaamalla siten, että pyyntö pyytää kuvailemaan kuvan tapahtumia samaan tapaan kuin Attenborough kuvailisi luontodokumenttia.
Lopuksi saatu tekstimuotoinen kuvaus lähetetään toisen tekoäly-yhtiön, ElevenLabsin, rajapinnalle. Kyseinen rajapinta on Holtzin toimesta koulutettu käyttämään Attenborough'n ääntä, syöttämällä sille katkelmia Attenborough'n oikeasti puhumista tallenteista. Tähän ei ole kysytty Attenborough'n lupaa, joten laillisesti tässä kohti liikutaan hyvin harmaalla alueella.
Mutta lopputulos on huikea. Videolla Holtzin juodessa vettä, tekoäly kuvailee tapahtumia vapaasti suomennettuna näin:
Here's a GPT-4-vision + @elevenlabsio python script so you can star in your own Planet Earth: pic.twitter.com/desTwTM7RS
Odotamme mielenkiinnolla, milloin ensimmäinen kokeilija päättää asettaa Samuel L Jacksonin oman elämänsä selostusääneksi.