Viikon suurin tekoälyjulkaisu jäi GPT4:n varjoon: Midjourney V5 on käsittämättömän upea kuvia tuottava tekoälyjulkaisu

Petteri Pyyny
19. maaliskuuta, 2023 20:40

Viikon tekoälyuutisoinnissa suurimman näkyvyyden nappasi itselleen GPT-4 -kielimallin julkaisu, mutta sen varjossa tapahtui kenties vieläkin suurempi julkistus.
Kenties tämän hetken paras kuvia luova tekoäly Midjourney päivittyi tällä viikolla, kun Midjourney V5 julkaistiin.

Ja jos vielä vuosi sitten ensimmäiset DALL-E:n luomat tekoälykuvat olivat hieman happotrippimäisiä piirrustuksia, on Midjourneyn uusin versio jo suorastaan käsittämättömän upea.
Midjourneyn viides versio on parantunut merkittävästi etenkin ihmisten ja fotorealismin osalta. Mielenkiintoisin kulma sen toiminnassa on kuitenkin siinä, että nykyisin parhaat tulokset saadaan erittäini pitkillä kuvauksilla siitä, mitä tekoälyn halutaan tarkalleen ottaen tuottavan.

Tähän liittyen monet näppärimmät Midjourneyn käyttäjät ovatkin siirtyneet malliin, jossa he kirjoittavat lyhyen kuvauksen siitä, mitä haluavat ja syöttävät sen vaikkapa ChatGPT:lle ja pyytävät ChatGPT:tä luomaan pidemmän, kuvailevamman pyynnön eli promptin. Tuo tekoälyn luoma laajempi kuvaus sitten pulautetaan Midjourneylle ja tulokset ovat .. hämmästyttäviä.

Alla muutama taideteos Midjourney v5:n käyttäjiltä:

Joe Biden muotitähtenä
Maailman johtajat muotinäytöksen malleina

Supergirl kasvuvaiheet
Supergirl lapsuudesta aina supersankaruuteen saakka


Kirjastonhoitaja
Kirjastonhoitaja, kuvattuna kuten tunnettu valokuvaaja Ansel Adams hänet kuvaisi

Pikachu-kakku
Ensimmäinen yritys Pikachu-kakun teossa



Ja näitähän riittää. Jos Midjourneyn kokeilu kiinnostaa, avasimme Midjourneyn toimintalogiikkaa tarkemmin alkuvuodesta.

Tyttö lukemassa kirjaa



Yllä oleva kuva tytöstä lukemassa kirjaa on luotu juurikin sekä Midjourneyta että GPT4-tekoälyä hyödyntäen.

Prosessi on avattu Redditissä tarkemmin, mutta alkuperäinen ihmisen luoma pyyntö oli siis lyhyt ja yksinkertainen:

blonde magical academy student


...jonka tekoäly laajensi sitten tällaiseksi kuvaukseksi:
A captivating and enchanting photograph of a blonde student at a magical academy, immersed in her studies amidst the enchanting atmosphere of an ancient library filled with spellbooks and magical artifacts. The young student is dressed in the academy's traditional robes, adorned with the emblem of her house, as she intently reads a dusty tome that levitates before her, held aloft by a spell she has expertly cast. The photograph is beautifully composed using a Nikon D850 DSLR camera and a Nikkor 35mm f/1.8 lens, known for its sharpness and ability to render rich, vibrant colors. The camera settings are carefully chosen to capture the magical essence of the scene: an aperture of f/2, ISO 800, and a shutter speed of 1/60 sec, allowing the subtle, flickering glow of enchanted candles to illuminate the library's mysterious depths. The composition thoughtfully employs a shallow depth of field, placing the focus on the blonde student while the library's ancient, towering bookshelves fade softly into the background, adding a sense of wonder and intrigue to the scene. The photograph is further enhanced by the delicate play of light and shadow cast by the candles, casting a warm, ethereal glow that highlights the student's determination and passion for her magical studies. --ar 3:2 --q 2 --v 5


Eli kahden tekoälyn yhdistelmällä päästään hämmentävän hyviin lopputuloksiin. Tietysti, jos oma kielipää taipuu kuvailemaan tavoiteltua asiaa hyvinkin seikkaperäisesti, Midjourney toiminee suoraan tarpeisiisi.

Lue myös nämä
Tägit
tekoäly Midjourney
Käytämme evästeitä sivuillamme. Näin parannamme palveluamme.