OpenAI on julkaissut ChatGPT Images 2.0:n, joka tuo monia merkittäviä parannuksia kuvien luomiseen ChatGPT:ssä.
OpenAI itse kuvaa päivitystä merkittäväksi harppaukseksi erityisesti ohjeiden ymmärtämisessä, tekstin renderöinnissä ja kuvien sommittelussa.
ChatGPT Images 2.0 on saatavilla nyt kaikille ChatGPT- ja Codex-käyttäjille, mutta maksullisilla tilauksilla onnistuu kaikkein kehittyneempien ominaisuuksien hyödyntäminen. Mobiililaitteilla vaaditaan viimeisin sovellusversio.
ChatGPT Images 2.0 tuo mukanaan kaksi erilaista toimintatilaa, jotka on suunnattu eri käyttötarkoituksiin. Instant-tila keskittyy nopeuteen ja tuottaa kuvia nopeasti säilyttäen hyvän laadun. Thinking-tila puolestaan käyttää enemmän aikaa analysointiin ennen kuvan luomista, mikä mahdollistaa johdonmukaisemmat ja monimutkaisemmat lopputulokset.
Thinking-tilan avulla voidaan esimerkiksi säilyttää hahmojen yhtenäisyys useissa kuvissa, rakentaa visuaalisia tarinoita sekä luoda storyboard-kuvia ja sarjakuvia.
Huomattava muutos kuvien luomiseen on mahdollisuus hyödyntää niiden luomiseen verkosta haettua tietoa.
ChatGPT Images 2.0 tuo myös suuren muutoksen siihen, miten käyttäjät ovat vuorovaikutuksessa työkalun kanssa. Kuvien luominen ei ole enää välttämättä vain yksittäinen pyyntö ja lopputulos, vaan jatkuva prosessi. Käyttäjät voivat muokata kuvaa keskustelemalla tekoälyn kanssa, zoomata ja muuttaa yksityiskohtia sekä säätää sommittelua ilman alusta aloittamista.
OpenAI on parantanut myös tekoälyn kykyä käsitellä eri kieliä, erityisesti ei-latinalaisia kirjoitusjärjestelmiä kuten japania, kiinaa ja hindiä.
Lisäksi mallin kerrotaan noudattavan visuaalisia tyylejä tarkemmin sekä tuottavan realistisempia ja johdonmukaisempia kuvia.
ChatGPT Images 2.0 pyrkii siirtymään viihteellisestä kuvien luomisesta entistä vahvemmin korti varteenotettavaa työkalua. OpenAI:n mukaan mahdollisia käyttökohteita ovat esimerkiksi pelikehitys, visuaalinen suunnittelu, markkinointimateriaalit sekä sarjakuvat ja tarinankerronta.
Teknisesti järjestelmä tukee useita kuvasuhteita (3:1–1:3), jopa 2K-tarkkuutta sekä useiden kuvien luomista kerralla.