ChatGPT sai kehittyneemmän kuvien luontitoiminnon - perustuu GPT-4o-malliin

ChatGPT luo nyt kuvia aiempaa taitavammin. Uudistusten taustalla on kehittynyt GPT 4o -tekoälymalli.

Tekoälypalvelu ChatGPT on saanut suuren päivityksen, jonka tulisi merkittävästi parantaa tekoälyn tuottamia kuvia. Pitkään käytössä ollut DALL-E 3 -kuvamalli on korvattu GPT 4o -mallilla, joka alun perin julkaistiin jo keväällä 2024.

OpenAI:n mukaan ChatGPT osaa jatkossa tuottaa tarkempia ja realistisempia kuvia sekä huomioida käyttäjän toiveet monipuolisemmin. Myös tekstin lisääminen kuviin, mikä on perinteisesti ollut tekoälylle vaikeaa, on nyt sujuvampaa.

Lisäksi ChatGPT:tä voi monipuolisemmin käyttää jo olemassa olevien kuvien muokkaamiseen tai luoda uusia sisältöjä niiden perusteella. Niin ikään uusia taiteellisia ja visuaalisia tyylejä on saatu lisättyä mukaan, OpenAI luettelee.

Täydellinen GPT 4o:aan perustuva kuvien luonti ei kuitenkaan ole. Pitkulaiset kuvasuhteet, tarkat muokkaukset ja yksityiskohtien viimeistely saattavat yhä tuottaa ongelmia ChatGPT:lle, minkä ohella tekoäly ei välttämättä osaa lisätä kuviin tekstiä kielillä, jotka eivät käytä latinalaisia aakkosia.

Jos taas kehote eli ChatGPT:lle annettu kirjallinen ohje on hyvin yksinkertainen, saattaa myös niin kutsuttua hallusinointia esiintyä. Hallusinoinnista on kyse, kun tekoäly lisää tuotoksiin jotakin keksittyä tai asiaan kuulumatonta.

Kaikki ChatGPT:n luomat kuvat sisältävät C2PA-metadataa, joten tekoälyn käytöstä jää tuotoksiin jälki. Tekoäly ei liioin suostu tuottamaan nimettyjä henkilöitä tai laittomuuksia, kuten eroottisia sisältöjä, OpenAI huomauttaa.

ChatGPT:n kehittyneempi kuvien luontitoiminto on nyt julkaistu kaikille ChatGPT Plus-, Pro-, Team- ja Free-käyttäjille. Myös ilmaiskäyttäjät voivat siis kokeilla paranneltua, GPT 4o -malliin perustuvaa kuvien tuottamista.

Alla olevalla videolla ChatGPT:n uudistuksia esitellään tarkemmin.