Googlelta merkittävä päivitys kuvien luomiseen Gemini-tekoälypalvelussa

Gemini tuottaa nyt kuvia aiempaa luotettavammin.

Google kertoo tekoälynsä ylittävän myös tekoälymallien perinteisen esteen.

Generatiiviseen eli tuottavaan tekoälyyn perustuvat palvelut osaavat nykypäivänä tuottaa mitä näyttävimpiä kuvasisältöjä luonnollisella kielellä kirjoitettujen kehotteiden perusteella. Usein tekoälymalleilla on kuitenkin vaikeuksia käyttäjän pyytäessä jälkikäteen muokkaamaan tiettyjä kuvan osa-alueita, mihin Google on pyrkinyt etsimään parannuksia Gemini-päivityksineen.

Päivitys, nimeltään Gemini 2.5 Flash Image, osaa tarkemmin erottaa kuvasta mukautettavat ja ennalleen jäävät asiat käyttäjän toiveita tulkitessaan. Käyttäjä voi esimerkiksi pyytää muokkaamaan aiemmin tuotetussa kuvassa esiintyvän ihmisen hiusten väriä, minkä tekoäly myös sujuvasti tekee.

Gemini osaa myös luoda uusia kokonaisuuksia olemassa olevista kuvista.

Tavanomaisesti tekoälymallit, kuten ChatGPT:n tai Grokin taustalla olevat mallit, lisäävät muokattuihin kuviin myös niihin kuulumattomia yksityiskohtia, jolloin hiusten ohella myös esimerkiksi vaatetus tai tausta voisivat mennä uuteen uskoon, aiheesta kirjoittava TechCrunch taustoittaa.

Uusien kyvykkyyksien ansiosta Gemini osaa myös esimerkiksi liittää kaksi kuvaa yhdeksi kokonaisuudeksi. Googlen esimerkissä erillisistä, koiraa ja nuorta naista esittävistä kuvista tehdään yksi kuva.

Sama malli useissa eri tilanteissa Geminin tuottamana.

Googlen julkaisemien tilastojen mukaan Gemini 2.5 Flash Image on kilpailijoitaan tehokkaampi kuvanmuokkaukseen liittyvissä tehtävissä, ja hakukonejätin julkaisemat esimerkit ovatkin jo ehtineet herättää ihailua esimerkiksi viestipalvelu X:ssä.

Kuvia tuottava tekoäly on viime kuukausina noussut valtavaan suosioon. Aiemmin tänä vuonna OpenAI joutui rajoittamaan palvelunsa saatavuutta GPT-4o-kielimallin innottaessa miljoonia tuottamaan valtavan määrän mitä erilaisimpia valokuvia. Nähtäväksi jää, saako myös Gemini 2.5 Flash Image osakseen samanlaista suosiota.