Generatiivinen tekoäly kehittyy nyt huimaavalla vauhdilla.
Muun muassa ChatGPT:n voimin teknologia-alan merkittävimpien yhtiöiden noussut OpenAI on esitellyt nyt ensimmäisen videoita luovan tekoälymallinsa, joka onkin heti melkoisen vakuuttava.
OpenAI:n Sora-tekoälymalli luo lyhyiden tekstipyyntöjen perusteella korkeintaan minuutin mittaisia videoita. Videoiden laatu on jo hämmästyttävällä tasolla. OpenAI:n verkkosivuilta löytyy runsaasti esimerkkejä Soralla luoduista videoista ja niiden luomiseen käytetyistä tekstipyynnöistä.
Käytännössä muutamalla lauseella voi kuvailla haluamaansa videota, jonka jälkeen Sora-tekoälymalli luo varsin korkealaatuisen videon aiheesta. Kyseessä ei myöskään ole vähäpätöiset animoinnit, vaan monipuolista videomateriaalia, joissa voi olla mukana paljon liikettä ja tapahtumia monipuolisissa ympäristöissä useilla hahmoilla. Lisäksi pääosin Soran pitäisi onnistua toteuttamaan liike videoilla fysiikan lakien mukaisesti.
Sora luo myös koko videon kerrallaan, eikä erikseen ruutu ruudulta. Tämä ratkaisee OpenAI:n mukaan joitakin muita nähtyjä videoita luovia tekoälymalleja piinaavia johdonmukaisuuden ongelmia.
Toistaiseksi OpenAI:n videoita luova Sora-tekoälymalli on vasta kehitysvaiheessa eikä sitä tuoda nyt laajasti saataville. Sen sijaan OpenAI tarjoaa Soran rajatusti testikäyttöön sen jatkaessa kehitystyötä esimerkiksi mitä tulee turvallisuuteen ja käytön rajoituksiin. Pyrkimyksenä on estää Soran käyttö esimerkiksi misinformaation levittämiseen tai muun haitallisen sisällön luomiseen. Turvatestaajien lisäksi OpenAI tarjoaa kuitenkin Soran kokeiltavaksi myös taitelijoille, suunnittelijoille ja elokuvantekijöille.
Videoiden luomisen osalta Sora ei kaikesta vakuuttavuudestaan huolimatta myöskään ole täydellinen, vaan nykyisellä mallilla on heikkoutensa, OpenAI myöntää. Sora saattaa monipuolisissa skenaarioissa epäonnistua fysiikan lakien mukaisen liikkeen esittämisessä, eikä se välttämättä ymmärrä tiettyjä syy- ja seuraussuhteita. Esimerkkinä tästä OpenAI mainitsee, että videolla henkilö voi puraista keksiä, mutta myöhemmin keksi onkin täysin tallella.
Silti, jo nyt Soran luomat videot ovat hengästyttävän laadukkaita ja on helppo nähdä, kuinka kehityksen jatkuessa Sora ja muut tekoälymallit tulevat perustavalla tavalla mullistamaan kaikkea liikkuvan kuvan sisällöntuotantoa.
Soran luomat videot on tarkoitus merkitä metatiedoilla, jotka kertovat kyseessä olevan tekoälyn luomasta sisällöstä.
OpenAI:n toimitusjohtaja Sam Altman on myös jakanut X-palvelussa hänelle esitettyjen pyyntöjen perusteella Soran luomia videoita. Näiden lisäksi kannattaa ehdottomasti käydä OpenAI:n verkkosivuilla katsomassa esimerkkivideoita.