Googlelta hurja tekoälyjulkistusten vyöry - näin Google-haku, Android ja monet palvelut kehittyvät

Google esitteli tänään Google I/O -tapahtumassaan odotetusti uusia kehitysaskeleitaan tekoälyn saralla.

Googlen mukaan se on tuonut Gemini-tekoälyn jo kaikkiin yli 2 miljardin käyttäjän palveluihinsa. Yhteensä Google I/O:n avausesityksessä AI eli tekoäly mainittiin 120 kertaa, Google kertoi tilaisuutensa päätteeksi.

Tänään Google keskittyikin erityisesti tekoälyyn, ja esimerkiksi Android 15:n uudistuksista kuullaan lisää vasta keskiviikkona julkaistavan Android 15 Beta 2:n myötä.

Google esitteli jo viime vuonna hakukoneensa laajan generatiivisen tekoälyn uudistuksen, joka tuolloin kulki nimellä Search Generative Experience ja tuli saataville testiversiona. Uudistuksen myötä sopivissa hakukyselyissä Google tuottaa perinteisten sivustolinkkien yläpuolelle generatiivisen tekoälyn luoman yleiskatsauksen aiheesta.

Nyt Google kertoi, että haun uudet tekoäly-yhteenvedot (englanniksi nyt nimeltään AI Overviews)  tulevat yleisesti saataville Yhdysvalloissa tästä viikosta alkaen ja valituissa muissa maissa pian. Kuluvan vuoden loppuun mennessä Google-haun tekoäly-yhteenvedot tulevat olemaan Googlen mukaan jo yli miljardin ihmisen käytössä.

”Google googlaa puolestasi”, Google kuvaili tekoäly-yhteenvetojen tuloa osaksi hakukonettaan.

Google kehittää haun tekoälytoiminnallisuutta luonnollisesti myös eteenpäin, ja tuo uudistuksia testattavaksi aluksi Labsin kautta. Jatkossa haku osaa esimerkiksi tehdä matkasuunnitelmia tai ateriaideoita useammalle päivälle, kun se oppii pilkkomaan kysymyksiä osiin, jotka se ratkaisee erikseen. Google antoi myös yhden esimerkin siitä, kuinka Google-haku voi auttaa ei vain löytämään lähellä olevia pilates-saleja, vaan myös selvittämään niiden aukioloajat ja antamaan suoraan ohjeet varauksen tekemiseksi – kaiken tämän vain yhdellä haulla.

Google-hakuja voi lisäksi jatkossa tehdä tekstipyynnön tai kuvan lisäksi myös videoon perustuen.

Googlen tekoälytoimintojen taustalla ovat sen Gemini-tekoälymallit. Ne toimivat osana Googlen Gemini-palvelua, eli vastinetta OpenAI:n ChatGPT:lle, sekä Gemini-tekoälytoimintoja eri Googlen sovelluksissa.

Google kertoi Gemini Advanced -tilauksensa toimivan nyt Gemini 1.5 Pro -mallin 1 miljoonan tokenin konteksti-ikkunalla, eli mahdollisella pyynnön pituudella, ja olevan saatavilla jo 35 eri kielellä. 1 miljoonia tokenia mahdollistaa esimerkiksi 1 500 sivua pitkän asiakirjan lähettämisen osana pyyntöä.

Samalla Google julkisti Gemini 1.5 Pro -mallinsa konteksti-ikkunan laajentuvan jatkossa myöhemmin tänä vuonna 2 miljoonaan tokeniin. Aluksi uudistus tulee saataville kehittäjille.

Google esitteli myös uuden Gemini Flash 1.5 -version, Gemini 1.5 Prohon verrattuna kevyemmän mallin, joka suunniteltu nopeaksi ja kustannustehokkaaksi laajassa käytössä. Gemini 1.5 Flash tukee kuitenkin Pron tavoin 1 miljoonan tokenin konteksti-ikkunaa sekä multimodaalisia pyyntöjä, eli tekstin ohella esimerkiksi kuviin perustuvia kysymyksiä.

Gemini-sovellustaan Androidilla Google kehittää kontekstitietoisemmaksi. Gemini ymmärtää jatkossa sen mitä laitteen näytöllä tapahtuu ja voi auttaa siihen perustuvissa kysymyksissä. Tämän myötä myöhemmin tänä vuonna Androidilla mahdolliseksi tulee raahata ja pudottaa generatiivisen tekoälyn luomia kuvia Google Messages -viestisovellukseen ja Gmailiin kuin myös kysyä kysymyksiä YouTube-videoista, tai PDF-tiedostoista, jos käytössä on Gemini Advanced -tilaus.

Jatkossa Gemini korvaa myös oletuksena Googlen vanhan avustajapalvelun Google Assistantin Androidilla.

Samsungin huippulaitteissa ja Googlen omissa Pixel-laitteissa esiteltyä ja jo yli 100 miljoonassa laiteessa saatavilla olevaa Circle to Search -hakua Google on kehittänyt myös älykkäämmäksi. Circle to Search osaa jatkossa auttaa erilaisissa matemaattisissa ja muissa kysymyksissä, auttaen esimerkiksi opiskelijoita suorittamaan kotitehtävänsä ja oppimaan siinä sivussa.

Lisäksi Google kertoi myöhemmin tänä syksynä Pixel-laitteissaan nähtävän ensimmäisenä uuden version kevyestä, laitteessa suoraan toimivasta Gemini Nano -tekoälymallista, joka kehittyy multimodaaliseksi eli ymmärtämään tekstin lisäksi esimerkiksi puhetta ja kuvia. Mielenkiintoinen uusi ominaisuus malliin perustuen on huijauspuhelujen tunnistus: tekoäly kuuntelee taustalla puheluja ja varoittaa havaitessaan kyseessä voivan olla huijauspuhelu.

Androidin TalkBack-helppokäyttöisyystoiminto on myös kehittymässä laitteessa toimivan Gemini Nanon hyödyntämisen myötä. TalkBackin luomat kuvien tekstikuvaukset ovat jatkossa selkeämpiä ja monipuolisempia.

Google demosi myös tekoälyagenttien tulevia mahdollisuuksia osana eri palvelujaan. Tekoälyagentit ovat älykkäitä järjestelmiä, jotka eivät tarjoa vain vastauksia vaan hoitavat asioita käyttäjän puolesta. Esimerkiksi Google Shoppingin osaksi Google esitteli mahdollisuutta, jossa Gemini-pohjainen tekoälyagentti voi pyydettäessä järjestää kokonaisuudessaan verkkokaupasta ostetun tuotteen palautuksen.

Tekoälyagenttien osalta ollaan vasta alkutekijöissä, kommentoi Googlen toimitusjohtaja Sundar Pichai, eikä Google kertonut vielä yksityiskohtaisista julkaisusuunnitelmista.

Laajemmin Google esitteli kuitenkin jo myös Project Astraa, joka on universaali tekoälyagentti, joka toimii avustajana. Palvelulle voi esittää erilaisia kysymyksiä esimerkiksi kameran reaaliaikaisesta kuvasta. Googlen ennakkoon tallennetussa videodemossa esiteltiin esimerkiksi, kuinka Astra kertoi mitä tietokoneen näytöllä näkyvä koodi tekee tai missä ikkunasta kuvatun maiseman perusteella käyttäjä on.

Osan Project Astran ominaisuuksista kerrottiin olevan tulossa osaksi Gemini-sovellusta myöhemmin tänä vuonna.

Käytännössä Gemini-sovelluksen toimintaa kohti Astran visiota Google kehittää Gemini Live -toiminnallisuudella, joka sujuvoittaa palvelun käyttöä puhuen. Gemini Live -uudistuksen myötä Gemini vastaa puhuttuihin kyselyihin lyhyesti ääneen. Puhenopeus mukautuu käyttäjän mukaan. Lisäksi Geminin vastauksen voi keskeyttää pyytääkseen esimerkiksi tarkennusta.

Gemini Live on tulossa saataville Gemini Advanced -tilaajille tulevina kuukausina. Lisäksi myöhemmin tänä vuonna Gemini-sovelluksessa voi käyttää kameraa ja kysyä sen kautta näkyvistä asioista kysymyksiä.

Tulevina kuukausina Google on myös mahdollistamassa Geminin kustomoinnin Gems-versioilla. Ne mahdollistavat Geminin muokkaamisen eri tavoin sopimaan omiin käyttötapoihin, sisältäen esimerkiksi pääsyn omiin Google Drive -tiedostoihin. Käytännössä Gems-versiot voivat olla esimerkiksi jonkin tietyn aihealueen eksperttejä.

Yksi Googlen esittelemä Gems-versio on opiskeluavustaja, joka luo vaihe vaiheelta eteneviä ohjeita opiskeluun. Tämä versio hyödyntää Googlen erityisesti oppimiseen suunnattuja Geminiin perustuvia LearnLM-sarjan tekoälymalleja, joissa hyödynnetään opetuksellista tutkimustietoa.

Yksittäisistä muista Googlen sovelluksista Google Kuvat -sovelluksen hakutoiminto on kehittymässä älykkäämmäksi Gemini-tekoälyn avulla tästä kesästä alkaen. Hakuja voi tehdä jatkossa luonnollisilla kyselyillä puhuen tai kirjottaien.

Google mainitsi esimerkkinä mahdollisesta hausta unohtuneen auton rekisterinumeron etsimisen tai kaikkien eri kansallispuistoissa otettujen kuvien esittämisen.

Google Workspace -sovellusten osalta Gemini 1.5 Pro -tekoälymalli tulee saataville tänään Workspace Labsin kautta ja yleisesti ensi kuusta alkaen. Esimerkiksi Gmailissa sivupalkin kautta voi pyytää yhteenvetoja sähköposteista sekä esimerkiksi niiden sisältämistä tehtävistä. Yhteenveto-ominaisuus tulee saataville ensimmäisille käyttäjille nyt toukokuusta alkaen.

Gmailin sähköposteista tekemien yhteenvetojen lisäksi Gmail saa kattavamman generatiiviseen tekoälyyn pohjautuvan haun, Gmail Q&A:n, joka tarjoaa vastauksia sähköpostien sisältämiin tietoihin perustuen.

Kolmas Gmailin uudistus ovat kontekstitietoiset Smart Reply -vastausehdotukset, jotka sopivat tilanteeseen ja huomioivat aiemmat keskustelut.

Gmail Q&A ja kehittyneemmät Smart Reply -vastaukset ovat tulossa saataville heinäkuusta alkaen.

Googlen NotebookLM-palvelu, jonka avulla voi kysyä kysymyksiä palveluun tallennetuista asiakirjoista, päivittyy puolestaan uusilla ääniyhteenvedoilla, jotka ikään kuin luovat podcasteja muistuttavan keskustelun kahden keskustelijan välillä halutusta aiheesta asiakirjoihin perustuen.

Google esitteli myös uudistuksia kuvia, musiikkia ja videoita luovien tekoälymalliensa osalta. Kuvia luovan Imagen-tekoälymallin uusi 3-versio on entistä realistisempi ja yksityiskohtaisempi.

Googlen musiikin luomisessa avustava työkalu puolestaan on YouTuben alla julkaistu Music AI Sandbox.

Videoiden luomiseen Google esitteli Veo-mallia, joka luo yli minuutin mittaisia 1080p-tarkkuuden videoita teksti- kuva- tai videopyyntöjen perusteella erilaisissa elokuvallisissa tyyleissä. Videoita voi myös muokata erilaisilla pyynnöillä. Google tuo Veo-mallin tarjolle uuden VideoFX-työkalun kautta jonotuslistalle liittyneille käyttäjille.

Tekoälylaskentaa datakeskuksissaan tehostamaan Google esitteli uuden sukupolven TPU-suorittimistaan, nimeltään Trillium. Googlen mukaan Trillium tarjoaa jopa 4,7-kertaisen parannuksen laskentatehossa verrattuna edeltävään TPU v5e -sukupolveen.

Kehittäjille Google julkisti myös kaksi uutta avoimen koodin tekoälymallia, mukaan lukien kesäkuussa saataville tulevan Gemma 2:n, josta on tulossa 27 miljardin parametrin kokoinen malli. Gemma 2 toimii TPU- tai GPU-suorittimilla ja peittoaa mittauksissa Googlen mukaan jopa kaksi kertaa suuremmat mallit. Toinen uusi malli on PaliGemma, joka on optimoitu kuvien tekstittämiseen, visuaalisiin kysymyksiin ja muuhun kuvien merkitsemiseen.