Tekoälyasiantuntijat nostavat esiin muun muassa laajan ja syvällisen tutkimustyön, järkeilevät kielimallit ja koodaamisen.
Jos tekoäly-yhtiöiden markkinamiehiltä kysyy, sellaista suurta kielimallia eli kansankielisesti tekoälyä ei ole julkaistukaan, joka ei olisi huikaiseva, häkellyttävä, ennennäkemätön tai uskomaton.
OpenAI:n loppuvuodesta 2022 julkaisema Chat GPT -työkalu nousi valtavaan suosioon, mutta mitkä sen jälkeisistä kehitysaskeleista ovat asiantuntijoiden mielestä oikeasti merkittäviä?
Tekoälykouluttaja Antti Merilehdon mukaan yksi vaikuttavimmista muutoksista on ollut niin sanotun syvätutkimuksen kehittyminen. Yksinkertaistaen syvätutkimuksella tarkoitetaan sitä, että kielimallille voidaan esittää monimutkaisia kysymyksiä, joihin vastatakseen se etsii suuren määrän internetistä löytyvää tietoa, käy läpi käyttäjän antamia aineistoja, yhdistelee eri tietoja ja tekee sen perusteella päätelmiä.
Lue myös: Brittikunta kopioi pitkän uran tehneen työntekijänsä tekoälyksi
– (Pennsylvanian yliopiston professori) Ethan Mollick on kertonut, että hänen kollegansa oli tehnyt vertaisarvioidun tasoisen artikkelin omalta tieteenalaltaan näillä työkaluilla ihan avoimesti. Mollick sanoi, että se olisi ollut häneltä itseltään viikkojen työ, vaikka olisi jättänyt opetusvelvoitteensa tekemättä, Merilehto kertoo.
Koodaajan apulainen
Toinen merkittävä vaikkakin kapeampialainen muutos on Merilehdon mukaan tapahtunut siinä, miten tekoälytyökaluja voi käyttää koodaamisen apuna. Esimerkiksi Cursor-kehitystyökalussa koodin kaikkia merkkejä ei tarvitse kirjoittaa käsin, vaan tekoäly tekee ehdotuksia seuraavista koodiriveistä aiemman koodin perusteella. Tekoälytyökalut pystyvät myös etsimään koodista bugeja eli virheitä ja korjaamaan niitä. Tämä muuttaa ohjelmistokehittäjän työtä.
– Esimerkiksi yhdellä asiakkaistamme ei ole yhtään ohjelmistokehittäjää, joka ei käytä Cursoria aktiivisesti työssään. Se tuottavuusero on niin valtava. Nämä työkalut eivät olleet näin hyviä viime syksynä, Merilehto sanoo.
Merilehdon mielestä useimpiin tietotyöläisten tarpeisiin jo aiempien mallien ominaisuudet ovat olleet tarpeeksi hyviä. Pullonkaula on pikemminkin siinä, mitä niillä tehdään.
– Näen monessa kohtaa sen, että työkalut ovat riittävän hyviä, on sitten kyseessä Chat GPT tai (Microsoftin) Copilot. Kyse on siitä, miten me ihmiset otamme nämä käyttöön, Merilehto sanoo.
Lue myös: Kannattaako esseetä kirjoittaa ChatGPT:llä? Tutkijat kiirehtivät havaintonsa julkaisua
Myös Aalto-yliopiston professori ja tekoälytutkija Jaakko Lehtinen on vaikuttunut tekoälytyökalujen annista koodaukselle.
– Koodaustyökalut ovat nousseet sille tasolle, että saan aikaan tunnissa asioita, joihin entisessä maailmassa olisi pitänyt paneutua viikoksi, eikä koko hommaa olisi siksi tullut koskaan tehtyä, hän kertoo.
Samalla pelkät hyvät työkalut eivät kuitenkaan riitä korkeatasoiseen koodaamiseen.
– Kokemus ja näkemys siitä, mitä todella halutaan ja mitkä ovat toivottuja ja ei-toivottuja ratkaisuja, on todella tärkeää, Lehtinen sanoo.
Järkeilyllä ongelmien kimppuun
Lehtisen mukaan yksi olennaisimmista kehityksen alueista ovat järkeilevät kielimallit. Perusmuotoiset suuret kielimallit käytännössä yrittävät arvata, mikä olisi järkevä seuraava sana tai sanan osa, joka lisätä tekstiin. Pelkästään seuraavia sopivia sanoja arvaamalla on kuitenkin hyvin vaikea ratkaista esimerkiksi monimutkaisia matemaattisia ongelmia tai harkita eri vaihtoehtoja, punnita niitä ja päätelmien tuloksella valita oikea vaihtoehto.
– Mutta nämä järkeilevät mallit käyvät sellaista sisäistä monologia, jossa ne lähtevät miettimään asiaa auki ja kyselevät itseltään, voisiko olla näin tai noin. Ne vertailevat eri vaihtoehtoja ja sen perusteella päättävät, mitä kertovat käyttäjälle. Tämä järkeilykyky selvästi muuttaa sitä, mihin ja miten visaisiin ongelmiin näitä malleja voi käyttää, Lehtinen kertoo.
Lehtisen mukaan mallien käyttämän järkeilyn taso on aivan viime aikoina kohonnut merkittävästi.
Iso asia on Lehtisen mukaan myös mallien multimodaalisuus eli kyky käsitellä tekstin lisäksi myös kuvia, ääntä ja videoita. Nykyiset mallit osaavat esimerkiksi kuvailla hyvinkin tarkasti, mitä erilaisissa kuvissa näkyy.
– Se, että mallit kykenevät ottamaan sisäänsä tietoa muutenkin kuin siitä, mitä kirjoitan näppäimistöllä, lisää niiden voimaa huomattavasti.
Lehtinen ei ole yllättynyt siitä, että suurten kielimallien ja tekoälytyökalujen käyttöönotto ei ole vielä olennaisesti tehostanut työelämää. Aikaa kun on kulunut varsin vähän.
– Sehän on vanha, yleisesti tiedossa oleva seikka, että teknologisissa murroksissa ihmisillä ja yhteiskunnilla on taipumusta yliarvioida muutoksen nopeutta ja aliarvioida muutosten suuruuksia. Pidän aika naiivina ajatusta, että jokin näin uusi olisi voinut tässä ajassa fermentoitua niin joka puolelle yhteiskuntaa ja liike- ja talouselämää, että vaikutukset voisivat olla vielä tässä vaiheessa kovin merkittäviä, Lehtinen sanoo.