Tutkimuksessa tarkasteltiin neljää tunnettua tekoälyavustajaa.
Tekoälyavustajat tekivät virheitä lähes puolessa tapauksista, kun niiltä kysyttiin uutistapahtumista, selviää Euroopan yleisradioliiton EBU:n tutkimuksesta. Tutkimuksessa tarkasteltiin neljää tunnettua tekoälyavustajaa, OpenAI:n ChatGPT:tä, Microsoftin Copilotia, Googlen Geminiä ja Perplexityä.
45 prosentissa kaikista tutkituista tapauksista tekoälyavustajat olivat tehneet ainakin yhden merkittävän virheen riippumatta kielestä tai maasta. Joka viides vastaus sisälsi merkittäviä puutteita, kuten vääriä yksityiskohtia ja vanhentunutta tietoa.
0:53Katso myös: Näin helposti syntyy “radiohitti” tekoälyllä.
Tutkimus tehtiin touko-kesäkuun vaihteessa ja siihen osallistui 22 mediaa 18 maasta ja 14 eri kielellä. Suomesta tutkimukseen osallistui Ylen suomen- ja ruotsinkielisiä toimittajia. Kaikki toimittajat esittivät samoja kysymyksiä tekoälyavustajille.
Gemini selviytyi heikoimmin
Neljästä tekoälyavustajasta tutkimuksessa selviytyi heikoimmin Gemini, jolla oli 76 prosentissa vastauksissa merkittäviä ongelmia, yli kaksi kertaa enemmän muihin tutkittuihin avustajiin verrattuna.