Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Keskusteleva tekoäly kehittyi pikavauhtia osaksi teknojättien varustelua – kilpailu isoista rahoista kovenee vaaroista välittämättä

9.3.2023
Kuva: Eeva Anundi

Joulukuun alussa kirjauduin paljon keskustelua herättäneeseen OpenAI:n ChatGPT tekoälysovellukseen. Ensimmäinen kysymykseni ChatGPT:lle oli: ”Miksi tilastot ovat tärkeitä?”

Luin ChatGPT:n vastausta sitä mukaa kun se ilmestyi ruudulle: ”Tilastot ovat tärkeitä, koska ne auttavat ihmisiä ymmärtämään erilaisia tosiasioita ja ilmiöitä paremmin. Tilastojen avulla voidaan esimerkiksi tutkia, mikä on suosittua tai mikä on yleistä tietyssä väestöryhmässä…” Olin välittömästi täysin myyty: tästä tekoälystä kuullaan vielä! 

Jo kolmas kysymykseni ”Suomen väestö 1900-luvulla” paljasti kääntöpuolen. ChatGPT väitti vastauksessaan, että vuoden 1945 jälkeen Suomeen muutti paljon ihmisiä muista maista. Tartuin tähän ja totesin, että ”Muuttoliike Suomeen oli hyvin vähäistä vuosina 1945–1980”. Ja mitä ChatGPT vastasi?  ”Väärin. Suomeen muutti paljon ihmisiä erityisesti vuosina 1945–1980, ja muuttoliike oli tuolloin hyvin vilkasta. Tämä johtui osittain siitä, että Suomi oli sotien jälkeen vakaassa taloudellisessa ja poliittisessa tilanteessa, mikä houkutteli monet ihmiset muuttamaan tänne…”

Microsoft julkisti helmikuun alussa (7.2.), että OpenAI:n kehittämä – ja Microsoftin osittain rahoittama – ChatGPT-toiminnallisuus tuodaan osaksi Microsoftin Bing-hakukonetta. Google vuorostaan oli jo joulukuussa julistanut sisäisen hälytystilan ChatGPT:n julkistamisen ja sen saaman suuren suosion vuoksi. Google ilmoitti pikapikaa Microsoftin julkistamistilausuuden alla pitävänsä oman julkistamistilaisuuden jo päivää ennen eli 6.2. Se ilmoitti tuovansa omaan hakuunsa Bard-nimisen vastineen ChatGPT:lle.

Mitä hittoa?! ajattelin. Olinhan jo ehtinyt joulukuusta lähtien testata ChatGPT:tä ja saanut vielä tammikuussa kysymykseeni ”Mikä on Suomen valtiomuoto?” vastauksena ChatGPT:ltä: ”Suomen valtiomuoto on perustuslaillinen monarkia…” Kysyin tietysti seuraavaksi: ”Kuka on Suomen kuningas?” Ja ChatGPT vastasi faktana, että ”Suomen kuningas on tällä hetkellä Kustaa Vaasa. Hän valittiin Suomen kuninkaaksi vuonna 2019…" 

Miltähän tällaiset vastaukset näyttävät Googlen tai Bingin hakukoneissa muutaman kuukauden tai jopa viikon kuluttua?

ChatGPT on keskusteleva kielimalli, jonka GPT-osa tulee sanoista generative pre-trained transformer eli generatiivinen esikoulutettu muuntaja. Googlen tutkijat julkaisivat vuonna 2017 GPT-kielimallin perusteet tai peruskoodit, ja tästä perusmallista on kehitetty niin ChatGPT, Microsoftin Bing-keskusteleva tekoäly kuin Googlen Bard-keskusteleva tekoäly. 

Miksi Google ei ensimmäisenä julkistanut keskustelevaa tekoälyä omaan Google-hakuunsa? Syitä on ainakin kaksi: varovaisuus ja raha.

Miten hakukoneen brandiin vaikuttaisi esimerkiksi oheinen Bingin kanssa käyty jankkaus Kalle Päätalon vaimoista (huom. katso uutisesta myös keskustelun videoklippi)? GPT-kielimallin ”ominaisuuksiin” kuuluu käytännössä myös se, että tekoäly keksii asioita ja vastaa vakuuttavasti keksimänsä varmana tietona. Tätä kutsutaan jo ”hallusinoinniksi”.

Bing on jo avattu halukkaille testikäyttöön jonotusperiaatteella. Microsoft on siis hylännyt varovaisuuden ja julkistanut tekoälynsä tietäen, että vastaavia hallusinaatioita hakukoneeseen liitetylle tekoälylle tulee jatkossakin.

Raha puhuu: Microsoft on jo investoinut miljardi dollaria ChatGPT:n kehitykseen mm. tarjoamalla massiivista laskentatehoa pilvipalvelussaan. Lisäksi se on ilmoittanut rahoittavansa OpenAI/ChatGPT:n kehitystä edelleen 10 miljardilla dollarilla.

Google joutuu nyt haastajansa pakottamana lähtemään tanssiin Microsoftin kanssa, kuten Microsoftin toimitusjohtaja Nadella sanoi haastattelussaan. Tässä tanssissa Googlella on hävittävänään hakunsa varma tulovirta.

Microsoft ja Google ovat päättäneet julkaista keskustelevat tekoälynsä puolivalmiina tietäen, että ne antavat oikeiden ja hyödyllisten tietojen lisäksi myös vääriä tietoja. Teknojätit aikovat siis tehdä korjauksia ja säätöjä sitä mukaa kun ongelmia tulee eteen.

Sadat miljoonat, jopa miljardit palveluiden käyttäjät tulevat toimimaan tekoälyjen koekaniineina. Varmaa on vain se, että yllätyksiä tulee. Ja isoista rahoista on myös kyse: keskusteleva tekoäly on vain kolme kuukautta julkistamisensa jälkeen murtamassa yli 20 vuotta kestänyttä maailman suurimman mainostoimiston eli Google-haun taloudellista perustaa. 

Samalla tekoälyt todennäköisesti mullistavat tiedon hakemisen tavat uuteen asentoon. Haasteena on se, että tiedon hakemiseen (eli hakukoneisiin) liitetään mukaan keskusteleva tekoäly, joka tuottaa valmiita ja hyvin uskottavan oloisia vastauksia erilaisiin kysymysmuotoisiin lauseisiin. 

Vastaus voi vaihdella: hieman eri muotoisiin kysymyslauseisiin voi tulla erilainen vastaus. Vastaukset myös muuttuvat ajassa, kun tekoälymallin tiedot täydentyvät. Kahta samanlaista vastausta ei samaan kysymykseen välttämättä lainkaan saa. Se, miten tekoälyn tuottama vastaus on tarkalleen ottaen koostettu, on prosessina ”musta laatikko”.

Paljon jää uuden hybridin eli ”keskustelevan hakukoneen” käyttäjän vastuulle. Tyytyvätkö käyttäjät tekoälyn tuottamiin vastauksiin sellaisenaan, mikä varsinkin kännykällä voi olla houkuttelevan helppo vaihtoehto?

Aiemmin hakukoneella tietoa hakevan tuli arvioida (käytännössä) parin kolmen ensimmäisen hakutuloksena olleen sivuston tiedontuottajan luotettavuutta sekä relevanssia suhteessa kysyttyyn asiaan. Nyt haetun tiedon voi halutessaan saada aivan valmiina ilman, että tarvitsee itse selata ensimmäistäkään sivua haetun tiedon löytämiseksi ja vieläpä valmiiksi kirjoitetun vastauksen muodossa. Vaivautuvatko käyttäjät valmiin – mutta mahdollisesti virheellisen – vastauksen saatuaan vielä tarkistamaan uuden hybridihakukoneen vastaukseen liittämiä linkkejä eri lähteisiin, lukemaan ne ja arvioimaan tiedon laatua itse? 
 
Markku Huttunen työskentelee kehittämispäällikkönä Tilastokeskuksen Viestintä ja verkostot -ryhmässä. 
 
Linkkejä: 

https://blogs.microsoft.com/blog/2023/02/07/reinventing-search-with-a-new-ai-powered-microsoft-bing-and-edge-your-copilot-for-the-web/ 

https://blog.google/technology/ai/bard-google-ai-search-updates/ 

https://arxiv.org/abs/1706.03762 

https://www.talouselama.fi/uutiset/suomalaiskirjailija-kysyi-chatgptlta-kalle-paatalon-vaimoista-botilla-meni-pata-niin-jumiin-etta-lopputulos-oli-huvittavaa-jankutusta/898fd58b-4772-4aa8-8530-e4a4a5edc9b1 

https://www.businessinsider.com/microsoft-ceo-new-bing-making-google-show-can-dance-bard-2023-2?r=US&IR=T 

https://albertoromgar.medium.com/google-vs-microsoft-microsofts-new-bing-is-a-paradigm-change-for-search-and-the-browser-add7f987d30e 

https://albertoromgar.medium.com/google-vs-microsoft-part-2-googles-bard-may-prove-everyone-wrong-2c90b74c7dee 

https://albertoromgar.medium.com/google-vs-microsoft-part-3-a-new-way-of-doing-and-experiencing-ai-52a95354df7 

https://research.aimultiple.com/generative-ai-ethics/ 

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

tk-icons