Tekstivastine Tiedon tulevaisuus -podcast: Tekoäly – asiantuntija vai jutustelija? Tekstivastine
Markus Sovala: Hyvät kuulijat, tervetuloa Tilastokeskuksen mukaan Tiedon tulevaisuus -podcastiin. Luotettava tieto on demokratian ja rauhanomaisten yhteiskuntien perusta. Tilastokeskus täyttää tänä vuonna 160 vuotta. Tilastoja ja tietoa on tuotettu erilaisissa olosuhteissa erilaisiin tarpeisiin, mutta sama myönteinen henki on tässä jo toista vuosisataa päällä. Meillä on tänään vieraana Meeri Haataja, yrittäjä, startup-yhtiö Sidotin perustaja ja AI:n, tekoälyn tuntija ja tietäjä ja siitä myöskin leipänsä ansaitseva. Meeri. Tervetuloa! Milloin sinä olet ensimmäisen kerran elämässäni kuullut tekoäly-termin tai sellaisen käsitteen sanan.
Meeri Haataja: Kiitos ja onnittelut juhlavuoden kunniaksi! Mutta kiva olla täällä ja tota noin, toi on vaikea kysymys. Musta tuntuu, että kun oon koko oman työurani ollut tekemisissä, nyt tänä päivänä ajattelen tekoälyn kanssa. Aikaisemmin sitä kutsuttiin analytiikaksi ja tiedon louhinta oli mitä mä käytin omassa gradussani aikoinaan tästä samasta teemasta. Ja sit jossain kohti sitä alettiin puhumaan tekoälystä. Että rakkaalla lapsella on monta nimeä.
Markus: Mutta et pysty ajoittamaan sitä milloinka sait ahaa elämyksen, että nyt taitaa olla jostakin isosta asiasta kysymys. Vai tietenkin se on sinulle iso asia, mutta milloin sä rupesit ajattelemaan, että se on ihmiskunnalle iso asia?
Meeri: No onhan tässä tämmösiä tiettyjä virstanpylväitä ollut. Ja tosiaan niin kuin sanoit, niin tietysti oma työ on aina jotenkin tosi tärkeä ja ollut silleen kautta sen oman työuran. Mutta kyllä nyt muutamien viime vuosien aikana - kyllä mä sanoisin että 2023 kun ChatGPT tuli markkinoille, niin kyllä se oli semmoinen hetki, että piti hetki miettii että mitä nyt on tapahtumassa. Tuntuu että tekoälyssä yhtenä vuonna tai yhtenä hetkenä kun lanseerattiin ChatGPT:tä, niin tapahtui yhtä paljon kuin koko mun työuralla siihen saakka et kyllä se silleen tosi radikaali hetki sen jälkeen ollu. Oli tässä useampikin, että tänä vuonna mä oon tota noin, että me ollaan alettu puhua tekoälyn agenteista ja nyt me nähdään kun tekoäly integroidaan selaimiin. Että semmoisia isoja ahaa hetkiä, että tää on iso juttu, on ollut kyllä sen jälkeen moniakin.
Markus: Viittasit tekoälyagentteihin. Mitä niillä oikeastaan tarkoitetaan?
Meeri: Varmaan yksinkertaisuudessaan tekoälyagentit on tällaisia automaatio työnkulkuja, joissa tekoäly on suorittamassa sitä, sitä päättelyosaa eli tekoälyä. Ja tyypillisesti näitä kielimalleja kytketään tämmöisiin automaatioihin, joissa sitten tämä järjestelmä pystyy paitsi myös paitsi jalostamaan tietoa ja päättelemään niin myös tekemään toimenpiteitä.
Markus: Mä yritin tehdä itselleni sellaisen agentin, joka kävisi katsomassa valtioneuvoston sivuilta Tilastokeskuksen näkökulmasta relevantteja uutisia päivittäin, mutta joku siinä koodaamisessa meni multa pieleen. Mutta ehkä mä huomenna onnistun siinä.
Meeri: Ehkä sun täytyy pyytää tekoälyä debuggaamaan sitä.
Markus: Mä ajattelen, että se on just tällainen vakiomuotoinen tekoälylle esitetty kysymys, jonka voi sitten aina toistaa kun sä viittasit tähän ChatGPT:hen. Eli niin kuin sanotaan näitä laajoja kielimalleja, niin niissä ainakin maallikon mielestä on häkellyttävää se, että ehkei ehkä niinkään se mitä ne osaa tehdä, vaan miltä ne tuntuu. Ne tuottaa häkellyttävällä tavalla kieltä, joka on melkein kuin ihmisen tekemä.
Meeri: Ja hyvin itsevarmaa.
Markus: Joo, hyvin itsevarmaa ja usein kun sitä sitten tarkemmin lukee, niin miettii, että en mä olisi tätä tekstiä ehkä elämässäni mihinkään tarvinnut. Että ne tuottaa valtavasti, kiinnittää huomiota, että ne tuottaa virheellistä tietoa. Enemmän mua kiinnostaa siinä, että kun muutenkin maailma on täynnä turhaa puhetta ja turhaa tekstiä, niin sitä tulee nyt sitten vain entistä enemmän lisää tässä.
Meeri: Tällä hetkellähän aika alkaa olla varmaan aika iso osa internetin tiedosta tai siitä materiaalista jo tekoälyn tekemää, että iso muutos siinä. Mutta toi on tosi mielenkiintoinen, kun sitä arvioi just tän generatiivisen tekoälyn ja näiden kielimallien tuottamia tuotoksia ja tietoa, niin niin musta on jotenkin hyvä arvioida sellaisten alueiden tai sitä laatua arvioida niiden alueiden kautta missä sä oot itse syvällä asiantuntija. Jos mä mietin niitä keskusteluja mitä itse käyn omasta ammatillisesta ydinosaamisalueesta, niin se on aluetta missä tässä tosi vähän luottaa tekoälyyn tai huomaa tavallaan miten vajavaista on se tekoälyn tuottama analyysi siitä aiheesta. Ja sitten taas kun on semmoisia itselle vieraampia aiheita, joissa mulla ei ole sitä asiantuntijaa. Että niin sehän menee. Se menee täydestä heti. Että sitä mä yritän itse pitää sellaisena mittarina ja puhua meille lapsillekin, että tavallaan tarkastelkaa aina sitä ja reflektoitua sitä yleistä laatua tavallaan siellä kontekstissa missä teillä on osaamista arvioida sitä tekoälyn laatua ja sitten koittaa jotenkin soveltaa sitä samaa.
Markus: Sinä puhut tekoälyn etiikasta. Sä neuvot yrityksiä, sä neuvot viranomaisia tekoälyn eettisestä käytöstä. Niin, miten sä kuvaisit? Miten etiikka tähän hommaan nyt oikeastaan liittyykään? Mikä on se eettinen peruskysymys?
Meeri: Tää on tässä tosi mielenkiintoinen kysymys, koska koko ajan vähemmän ja vähemmän puhutaan etiikasta.
Markus: Tilastokeskus joka päivä.
Meeri: No se on hyvä kun löytyy organisaatioita vielä jotka haluaa puhua etiikasta. Ehkä mun oma kokemus on ollut se, että sillon kun tää teema oli uusi ja nousi, mäkin olin mukana Suomen tekoälyohjelmassa useita vuosia sitten ja etikkatyöryhmää siellä vedin ja kannustettiin organisaatiota eettisten tekoälyperiaatteiden määrittämiseen. Oli paljon sellaista etiikkakärjellä menevää tekemistä ja ehkä vuosien kuluessa olen huomannut, että se ei ole sitten kuitenkaan se kulma joka saa yrityksiä, erityisesti yrityksiä, mutta myös julkisorganisaatioita tavallaan liikkeelle ja toimeenpanemaan sitä tekemistä. Tänä päivänä mä puhun paljon enemmän itse riskienhallinnasta, tekoälynhallinnasta, laadunhallinnasta, riskienhallinnasta ja mun mielestä asiat on hyvin läheisiä, että käytännössä se tulee siihen riskienhallintaan.
Markus: Mutta tosi fiksua se on.
Meeri: Se on ehkä se kieli mitä yritykset ymmärtää ja tavallaan mikä saa liikettä aikaiseksi, joten se on osoittautunut ehkä toimivammaksi kulmaksi sitten lähestyä näitä asioita. Mutta perusta on siinä tietysti, että mikä on hyvää, laadukasta, oikeeta tekoälyn käyttöä? Minkälaisia rajoja meidän pitäisi sille laittaa? Mikä ei ole sellaista mitä me halutaan? Semmoista tulevaisuuden kuvaan tai tekoälyyn liittyvää kehitystä, Mitä me halutaan ja miten me voidaan kontrolloida sitä?
Markus: Yksi tai semmoinen meille tärkeä keinoälyyn tai tekoälyn tai AI:n - miten sitä nyt sitten sanotaankaan, meille olennainen käyttötapaus on semmoinen käyttötapaus että myös me ajatellaan näin, että myös tulevaisuudessa ei ole se, että meillä olisi itsellä käytössä joku tekoäly, vaan meidän täytyy tavalla tai toisella järjestää, että nämä isot kaupalliset keinoälyt löytävät meidän tiedot ja myöskin löytää niihin liittyvät, niin kuin sanonta kuuluu, metatiedot eli tieto siitä, että mitä se tieto on. Sitähän ei mikään kone pysty päättelemään. Koneelle pitää kertoa, että jos haet Tilastokeskuksen tietokannasta bruttokansantuotteen, niin miten se muuttui ja siellä nyt lopulta sitten oikeasti on? Mikä on se, joka antaa nyt sitten sen parhaimman kuvan Suomen taloudesta? Ja siinä mielessä me ei voida kontrolloida sitä, että mitä se keinoäly sitten sillä tiedolla tekee. Ainahan voi kuvitella, että joku tekee sellaisen keinon, jolla tahallaan vääristelee tietoja, mutta se ei ole enää meidän kontrollissa. Mä luulen, että myös yrityksillä on vähän samasta asiasta kysymys. Osassa tapauksissa yritykset käyttää sitä tietoa, muokkaa sitä tietoa, mutta aika usein yrityksen kannalta on tärkeätä, että siitä yrityksestä ulospäin lähtevä tieto nyt päätyy jotenkin oikein näiden isojen keinoälytoimijoiden käyttöön. Onko tämä hyvä arvaus?
Meeri: Joo, siis tämähän on ihan todella mielenkiintoinen tämä koko tähän siihen dataan liittyvä problematiikka, että millä tekoälyä koulutetaan. Ja jotenkin mä ajattelen, että se kenellä on laadukasta dataa. Niin se on. Se on aina ollut datan hyödyntämisessä tekoälyssä analytiikassa niinku keskeinen asia, että tavallaan jos sä syötät koneelle roskaa, niin roskaa sieltä tulee ulos. Tämä sama logiikka pätee edelleen, mutta jotenkin se on erityinen asema.
Markus: No siinä on ehkä nykyään se isompi riski, että kun ei nähdä täsmällisesti mitä siinä roskan jalostuksessa tapahtuu, Ennen on ehkä nopeammin paljastunut, että se tuutista tuleva tavara on koko putken läpi roskaa.
Meeri: Joo ja siis tuohan on todella läpinäkymätön alue tällä hetkellä, että jos mietitään silleen et mitä me ymmärretään siitä niistä tekoälysovelluksista mitä me tänä päivänä käytetään just näistä yleiskäyttöisistä, niin niin se on erittäin vähäistä se tieto siitä koulutus datasta mitä ne on syöneet, nämä tekoälyt, joita sitä nyt regulaatiolla pyritään pikkasen lisäämään sitä läpinäkyvyyttä siihen mitä millä millaisella datalla se on koulutettu, mutta lähtökohtaisesti se on lähes olematonta se tieto näihin isoihin malleihin liittyvän datan koulutusdatasta.
Markus: Mutta jos riskien sijasta puhutaankin mahdollisuuksista, niin onhan tässä myöskin sellaisia isoja vielä kokeilemattomia alueita, että moneen käyttötarkoitukseen ihan hyödyllisiäkin tietoja ja vähintäänkin vaikuttaa järkeviltä. Niin kuin puhuttiin, monet keinoälyn tuotteet, vaikka se raaka-aine on ollut sitä sun tätä. Mutta entäs jos keinoälyä koulutettaisiinkin johdonmukaisesti sellaisella tiedolla, jonka joku on varmistanut, että se on oikein? Tarkoitan nyt tässä esimerkiksi Suomen tilastokeskuksen tiedoilla.
Meeri: Joo, kyllä mä ainakin odotan näin, että tavallaan tässä muutama vuosi, kun sitten tuli isosti nää yleiskäyttöiset tekoälyt ja yleiskäyttöiset mallit, joiden idea on se, että ne ne performoi verrattain hyvin oikeastaan todella laajalla alueella ja niitä ei edes pyritä yhteen tiettyyn käyttötarkoitukseen luomaan. Mutta kyllä mä jotenkin ajattelin, että on tosi mielenkiintoinen seurata markkinan kehittymistä siinä, että tulee varmasti niinku tavallaan samalle teknologialle rakentuvia vahvoja alakohtaisia tekoälyjä, jotka on koulutettu tunnettuun dataan liittyen sillä tietyllä alalla ja on niinku ylivertaisia tavallaan performanssissa johtuen siitä, että niillä on vaan yksinkertaisesti laadukkaampaa varmistettua dataa siltä kyseiseltä alalta koulutusdatana. Sitä kehitystä itse odotan tämän yleiskäyttöisten mallien lisäksi, että tulee noin hyvin kehittynyttä tekoälyä, vahvasti sektoraalista ja eri toimialoilla.
Markus: Meillä on tänään Tilastokeskuksen mukana Tiedon tulevaisuus -podcastissa Meeri Haataja, startup yhtiö Saidotin perustaja puhumassa meidän kanssa AI:sta. Jatketaan juttua ja kysytään, mitä ajattelet AI:n tulevaisuudesta? Mitä tässä tapahtuu ja uskallatko jo neuvoa meitä tavallisia pulliaisia, että mites meidän pitäisi toimia?
Meeri: Ennustaminen on tullut ihan hirvittävän vaikeaksi, kun tämä kehitysnopeus on niin kovaa että mä oon tota - no en mä oo ollu kauheen innokas ennustaja ennen tätä generatiivistä tekoälyä silloinkaan. Mutta nyt se on kyllä erityisen vaikeeta. Että tätä ehkä itse ajattelen. Näin, että olennaista mitä me jokainen voidaan tehdä on pysyä kärryillä. Ja pysyn uteliaana siihen, että mitä mahdollisuuksia meille tuodaan tässä tekoälyn saralla. Ja kokeilla ja mielenkiinnolla suhtautua siihen, että miten tästä vois olla mulle hyötyä? Mutta myöskin sitten aktiivisesti harjoittaa sellaista kriittistä ajattelua ja arviointia siinä innostuksen tuoksinassa sitten myöskin. Että ei sokeasti luota sitten kaikkeen siihen mitä meidän eteen tarjoillaan.
Markus: Kun sä puhut siitä, että näiden yleisten kielimallien sijaan tai niiden jotenkin jatkeeksi on tulevaisuudessa todennäköisesti tulossa tällaisia tarkempia johonkin tarkempaan aihealueeseen liittyviä malleja. Mutta onko maallikko oikeassa, että itse asiassa nämä agentithan on vähän sitä, että sulla on yleinen kielimalli ja sitten se agentin avulla kerrot, että mitä tietoaineistoa sen kielimallin pitäisi nyt sitten imuroida sisäänsä ja muokata sitä, niin eikö se ole sitten sellainen köyhän miehen versio tällaisesta aihealuekohtaisesta keinoälystä?
Meeri: Niin joo, sä voit joo rajata sitten tavallaan, että mihin, mihin kontekstiin ja mihin tietoihin tietoihinsa annat sun tekoälyagentille sitten tai sen pohjata sitä tietoa. Mutta sehän ei toki muuta sitä, että jos käytät siinä päättelyssä ja sen ne mallit mitkä siellä taustalla on, niin ne on koulutettu jo kertaalleen siellä kertaalleen.
Markus: Siellä on tavallaan vinouma siellä perusmallissa, niin sitä ei sillä paremmalla datalla silloin pelasteta. Tilastoalalla on vähän vastaavia tuoreita agentteja. Puhutaan sellaisista kuin MCP millä tarkoitetaan siitä sellaista kieltä, jolla keinoälylle kerrotaan, että mitä sun tietokannasta voisi löytää, Nyt sitten ensi kevään YK:n tilastokomission kokouksessa on esillä sellainen ajatus, että suositeltaisiin kaikkia maita tekemään semmoinen. Taas näitä kirjain hirvityksiä - MVP, eikö - anteeksi MVM. Eli se on semmoinen käsite, jolla tarkoitetaan että niin kuin minimum viable -metadata, eli että kaikissa maissa kuvattaisiin pienimmän yhteisen nimittäjän kautta ne olemassa olevat tiedot, ja se olisi tapa houkutella, että nämä isot keinoälyt ei hakisi netistä kaikkea roskaa mitä sieltä löytyy, vaan kohdistaisi niitä kyselyitänsä tänne varmistettuun oikeampaan tietoon. Uskotko, että nämä keinoälyt sitten tottelevat, että ne suostuvat? Jos niille sanotaan, että nyt olisi vähän parempaa tietoa tarjolla, niin onko se riittävän houkuttelevaa vai onko se helpompi vain tyytyä siihen, että netistä haetaan mitä sieltä nyt sattuu löytymään?
Meeri: Mä jotenkin ajattelen, että tuohon ei oikein voi varmaan silleen yleisesti vastata, vaan se riippuu ihan tilanteesta mikä se huonon datan hinta on sille käyttäjälle.
Markus: Niin no periaatteessa molemmat on, huono data on ilmaista ja kyllä tässä tilastolaitokset tämän datan jakaisi kyllä ilmaiseksi. Kyllä se ajatus on se, ettei siinä tavallaan se data siinä enempää maksaisi, mutta on se ehkä sitten teknisesti vaativampaa tehdä näitä tietokantahakuja kuin vaan hakee netistä.
Meeri: Mutta mun mielestä äärimmäisen tärkeää työtä ja tavallaan hyvin olennaista, että jos meillä on mahdollisuus varmistaa sitä, että tekoälyllä on saatavissa korkealaatuista tietoa ja pystytään turvaamaan siltä oman alan osalta se, että tämmöset hyvin laajalti ihmisten maailmankuvaa ja päivittäiseen elämään vaikuttavat mallit tätä pystyy tota noin pääsemään laadukkaaseen tietoon. Niin se on. Se on nähdäkseni tosi tärkeää.
Markus: Tämmöisen tiedontuottajan näkökulmasta on kyllä tärkeetä aina muistaa, että ei me voida pakottaa ketään käyttämään meidän tietoja. Kyllä se pitää jotenkin tehdä niin. Niin helpoksi kuin me vaan pystytään ja sitä kautta toivoa, että nämä meidän luotettavat tiedot kelpaavat paremmin kuin epäluotettava tieto.
Meeri: Ja varmaan mä luulen, että markkina menee eteenpäin kans siinä sitten, että meillä tulee esimerkkejä niistä tilanteista missä se tieto ei ollutkaan luotettavaa ja tavallaan niistä haitoista mitä sillä saatetaan ehdottaa ja sit se saattaa aiheuttaa erityishuomiota. Sitten taas siihen, että miten me pystytään parantamaan ja varmistamaan sitä, että se tieto onkin luotettavampaa. Että jotenkin uskon siihen, että yrityksen ja erehdyksen kautta mennään kuitenkin eteenpäin ja pystytään korjaamaan sitten myöskin asioita. Ei kaikkea ennakkoon vaan että siinä kohti kun sitten huomataan, että tää ei toimi, tää ei toimi näin ja tää on ongelma tää epäluotettava tieto niin nousee intressi sitten päästä sen luotettavan tiedon ääreen enemmän.
Markus: Ja tämmöisen kansainvälisen tilastoyhteisön, joka nyt yrittää näitä tietojensa tekoälyn käyttöä mahdollisimman nopeasti saada, niin niissä keskusteluissa on myöskin sisällä ajatus, että tavallaan toivotaan, että markkinoilla pärjäisi sellaiset tekoälyoperaattorit tai tekoälyt, jotka pystyvät osoittamaan, että he hankkivat sisäänsä oikeaa tietoa. Se on kilpailuvaltti. Mutta saapa nähdä pärjääkö maailmassa. Onko tämä totuusbisnes? Käykö totuus kaupaksi? Onko tämä markkinamekanismi sellainen, että mennään viihde, viihde tai joku provokaatioarvo edellä. Uskallatko Meeri lähteä ennakoimaan sitä, että mitä tästä keinoälystä seuraa tavallaan meille ihmisille? Muuttaako se meitä ihmisiä, mutta samalla tavalla kuin me, me jo nyt nähdään, että mobiilikommunikaatiokännykät, niin on niin paljon vaikuttanut lasten elämään, että se lapsilta pitää kieltää kännykän käyttöä ainakin muutamaa tuntia lukuun ottamatta vuorokaudessa. Niin milloinka keinoälyn käyttö pitää kieltää lapsilta ja kohta myös aikuisilta? Onko tässä sellainen? Meneekö se liian syvälle meidän ihmisten päähän?
Meeri: Tosi mielenkiintoinen kysymys Ja nyt se varmaan tää tekoälynatiivi sukupolvi siellä kasvaa jossain alakouluissa tällä hetkellä. Jotka ei tiedä tiedon hankinnasta yhtään mitään ilman tekoälyä tai sillä tavalla, että se on ollut osa heidän arkea. Sitten aina tässä mielenkiintoista on reflektoida vähän mitä sosiaalisen median kehityksessä kävi. Mulla on itellä 15 ja 18 -vuotiaat lapset ja silloin kun he oli he oli kouluun menossa niin silloin ajateltiin, että se ekaluokalle meneminen on se aika kun ensimmäinen kännykkä hommataan. Musta tuntuu että siitä ollaan tultu. Me ollaan aika eri tilanteessa, että se ei oo ollenkaan enää tänä päivänä ymmärtääkseni vanhemmilla ajatus, että ekaluokka olis se aika kun on hyvä hommata lapsille kännykkä. Ja ehkä tää sosiaalisen median kehitys on ollut nimenomaan se joka nyt sit niinku todella tavalla viiveellä herätty siihen, että pitäiskö tätä jotenkin reguloida ja miten estetään näitä haittavaikutuksia nuoriin ja siinä tosi yllättävästi se on tullut nimenomaan takaisinpäin. On noussut aika paljonkin ajatus siitä, että mikä on hyvä aika lapselle kännyköitä tuoda ja päästä sosiaaliseen mediaan. Ja nyt ollaan jopa aika monessa maassa ihan totaalikieltoja alaikäisille tai alle 16 -vuotiaille jopa sosiaaliseen mediaan tuomassa. Ja nyt tekoälyn kanssa on kyl tosi mielenkiintoista, että mitä? Ollaanko me opittu jotain tästä kehityksestä?
Markus: No yhtä hyvin voi kysyä, että onko siellä vielä tämän niin kuin meidän nuorten ja meidän aikuisten sielunmaailman pilaamisen näkökulmasta vielä yksi asia tapahtumatta. Sosiaalisessa mediassa se on niin visuaalista ja sitä ajatellaan, että kuvan kautta se ennen kuin se kännykkä menee syvemmälle päähän. Aika monethan näistä keinoälyistä kuitenkin ihan vaan tuottaa vaan tekstiä ja etupäässä näissä palveluissa pääasiallinen muoto on kirjoittaminen ja sitten se kone vastaa sulle tekstinä, niin sehän on vielä aika kevyt käyttöliittymä. Mutta sen jälkeen kun se kaikki keinoäly lukee sun kasvoilta ilmeitä ja tuottaa sulle vastaukseksi kuvia, niin se niin sehän tekee tuon saman sosiaalisen median efektin paljon vahvempana.
Meeri: Joo ja kyllähän siihenkin teknologian ja löytöjä ja palveluitakin. Meillä ei oo vielä tätä niin laajalti Euroopassa saatavilla, mut kyllähän tekoäly on jo tosi hyvä kuvan luomisessa ja videoiden luomisessa, että se on varmaan vaan ajan kysymys. Mutta mielenkiintoista on kyllä se, että tavallaan nyt sitten jälkikäteen kun sosiaalista mediaa pyritään sitten reguloimaan ja säätelemään ja rajoittamaan sitä käyttöä ja jotenkin mitikoimaan niitä haittavaikutuksia, niin olisko tää pitänyt tehdä aikaisemmin? Pyrittiin välttämään semmoista yliregulaatiota. Tai jotenkin niinku että säätelyllä rajoitettaisiin sitä hyvää kehitystä mitä on tapahtumassa. Mut sit jälkikäteen on kuitenkin aika monessa paikassa todettu ja Europassakin iso digipalvelu-asetus, joka vahvasti somealustoja reguloi Niin että ei se ole kokonaan huono asia ole regulaatio ja jonkinlainen säätely, että kun on uusi ilmiö. Ja nyt musta tuntuu, että tekoälyn alueellakin tosi paljon käydään sitä samaa keskustelua, että miten. Että ei haluta liian aikaisin rajoittaa sitä käyttöä ja rajata niitä mahdollisuuksia ja tota noin, että se on jotenkin aina semmoista vastakkainasettelua miten päästä semmoiseen, että regulaatio ja erinäköiset riskienhallinnan tavat on osa sitä laadukasta käyttöä ja laadukasta kehittämistä ja uusien mahdollisuuksien lähestymistä eikä semmoinen että joko tai ja vastakkainasettelu.
Markus: Sinänsä kuulostaa aika luontevalta, että moni asia voidaan säädellä vasta sen jälkeen kun se on jotenkin syntynyt tai levinnyt. Samalla tapaa jos ajattelee kaikkia huumeita ja tai mitä tahansa nautintoaineita, niin niin kyllä säätely on vasta sen jälkeen tullut kun niiden niin kuin haittakäyttö on alkanut. Että jotenkin ihminen ei ole niin viisas, että se osaisi kaikki ennalta väärinkäyttötapaukset keksiä.
Meeri: Se on totta ja tavallaan se, että et mikä on heikko signaali, mikä on riittävän vahva signaali, että se ongelma on jo selkeästi tiedossa ja pystytään miettimään ratkaisuja siihen. Niin siinä varmaan sitten yksilökohtaiset näkemyserot on isoja. Mutta juuri näin. Ja kyllä mä uskon jotenkin ite siihen, että tavallaan nimenomaan se oppiminen on se olennainen. Kun kehitysvauhti on tosi nopeeta, niin silloin tosi keskeistä on se, että pysytään ajan hermolla ja varmistetaan se, että oppimiskyky, kyky reflektoida sitä muutosta mitä on tapahtunut ja tavallaan oppia siitä ja sitten reagoida siihen opittuun perustuen, on avainasemassa. On se sitten tavallaan ihan niinku yhteiskunnan tasolla ja regulaation tasolla tai yksilö ihmisenä miten suhtautua tai miten oma elämä muuttuu tekoälyn kanssa? Niin jonkinnäköinen tämmöinen itsereflektointi, oppimisprosessi on aika keskeisessä roolissa.
Markus: Suomessa, niin kuin varmaan kaikissa muissa pienissä maissa on tyypillistä kysyä, että miten me pärjätään suhteissa muihin? Kun sä katsot tätä tekoälyn alaa sisältä, niin miten sä vertaat Suomea muihin Euroopan maihin taikka sitten näihin teollistuneisiin maihin ylipäätänsä? Niin miten? Miten vahvoilla Suomessa kaupallinen tekoäly on?
Meeri: Se on aina verrattain subjektiivista siitä omasta katsontakulmasta. Tota noin liittyen, ensi viikolla meillä on hieno viikko Suomessa kun Ellisin instituutti on laskeutunut Suomeen, eli tekoälytutkimuksen erittäin merkittävä Ellis-verkosto Euroopassa ja ollaan saatu oma yksikkö sitten Suomeen. Että tätä tutkimuksen saralla ainakin voidaan juhlia.
Markus: Saattaa vaan olla että tämä podcast tulee sillä viikolla ulos kun on se ensi viikko.
Meeri: Mutta juhlat on jo mennyt.
Markus: Ehkä samoihin aikoihin. No onko Suomessa sitten tätä tekoälyn eettistä hallintaa? Mitä se sitä kuvaisit? Ollaanko me jo pudottu kelkasta vai onko suomalaiset yritykset ja viranomaiset hyvin liikkeellä?
Meeri: Minusta tuntuu, että tää teema nousee Suomessa aika aikaisin esille ja se oli kansallisissa ohjelmissa hyvin aikaisessa vaiheessa. Me näyttäydyttiin ehkä jonkinnäköisenä edelläkävijänä vuosikausia sitten tässä teemassa. Mutta tota noin, kyllä se verrattain hiljaista ja hidasta tässä välillä sen käytännön toimeenpano on ollut. Musta tuntuu että me ollaan aika pragmaattisia siinä ja tavallaan nyt kun on ollut näkyvissä, että EU:ssa tulee tekoälyregulaatiota, säätelyä ja sieltä tulee sitten selkeys sen osalta että miten tämä problematiikka realisoituu yksittäisen organisaation arkeen, niin sitä ollaan vahvasti odotettu ja nyt se toki on sitten olemassa ja nyt on selkeästi taas nähtävissä, että asia on organisaatioiden työpöydällä, mutta ehkä meitä ei voi ihan edelläkävijöiksi tässä teemassa tituleerata.
Markus: Yksi näkökulma, joka tässä - sanotaan ehkä viimeisen puolen vuoden tai vuodenkin aikana - on että maailmalla moni organisaatio on hoksannut sen datan näkymän, että kun vielä kun muistan itse ensimmäisiä kertojani törmänneeni tekoälyyn joskus tuollainen suuruusluokka vajaa 10 vuotta sitten, niin silloin kovasti ajateltiin, että tekoäly olisi ratkaisu hyvin huonolaatuiseen repaleiseen dataan. Mutta se on nyt viimeisen, sanotaan - ainakin mä olen oppinut sen asian vasta tänä herran vuonna -25. Että ei, vaan se asia kääntyi toisin päin, että tekoälyn järkevä hyödyntäminen edellyttää, että data on järjestyksessä ja että se on riittävän hyvin kuvattu.
Meeri: Tämä on hauska juttu, että analytiikassa, datan hyödyntämisessä ja tekoälyssä aina kun tulee joku edistysaskel, niin musta tuntuu, että kaikki tiet vie aina datan äärelle. Että tavallaan silloin aina herätään jos löytyy joku uusi hyvä käyttökohde. Niin, siitä ei mene kovin kauaa kun huomataan, että meillä on ongelma datan kanssa ja nyt täytyisi saada data kuntoon ja arvostan suuresti ihmisiä, jotka tekee töitä datan laadun kanssa. Se on, se on tosi.
Markus: Sano tuo vielä uudestaan.
Meeri: Se on usein hyvin epäkiitollista työtä, kun se on semmoista perustatyötä, joka on usein hyvin näkymätöntä työtä. Mutta se käytännössä määrittää hyvin pitkälle sitä laatua, mitä niistä hyödyntäjien hyödyntämisen kautta sitten löytyy. Mutta se on hauska, että aina tekoälyn edistysaskeleet ne aina tavallaan johtaa siihen, että masterdatan ja datanhallinnan rooli korostuu. Aina tulee uusi aalto jolla datan kehittäjät voi perustella tärkeää työtänsä.
Markus: Niin taikka aina välillä tulee uusi aalto, jolla ajatellaan että pääsisi eroon siitä, että se data lopulta ratkaisee sen kaiken ja sitten taas huomataan, että ei sitä hokkuspokkusta kuitenkaan ollut. Mutta kyllä sitä toivoisi tavallaan jos saisi vapaasti toivoa niin että olisi enemmän teknistä kehitystä ja ajattelua sen suhteen, että miten sitä datan hallintaakin voisi niin kun nopeammin automatisoida, helpottaa ja päästäisiin siihen, että siinä tarvittaisiin ihmistä ajattelemaan. Ja sitten se tavallaan käsityö, se datan lapioiminen, niin kuin me joskus täällä puhutaan, puhutaan tietojen - on erilaisia verbejä millä sitä dataan liittyvää käsityötä kuvataan. Niin miten niistä mekaanisista vaiheista, siitä työstä voitaisiin päästä nopeammin eroon?
Meeri: Joo, olematta nyt tän alueen mikään erityisosaaja, niin kyllä mä luulen, että aika paljon siellä kehitystä tapahtuukin siinä, että noita prosesseja tutkii varmasti paljon datanhallintaan erikoistuneita yrityksiä, joiden kehitysfokus on nimenomaan tuossa miten voidaan työtä tehostaa ja hyödyntää myöskin generatiivista tekoälyä.
Markus: Varma käyttötapaus on tietenkin se, että kun tässä on useampaan kertaan mainittu se metadata eli data datasta, niin sen metadatan hallinta niin että sitä mukaa kun tietoa syntyy, niin siinä kulkee koko ajan toisessa putkessa sivussa sen datavirran mukana vähän pienempää putkea pitkin vieressä tietoa siitä, että mitä se tieto on, mistä se on tullut, mitä sille on tehty ja myöskin vähän niin kuin koko ajan arviota siitä mitenkä miten luotettavaa se on ja mihinkä sitä voi käyttää.
Hyvät kuulijat, meillä on tänään ollut vieraana Tilastokeskuksen Tiedon tulevaisuus -podcastissa Meeri Haataja AI-alan startup yrittäjä. Olemme keskustelleet AI:stä ja datasta ja tekoälystä. Meeri, mikä on parasta, mitä tekoäly voisi maailmaan tuoda? Mitä toivot, että oikeastaan tapahtuisi?
Meeri: Nyt ei ollut pieni kysymys. Helppoutta. Sellaista arjen helpotusta ensimmäiseks odottaa tota kaikkeen semmoseen, tota noin, vaivalloisiin asioihin, mihin ei tekis mieli käyttää aikaa. Se on varmaan tämmönen ilmiselvä. Mutta kyllähän tekoäly tulee varmasti avaamaan aivan jäätävän määrän kokonaan uusia innovaatioita, joita me ei osata vielä tänä päivänä kuvitella tai ajatella Jos mietitään startuppeja, jotka nyt on yksi kuva innovaatiosta ja tavallaan missä realisoituu innovatiivisuus hyvin konkreettisella tavalla, niin kyllähän se käytännössä jokaisen startupin arkea on se tekoälyn hyödyntäminen. Ja tekoälyllä on siis erittäin merkittävä rooli siinä, millaiseksi tulevaisuus muotoutuu. Millaiset innovaatiot auttavat meitä eri tavoilla sitten elämässä.
Markus: Siis isoja taloudellisia merkityksiä. Mutta entäs uskallatko ajatella, että tekoäly voisi muuttaa maailman paremmaksi?
Meeri: Kyllä mä näin uskon ja se on varmaan se syy, miksi itse haluan tehdä töitä tekoälyn parissa, mutta se ei tapahdu itsestään vaan päästämällä tekoäly irti ja odottamalla, että se navigoi.
Markus: Vielä varmaan vähän reguloimallakin järkevästi.
Meeri: Niin nimenomaan, että se vaatii meiltä tietysti ymmärrystä siitä, että mikä on se hyvä tulevaisuus? Mikä on se hyvinvointi ja sen kaltainen tulevaisuus mitä me halutaan tavoitella ja mitä roolia tekoäly voi siinä toteuttaa ja mitä siinä on ihmiselle roolia tekoälyn rinnalla? Tätä arvioida.
Markus: Kiitos, Kiitos Meeri, että olit kanssamme tämän podcastin ajan.
Meeri: Kiitos paljon, oli ilo keskustella.
Markus: Lopuksi Meeri meillä on ollut tapana tämmöinen sana-assosiaatioleikki ja nyt ajattelin sulta kysyä muutaman sanan ja pyydän sua sanomaan mitä sulle niistä ensimmäiseksi tulee mieleen.
Markus: Kielimalli
Meeri: GPT
Markus: Kuulosti huokaukselta. Niin no sitten toinen: datamassa.
Meeri: Nyt tulee Tilastokeskus ensimmäisenä mieleen
Markus: Nuoriso
Meeri: Tulevaisuus
Markus: Johtajuus.
Meeri: Tulee mieleen tällainen palveleva johtajuus.
Markus: Se onkin hyvä. Hyvä assosiaatio, se on hyvä johtajuuden ominaisuus, jos sen osaa. Ihminen osaa johtajana palvella ympäristöänsä.
Markus: Entäs tulevaisuus?
Meeri: Jännittävä, mielenkiintoinen.
Markus: Kiitos Meeri! Tämä oli Tilastokeskuksen mukaan Tiedon tulevaisuus -podcastin kahdeksas jakso ja seuraavat jaksot on kuultavissa ensi keväänä. Tervetuloa silloin mukaan!