Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

TosiTieto eli TrueData – uusi työkalu tiedon laadun arviointiin?

18.6.2018
Twitterissä: @HMikkela

Oikeastaan ihan ensimmäiseksi pitäisi kiittää presidentti Trumpia. Ilman häntä tiedon laatu ja luotettavuus eivät olisi samalla lailla esillä kuin ne nyt ovat.

Olemme havahtuneet pohtimaan entistä laajemmin ja vakavammin, voiko tietoon luottaa, onko tietolähde uskottava, mikä on tiedon laatu. Ovatko uutiset tosiuutisia vai valeuutisia, perustuvatko ne faktaan vai tarkoitushakuiseen fiktioon.

Tiedon laatu ja luotettavuus ovat myös tärkeä osa käynnissä olevaa tietopoliittista keskustelua.

Laatu ei ole yksiselitteinen joko-tai -asia, on/off-asia. Riittävä laatu ei ole aina ja kaikissa tilanteissa sama. Laatu on aina suhteutettava käyttötarkoitukseen: mikä sopii yhteen tilanteeseen voi olla aivan liian epätarkkaa tai pienpiirteistä toiseen.

Laatuun liittyy monia ulottuvuuksia, joiden perusteella arvioidaan tiedon käytettävyyttä ja soveltuvuutta käyttötilanteeseen.

Tiedon tuotantotavan perusteella voidaan jo arvioida tiedon luotettavuutta. Lisää tiedon laadusta voi ymmärtää, jos tiedon yhteydessä on kuvattu mahdolliset epävarmuustekijät ja varaukset.

Tiedon laatu ratkaisee, kuinka hyviä päätelmiä ja päätöksiä sen pohjalta voidaan tehdä – joko ihmisaivoin tai koneälyn avulla.

Laadukkaan tiedon tulisi perustua riittävän kattavaan ja edustavaan osaan siitä ilmiöstä, jota sen halutaan kuvaavan. Jos vastaajajoukosta puuttuvat alle 30-vuotiaat miehet tai maaseudulla asuvat naiset, emme voi yleistää tuloksia kaikkiin suomalaisiin.

Myös käsitteiden määrittely on tärkeää. Käsitteiden avulla voimme hahmottaa, mittaammeko me todella sitä asiaa, jota oletamme mittaavamme. Jos tarkasteltava ilmiö on määritelty puutteellisesti tai väärin, eivät tuloksetkaan voi olla oikein. Voimme luulla puhuvamme lemmikkieläimen omistajista mutta tosiasiassa kaikki tietomme liittyykin kissan- ja koiranomistajiin. – Kaikkien asioiden yksiselitteinen käsitteellistäminen ei edes ole mahdollista.

Laatua on myös tiedon oleellisuus ja merkitys. Onko asia tärkeä, tarvitaanko sitä koskevaa tietoa, onko ilmiön tai asian kuvaaminen tarpeellista.

Tiedon käyttäjän haastava tehtävä on arvioida, onko kulloinkin saatavilla oleva tieto laadultaan riittävää tai käyttötarkoitukseen sopivaa, ja millaisen riskin hän on valmis ottamaan tietoa käyttäessään. Tiedonkäyttäjä tarvitsee tiedonlukutaitoa.

Tiedon laadun arvioinnin tueksi on olemassa joitakin keinoja. Esimerkiksi virallisen tilaston laatukriteereissä on määritelty normit, joilla tilastojen syntyä, laatua ja merkitystä arvioidaan ja kuvataan. Nämä on koottu tilastojen laatuselosteisiin. Tieteellisen tutkimukseen liittyy olennaisena toisaalta viittaus käytettyihin tietolähteisiin, toisaalta kuvaus aineistosta ja menetelmästä sekä arvio tulosten yleistettävyydestä.

Varsin usein laadun arviointi on kuitenkin vaikeaa tai jopa mahdotonta. Laatuselosteet ja menetelmäkuvaukset ovat turhan monimutkaisia ja vaikeasti saatavilla. Usein ne puuttuvat kokonaan.

Kuitenkin viime kädessä tiedon laatu ratkaisee, kuinka hyviä päätelmiä ja päätöksiä sen pohjalta voidaan tehdä – joko ihmisaivoin tai koneälyn avulla.

Häämöttäisikö jonkinlainen ratkaisu kuitenkin horisontissa? Avoimelle tiedolle on kansainvälisellä yhteistyöllä kehitetty kriteerejä, jotka auttavat arvioimaan tiedon avoimuutta (ks. esim. Open government data, Project open data, Maailmanpankin opendata toolkit). Käytäntö toimii: jokainen tiedon tuottaja tai käyttäjä pystyy kehikon avulla arvioimaan, onko tieto avointa vai ei.

Olisiko mahdollista rakentaa vastaava helppokäyttöinen kehikko tukemaan tiedon laadun arviointia? Sen rakentamiseen tarvitaan toki keskusteluita, yhteistyötä ja ennakkoluulottomutta. Pohjaksi voisi ottaa vaikkapa aiemmin mainitut virallisen tilaston laatukriteerit.

Voisiko OpenDatan, BigDatan ja MyDatan jälkeen seuraava tietoilmiö olla TrueData, TosiTieto? – Suomalainen innovaatio, arjen työkalu ja kommunikointiväline.

 

Kirjoittaja on Tilastokeskuksen ylijohtaja.

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

tk-icons