Laadukkaat perustietovarannot ovat edellytys datatalouden etenemiselle
Suomi on perinteisesti nähty perustietovarantojensa osalta maailman huippumaana – rekisterit ovat ajan tasalla ja laadukkaita. Silti Suomi sijoittui sijalle 28 eli neljän viimeisen joukkoon OECD:n tekemässä Euroopan hallintojen digitalisaatiovertailussa 2019. Sijoitus nostatti kohua, vaikka pienenä lohdutuksena olikin Ruotsin jääminen viimeiseksi.
En tässä lähde arvioimaan tuon selvityksen lukuja, mutta tuore selvitys perustietovarantojen laadun nykytilasta nostaa esiin samoja asioita.
Valtiovarainministeriö on käynnistänyt Laatukehikko-hankeen julkisten tietovarantojen käytettävyyden parantamiseksi ja tietoaineistojen yhteiskäytön helpottamiseksi. Sen tuloksena on määrä syntyä tietoaineistojen laatukriteerit, jotka tähtäävät paremman laadun tuottamiseen.
Laatua voidaan lisätä yksinkertaisin keinoin
Hankkeen ensimmäinen etappi oli tuo alussa mainittu nykytilaselvitys. Siinä nousi esiin joukko parhaita käytäntöjä ja edellytyksiä laadun tekemiselle. Huomioitavia asioita ovat muun muassa tietoaineiston selkeä omistajuus, tiedon tuottajan eli operatiivisen järjestelmän merkitys sekä master datan käytön lisääminen.
Esimerkkejä parhaista käytännöistä ovat tikettijärjestelmän hyödyntäminen palautteen hallinnassa (Kuntatalouden tietopalvelu), automatisoidut tarkastukset tiedon vastaanotossa (Tulli, Tilastokeskus, Vero) ja niiden muuttaminen esitettävään muotoon (Maanmittauslaitos).
Master datan käyttö on parantanut esimerkiksi Kaupparekisterin laatua, kun ajoneuvorekisteri ryhtyi hakemaan sieltä yritysten osoitetietoja. Selvityksessä kävi myös ilmi, että laatu paranee, jos rekisterin pitäjä tiedon kokoamisen lisäksi itsekin käyttää tietoa.
Nämä ovat yksinkertaisia, mutta välttämättömiä asioita, joita ei vielä hyödynnetä kaikissa perustietovarannoissa. Sekä tiedon käyttö että sen avoimuus ovat omiaan lisäämään laatua. Perustietovaranto ei ole perustietovaranto ilman laajaa käyttöä!
Hankkeen myötä onkin tullut ilmi jonkinlaisen laatutestin tarpeellisuus. Sen avulla voisi tunnistaa parhaita käytäntöjä ja edesauttaa niiden leviämistä eri organisaatioissa.
Kohti kokonaisvaltaista kehittämistä
Selvityksessä nousi esiin myös parannuskohteita. Tiedon laatua kehitettäessä on huomioitava koko tiedonkäytön ekosysteemi – tiedon tuottaja, rekisterinpitäjä ja käyttäjä. Esimerkiksi monessa perustietovarannossa kunta on keskeinen tiedontuottaja, ja rekisterinpitäjällä itsellään ei ole suoraan mahdollisuutta vaikuttaa kerättyjen tietojen laatuun.
Keskeinen haaste on myös se, jos kehittämisestä aiheutuva hyöty ei konkretisoidu perustietovarannon ylläpitäjälle itselleen. Silloin on vaikea perustella resursseja tietovarannon sisällön tai laadun kehittämiseen.
Tiedon käyttäminen parantaa sen laatua. Niinpä mietintään pitäisikin ottaa tiedon käyttövelvoite, joka lisäisi perustietovarantojen käyttöä ja samalla parantaisi niiden laatua. My Data -periaatteen tuominen julkisiin tietovarantoihin voisi myös lisätä luottamusta viranomaisten toimintaan, parantaa mahdollisuuksia kerätä tarpeellisia tietoja ja lisätä niiden hyödynnettävyyttä.
Nykytilaselvitys ei vastaa kysymykseen, ovatko Suomen perustietovarannot laadukkaita ja ajantasaisia. Sen sijaan hyvin toteutettuina laatukriteerit voivat kertoa perustietovarantojen laadusta. Jos niille asetetaan myös tavoitteet, niillä voidaan saavuttaa tarvittava ohjaava vaikutus laadun parantamiseksi.
Mielestäni laatukriteereiden lisäksi tarvitaan edellä esitetty laatutesti, joka auttaa sparraamaan organisaatioita hyödyntämään tietoa ja kehittämään laatua.
Datatalous vaatii laadukkaita ja yhteen toimivia perustietovarantoja. Nyt tehty nykytilaselvitys osoitti, että kokonaiskuva ei ole täysin hallinnassa ja parhaat käytännöt voivat jäädä hyödyntämättä. Hanke on hyvä alku, mutta jatkossa kaikkien tietoekosysteemissä toimivien välille tarvitaan pitkäaikaista yhteistyötä ja koordinointia.
Lue lisää tiedon laatukehikko -hankkeesta.
Kirjoittaja toimii yli-insinöörinä Maanmittauslaitoksessa ja hänellä on pitkä kokemus paikkatietojen laadun kehittämisestä ja sen standardoimisesta.
Avainsanat:
Miksi tätä sisältöä ei näytetä?
Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.