Suuret tietovarannot, suuret odotukset
Suomessa on poikkeuksellisen laadukkaat rekisterit kansalaisista, yrityksistä ja yhteisöistä. Rekisterit kertovat faktoja siitä, mitä me teemme ja miten meillä menee. Rekisterinpitäjiä on useita, ja kullakin on oma näkymänsä yhteiskuntaan.
Tilastokeskus on poikkeuksellinen tiedon solmukohta, koska sen haltuun on omien aineistojen lisäksi suotu Suomen tärkeimmät tietovarannot myös muilta rekisterinpitäjiltä. Tällaista tiedon keskittymää ei ole muualla.
Tiedon keskittäminen mahdollistaa tietojen yhdistämisen. Esimerkiksi tulorekisteriaineiston ja sähkömarkkinadatan yhdistämällä voimme vastata kysymykseen: kuinka paljon Suomessa on pienituloisia sähkölämmitteisessä talossa asuvia kotitalouksia, joilla ei ole kiinteähintaista sähkösopimusta. Toisistaan irrallaan näillä rekisteritiedoilla voitaisiin tarkastella vain tulotasoa tai energiankulutusta erikseen, ei näiden kahden yhteisvaikutusta.
Rekisterien pohjalta syntyvä tietovarallisuus on Suomen kilpailuetu. Jos hyödynnämme sitä, pystymme tekemään parempia päätöksiä niin kansalaisten arjessa, yrityksissä kuin ylimmän valtiojohdonkin tasolla.
Tietoon pohjautuvan päätöksenteon merkitys on tiedostettu. Siitä on raportteja ja selontekoja runsaasti, esimerkiksi Sipilän hallituksen aikainen tietopoliittinen selonteko ja Marinin hallituksen aikainen Valtioneuvoston periaatepäätös tiedon hyödyntämiseksi ja avaamiseksi. Teemaa käsitellään myös Julkisen hallinnon strategiassa, Suomen digitaalisessa kompassissa ja Euroopan datastrategiassa. Näissä kaikissa alleviivataan tiedon hyödyntämisen merkitystä.
Koska Tilastokeskus on ainutlaatuinen tiedon solmukohta, kohdistuu tietovarantojemme hyödyntämiseen tietenkin suuret odotukset. Niin sisältä kuin ulkoakin.
Haasteen muodostaa suurten odotusten ja supistuvien resurssien yhteensovittaminen. Tilastokeskukselle valtion budjetissa kohdennetut toimintamenot ovat reaalisesti supistuneet, ja on varauduttava siihen että supistuvat jatkossakin. Tilastokeskuksen budjetissa kilpailevat keskenään tilastotuotannon velvoitteiden täyttäminen, järjestelmien uudistamistarpeet, henkilöstön jaksaminen ja odotukset tietovarallisuuden hyödyntämisestä. Kaikkien osa-alueiden priorisoiminen yhtä aikaa on vaikeaa.
Olemme ottaneet viime vuosina tiedon hyödyntämisessä harppauksia eteenpäin. Ei ehkä yhtä suuria kuin tiedon käsittelyn teknologian kehittyminen olisi mahdollistanut, mutta merkittäviä kuitenkin. Pelkästään Tilastokeskuksen avoimessa StatFin-tietokannassa on julkaistu lähes kahdeksan miljardia havaintoa laadukasta tilastotietoa yli 5 000 tietokantakuutiossa, ja niiden määrä on kasvanut vuosittain noin 15 prosentin vauhtia.
Korona-aikainen tilannehuone raotti näkymää sille, mitä kaikkea Tilastokeskuksen käsittelemien ja yhdistelemien tietoaineistojen avulla on mahdollista tehdä. Nyt ministeriöiden datahuone jatkaa tuota työtä ministeriöiden päätöksenteon tukena. Konseptin muotouduttua olisi luonnollista rakentaa vastaavia reaaliaikaisen data-analyysin mahdollistavia datahuoneita muillekin toimijoille. Datahuone on kuitenkin vain yksi tiedon hyödyntämisen kanava.
Kansallisen tietovarallisuuden potentiaalin hyödyntämisessä on valtavasti mahdollisuuksia. Maksullista dataa voitaisiin avata yhä enemmän. Etenkin avoimen aluedatan palvelulle olisi suurta kysyntää. Keväällä (toistaiseksi) lakkautettua Findikaattori-palvelua jäivät kaipaamaan sadat tuhannet käyttäjät, ja se ansaitsisi modernisoidun seuraajan. Esimerkkiä voi hakea Virosta, mutta riman voisi nostaa korkeammallekin.
Ministeriöiden datahuoneen ohella kansalaisyhteiskunnalle olisi mahdollista rakentaa oma tilannekuvapalvelu, joka sisältäisi Tilastokeskuksen asiantuntevien data-analyytikoiden kuratoimia reaaliaikaisia ja interaktiivisia indikaattoreita ajankohtaisista aiheista. Norjan Microdata.no-tyyppisellä ”tilastokoneella” käyttäjien olisi mahdollista koostaa Tilastokeskuksen tarkoista tietoaineistoista itse haluamiaan tilastoja, kuitenkaan tinkimättä tietoturvallisuudesta.
Eri julkisen sektorin toimijoilla on paljon muitakin mittaristotarpeita eli tarve visualisoida tilannekuvaa, tavoitteita ja kehitystä kuvaavia indikaattoreita. Sen sijaan, että teemme mittaristoja kukin tahoillamme, olisi järkevää keskittää voimavaroja kansallisen indikaattorialustan rakentamiseen. Tätä ja monia muita tavoitteita tukisi kansallisen tilastotietokannan rakentaminen, jolloin eri tiedontuottajien tuottama tieto olisi saatavilla yhdestä lähteestä, yhtenäisillä metatiedoilla ja rajapinnoilla.
Tässä on mainittu muutamia, muttei tietenkään kaikkia käyttäjätarpeista kumpuavia ratkaisuja, joilla Tilastokeskuksen olisi mahdollista edistää tiedon hyödyntämistä ja saavutettavuutta Suomessa. Näin saisimme Tilastokeskukseen kootun kansallisen tietovarallisuuden paremmin käyttöön.
Viime aikojen kriisit ovat osoittaneet suomalaisen varautumistyön arvon ja huoltovarmuuden merkityksen. Tilastokeskus ylläpitää monia yhteiskunnan tietoinfrastruktuurin kannalta kriittisiä järjestelmiä. Ilman kansantalouden tilinpidon lukuja ei ole luottoluokitusta, eikä ilman luottoluokitusta ole valtionlainoja. Ilman hintaindeksien päivityksiä ei ole indeksikorotuksia. Nämä ja monet muut yhteiskunnan toiminnan kannalta tärkeät tiedot tuotetaan järjestelmillä, jotka vaativat ylläpitoa ja uudistamista.
Kansallisen tietovarallisuuden hyödyntäminen rakennetaan Tilastokeskuksen tietovarantoinfran päälle, ja infra muodostaa kivijalan, jonka kehittäminen on tiedon hyödyntämisen kannalta äärimmäisen tärkeää. Ilman tietovarantojen kehitystyötä jäävät askeleet Tilastokeskuksen modernisoinnissa ja uusissa tiedon hyödyntämisen tavoissa puolitiehen. Ennen kaikkea on varmistettava, että käytämme uusinta teknologiaa niin, että saamme hyödynnettyä tietovarallisuutemme potentiaalin tietoturvallisesti.
Meillä on Suomessa poikkeuksellinen tietovarallisuus, jonka potentiaalin lunastamisessa otamme koko ajan askeleita oikeaan suuntaan. Etenkin epävarmuuden vallitessa ja yhteiskunnan kriisinkestävyyden merkityksen noustessa, meidän on huolehdittava myös tietoinfran huoltovarmuudesta ja katsottava myös tulevaan.
Nykyteknologialla meidän on mahdollista tuottaa tietoa, jollaista ei ole ikinä ennen pystytty tuottamaan. Tilastokeskus pyrkii kaikin keinoin mahdollistamaan uusia tapoja hyödyntää tietoa kaikilla yhteiskunnan tasoilla. Uskomme, että parempi tieto tuotetaan kaikkien yhteiskunnan tiedontuottajien yhteistyönä.
Kirjoittaja on Tilastokeskuksen pääjohtaja.
Avainsanat:
Miksi tätä sisältöä ei näytetä?
Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.