Tutkijapalvelut 10+ vuotta

Tälle sivulle on koottu katsaus tutkijapalveluiden historiaan ja kehitykseen.

Tutkijapalveluiden virstanpylväitä

2010

Tutkijapalvelut keskittyy nykyisen kaltaiseksi toiminnoksi. Ensimmäinen etäkäyttöjärjestelmä käytössä.

2013

SISU-mikrosimulointimalli otetaan käyttöön. Tilastolaki uudistuu: henkilötietojen anonymisoinnista siirrytään pseudonymisointiin.

2015

Taika-valmisaineistokatalogi käyttöön. FIONA-etäkäyttöjärjestelmä siirtyy CSC:n ylläpidettäväksi.

2017

Yli puolella etäkäyttöhankkeista käytössä ainakin yksi valmisaineisto.

2020

FIONA-etäkäyttöjärjestelmästä uusi versio. Helsinki GSE:n Tilannehuone perustetaan.

2022

Tutkijapalveluiden sähköinen lupapalvelu otetaan käyttöön. Datahuone perustetaan kehittämään nopeaa tiedontuotantoa.

2023

Laki Tilastokeskuksesta. Datahuonepilotille rahoitus 2023–2025.

Tutkijapalvelut syntyy

Tilastokeskuksen tutkijapalvelut muodostuivat nykyisen kaltaiseksi toiminnoksi vuonna 2010. Aineistoja tarjottiin tutkijoiden käyttöön jo ennen tätä, mutta tutkijapalveluiden keskittymisen ja etäkäyttöjärjestelmän käyttöönoton myötä aineistojen tutkimuskäyttö helpottui ja sekä käyttäjien että aineistojen määrät lähtivät kasvuun.

Ohessa kuvio käyttölupahakemusten ja toimitusten määristä vuosina 2010–2022. Toimituksissa on mukana vain aineistoluvat. Vuodesta 2017 eteenpäin käyttölupien laajennus- ja jatkohakemukset on laskettu erikseen.Kuvio: Hakemukset ja toimitukset vuosina 2010–2022. Vuonna 2010 käyttölupahakemuksia tuli 30 kappaletta, minkä jälkeen määrä nousi tasaisesti vuoteen 2019, jolloin hakemuksia tuli 552 kappaletta. Tämän jälkeen määrät ovat hieman laskeneet ja vuonna 2022 käyttölupahakemuksia tuli 339 kappaletta. Vuonna 2010 aineistolupien toimituksia tehtiin 11 kappaletta. Myös toimitusten määrä on noussut ja ollut korkeimmillaan yli 267 kappaletta vuonna 2017. Tämän jälkeen toimitusten määrä on hieman laskenut, ja vuonna 2022 niitä tehtiin 166 kappaletta.

Otosluovutuksista etäkäyttöön

Aineistoja on ollut tarjolla tutkijoiden käyttöön jo pitkään. Henkilöaineistoja on luovutettu eri käyttötarkoituksia varten räätälöityinä otoksina 1990-luvulta lähtien, ja jo sitä ennen tutkimuskäytössä oli muun muassa väestölaskenta- ja kuolemansyytietoja sisältävä EKSY-aineisto. EKSY olikin yksi ensimmäisistä valmiiksi muodostetuista tutkimusaineistoista ja nykyisten valmisaineistojen edeltäjä. 

Toinen merkittävä aineisto oli Työvoimapoliittisten toimenpiteiden vaikuttavuusaineisto, joka oli FLEED-aineiston eli yhdistetyn työntekijä-työnantaja-aineiston edeltäjä. FLEEDin seuraajia taas ovat nykyiset FOLK- ja FIRM-aineistot. Yritysaineistot saatiin 2000-luvun alussa käyttöön Tilastokeskuksen tiloihin perustetun tutkimuslaboratorion myötä.

Vuonna 2015 käyttöön saatiin uusia valmisaineistoja ja TAIKA-katalogi, johon on koottu tutkijapalveluiden valmisaineistojen kuvaukset. Valmisaineistot on suunniteltu sopimaan monenlaisiin tutkimuksiin ja niiden käyttö onkin ollut runsasta. Vuodesta 2021 alkaen kuolemansyyaineistojen luvituksista yhä suurempi osa on siirtynyt Findatalle, mikä näkyy aineistojen toimituksissa.

Kuvio: Aineistojen toimitukset tyypeittäin vuosina 2017–2022. Kuolemansyyaineistojen toimituksia oli vuonna 2017 noin 85 kappaletta. Tämän jälkeen määrä on laskenut tasaisesti, poikkeuksena vuosi 2020, jolloin toimitusten määrä oli noin 80. Vuonna 2022 kuolemansyyaineistojen toimituksia oli noin 25. Kuolemansyiden luvitus on siirtynyt osittain Findatalle, mikä näkyy aineistotoimitusten määrässä.   Räätälöityjä, etäkäyttöön meneviä aineistoja toimitettiin vuonna 2017 noin 80 kappaletta. Tämän jälkeen toimitusten määrä on sahannut noin 40–60 toimituksen välillä per vuosi. Vuonna 2022 räätälöityjä etäkäyttöaineistoja toimitettiin hieman alle 50 kappaletta.   Tunnisteellisia aineistoja toimitettiin vuonna 2017 noin 20 kappaletta, ja määrä on pysynyt sen jälkeen 20–25 välillä. Poikkeuksena ovat vuodet 2019 ja 2020, jolloin toimituksia tehtiin 43 ja 35 kappaletta.   Valmisaineistoja toimitettiin vuonna 2017 hieman alle 40 kappaletta. Tämän jälkeen valmisaineistotoimitusten määrä nousi ja niitä on tehty noin 55–65 vuodessa. Vuonna 2022 valmisaineistotoimituksia tehtiin 55 kappaletta.

Ensimmäinen etäkäyttöjärjestelmä, TKOnline, otettiin käyttöön vuonna 2009. Tutkijapalveluiden perustamisvuonna pilotoitiin nykyinen FIONA-etäkäyttöjärjestelmä, jota on vuosien varrella kehitetty paljon. Vuonna 2015 järjestelmä siirrettiin CSC:n ylläpidettäväksi ja vuonna 2020 siitä otettiin käyttöön uusi versio.

FIONAn käyttö on kasvanut tasaisesti. Etäkäyttöhankkeiden lukumäärän lisäksi hankekohtaiset käyttäjämäärät ovat nousseet.

FIONA-etäkäyttöjärjestelmän hankkeiden ja käyttäjien määrää vuosina 2011–2022 on kuvattu oheisessa kuviossa. Käyttäjämääristä ei ole lukuja vuosilta 2011–2012.

Kuvio: Etäkäyttömäärien kehitys vuosina 2011–2022. Vuodelta 2011 ja 2012 on luvut vain hankkeiden määrästä. Vuonna 2011 etäkäyttöhankkeita oli 24 kappaletta ja hankkeiden määrä on kasvanut sen jälkeen tasaisesti. Vuonna 2022 etäkäyttöhankkeita oli 267 kappaletta.   Käyttäjämäärät ovat kasvaneet hankkeiden määrää enemmän, eli hankkeiden koot ovat suurentuneet. Vuonna 2013 käyttäjiä oli noin 100 ja vuonna 2022 jo melkein 900.

Tutkijapalvelut kasvaa ja kehittyy

Tutkijapalvelut on vuosien varrella ollut mukana monenlaisissa kehittämisprojekteissa, kuten Finnish Microdata Access Service -hankkeessa (FMAS), joka oli Suomen Akatemian kansallisen tutkimusinfrastruktuurin tiekartalla ja jolle myönnettiin FIRI-rahoitusta vuodeksi, sekä Sitran vetämässä ISAACUS-hankkeessa, jossa muun muassa pilotoitiin kansallista tutkimusaineistojen etäkäyttöjärjestelmää.

Tutkijapalveluissa on tapahtunut myös paljon muuta kehittämistä: esimerkiksi vuonna 2013 otettiin käyttöön SISU-mikrosimulointimalli ja perustettiin sen ylläpito, ja vuonna 2022 saatiin käyttöön sähköinen lupapalvelu. Lisäksi tutkijapalvelut on kasvanut kokoa vuosien varrella: henkilöstön määrä on noussut vuoden 2010 alle kymmenestä työntekijästä vuoden 2023 noin 35 työntekijään.

Oheisessa kuviossa näkyy henkilöstön määrän kehitys vuosina 2013–2022. Vuosien 2021 ja 2022 luvuissa on mukana myös osa-aikaisesti tutkijapalveluissa työskennelleitä, kuten lainatutkijoita.

Kuvio: Henkilöstön määrä vuosina 2013–2022. Vuonna 2013 henkilöstön määrä oli 14 ja se on noussut tasaisesti. Vuonna 2022 henkilöstöä oli noin 37. Vuosien 2021 ja 2022 lukuihin on laskettu mukaan myös osa-aikaiset lainatutkijat, minkä vuoksi ne ovat hieman muuta kehitystä korkeammat.

Lakipykälät muuttuvat

Myös lainsäädäntö on vaikuttanut tutkijapalveluiden toimintaan. Vuoden 2013 tilastolain uudistuksen myötä aineistojen anonymisoinnista siirryttiin pseudonymisointiin, mikä vaikutti suuresti tutkimusaineistojen käytettävyyteen. Tästä kymmenen vuotta myöhemmin vuonna 2023 päivitettiin laki Tilastokeskuksesta. Uudessa laissa tutkija- ja aineistopalvelu nostettiin Tilastokeskuksen tehtäväksi tilastotuotannon rinnalle, mikä selkeytti tutkijapalveluiden asemaa. Laki myös mahdollistaa rekisteriaineistojen toimittamisen perusteltuihin tarpeisiin jo ennen tilastojen julkaisua.

Tutkijapalvelut ja Datahuone

Korona-aikana perustetun Helsinki Graduate School of Economicsin Tilannehuoneen pohjalta syntyi Valtion taloudellisen tutkimuskeskuksen (VATT) Datahuone, joka perustettiin vuonna 2022. Tilannehuoneen aikana rakennettu yhteistyö on jatkunut Datahuoneen kanssa ja tutkijapalveluilla on tärkeä rooli datahuoneinfrastruktuurin rakentamisessa sekä aineistojen käsittelystä ja toimituksesta huolehtimisessa. Datahuone vahvistaa tietopohjaista päätöksentekoa ja sen avulla saadaan kansallinen tietovarantomme aiempaa laajempaan käyttöön.