Siirry etusivulle - Tilastokeskus
Tieto&trendit - etusivulle

Turvallinen tie tutkimusaineistojen käyttöön

Kuva: Tilastokeskus

Olemme Tilastokeskuksessa aloittaneet tutkijoiden kanssa keskustelun siitä, miten he voivat entistä paremmin varmistaa tietosuojan toteutumisen, kun tutkimuksissa käsitellään suojattuja yksikkötason aineistoja eli mikrodataa. Uskomme, että tämä on paras tapa varmistaa tiedon turvallinen käyttö.

Suomi on edelläkävijä tarkan tiedon hyödyntämisessä tieteessä ja päätöksenteossa: tämä etulyöntiasema on perustunut laadukkaisiin rekistereihin ja päämäärätietoisiin ponnistuksiin, joilla tiedon käyttöä on edistetty. Viime vuosina mikrodatan käyttö on yleistynyt tutkimuksen ohella myös yhteiskunnan päätöksenteon tukena.

Tilastokeskuksen lakisääteisenä tehtävänä on tilastoinnin lisäksi edistää tietojensa käyttöä tieteellisessä tutkimuksessa. Tilastokeskuksen tutkijapalvelun kautta tutkijat voivat saada käyttöönsä henkilöitä ja yrityksiä kuvaavia mikroaineistoja, joista on poistettu suorat tunnistetiedot. Tietoja voidaan myös yhdistellä muiden viranomaisten tai tutkijoiden itse keräämiin aineistoihin.

Aineistojen käyttö edellyttää aina käyttölupaa. Tutkijat käsittelevät tietoja Tilastokeskuksen ylläpitämässä tietoturvallisessa etäkäyttöympäristössä, josta aineistoja ei voi kopioida muualle. Tällä hetkellä noin tuhat tutkijaa käyttää Tilastokeskuksen tietoja etäkäyttöympäristössä.

Tiedon käytön lisääntyessä tietoturvasta ja tietosuojasta tulee entistäkin tärkeämpää. Olemme nyt käynnistämässä työtä, jonka tavoitteena on toisaalta vahvistaa henkilötietojen suojaa rekisteritietojen tutkimuskäytössä ja toisaalta varmistaa, että tutkijat saavat jatkossakin käyttöönsä tarvitsemansa tiedot.

Keskeisiä kysymyksiä tässä työssä ovat, miten tutkimuksessa tarvittava aineisto määritellään, missä tilanteissa tietojen käsittelyä on syytä jakaa pienempiin osakokonaisuuksiin, ja tulisiko luvansaajien luotettavuutta arvioida ennen tietoluvan myöntämistä. Uusi ohjeistus on tarkoitus ottaa käyttöön vuoden 2025 loppuun mennessä.

Tilastokeskuksen lupapäätös perustuu aina arvioon siitä, onko hakijalla lailliset perusteet saada käyttöönsä haettavat tiedot. Osana päätöksentekoa tarkastellaan muun muassa sitä, toteutuuko EU:n tietosuoja-asetuksen edellyttämä henkilötietojen käsittelyn minimointi.

Minimointiperiaatteen mukaisesti kaikkien käsiteltävien tietojen tulee olla tarpeellisia. Vaikka periaate on selkeä, joskus sen soveltaminen ei ole helppoa. Tutkijat eivät tutkimusta aloittaessaan välttämättä tiedä tarkasti, mitä tietoja tutkimuksessa tarvitaan. Aineistoja voidaankin ensin tarvita riippuvuussuhteiden tutkimiseen ja tutkimusongelman täsmentämiseen. Myös tämä on oikeutettu käyttötarkoitus.

Joskus tutkimuksen kohdejoukon ulkopuolelle jäävä osa väestöstä tai joidenkin vuosien tiedot voidaan kuitenkin rajata pois aineistosta jo ennen tietojen luovuttamista. Laajoissa tutkimushankkeissa, joissa eri tutkimuskysymyksiin tarvitaan eri tietoja, voi olla perusteltua ryhmitellä tiedot osakokonaisuuksiin, joihin tutkijat saava käyttöoikeuden tarpeen mukaan. Parhaat edellytykset tämän ryhmittelyn tekemiseen on tutkijoilla itsellään.

Tutkijoiden huolena on, että nyt valmisteltavat muutokset kasvattavat kustannuksia ja heikentävät aineistojen saatavuutta. Pyrimme toteuttamaan muutokset niin, että niistä aiheutuu mahdollisimman vähän lisäkustannuksia ja viiveitä tietojen käyttöön saamisessa. Vahvempi tietosuoja voi kuitenkin lisätä tutkijoiden työmäärää ja tutkimushankkeiden kustannuksia.

Hakijalta todennäköisesti pyydetään aiempaa tarkempia kuvauksia ja perusteluja tarvittavista tiedoista ja tietojen yhdistelystä. Poikkeuksellisen laajoihin tietokokonaisuuksiin tai erityisiin henkilötietoryhmiin, kuten terveyteen tai etnisyyteen, kohdistuvissa lupahakemuksissa hakijaa voidaan pyytää tekemään tietosuojan vaikutusten arviointi. On myös mahdollista, että tietojen käsittelyn jakaminen aiempaa pienempiin osakokonaisuuksiin nostaa jonkin verran etäkäyttöjärjestelmän käytön kustannuksia.

Haluamme suunnitella muutokset yhdessä tutkijoiden kanssa. Tutkimushankkeen vastuututkijalla ja tutkimusorganisaatiolla on tutkimusaineiston rekisterinpitäjänä tietosuoja-asetuksessa määritelty vastuu tietojen käsittelystä ja tietosuojasta. Pyrimme ensisijaisesti siihen, että vastuututkija voi entistä paremmin suunnitella tietojen käyttöä ja hallintaa ja näin varmistaa tietosuojan toteutumisen.

Olemme sopineet tälle syksylle tapaamisia tutkijoiden kanssa ja kuulemme mielellämme ehdotuksia parhaista ratkaisuista. On yhteinen etumme varmistaa, että luottamus tietojen tutkimuskäyttöön säilyy ja aineistot ovat jatkossakin laajasti tutkijoiden käytettävissä.

Kirjoittaja työskentele ryhmäpäällikkönä Tilastokeskuksen tutkijapalveluissa.

Avainsanat:

Miksi tätä sisältöä ei näytetä?

Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.