Tietoa pseudotunnisteiden muutoksista

Sivu päivitetty 15.5.2026

FIONAssa käsiteltävien aineistojen pseudonymisointia uudistetaan. Vanhalla menetelmällä suojatut tunnisteet vaihdetaan siirtymäajan kuluessa uudella menetelmällä suojattuihin tunnisteisiin. Tutkijapalvelut tekee keskitetysti päivittyvien valmisaineistojen uudelleensuojauksen, mutta tutkimushankkeiden tulee suojata itse hankekansioissaan olevien muiden aineistojen tunnisteet, jos tietoja on tarpeen yhdistää uudella tunnisteella suojattuihin tietoihin. Tilastokeskus tarjoaa hankkeille lisää levytilaa pseudotunnisteiden vaihtoa varten.

Uusi pseudonymisointiratkaisu parantaa tietoturvaa ja mahdollistaa aiempaa monipuolisempien tunnisteiden suojauksen.  

Siirtymäaikaa muutokselle on 31.12.2026 asti.

Mitä aineistoille pitää tehdä?

Päivittyvien valmisaineistojen uudelleensuojaus tehdään keskitetysti Tilastokeskuksen tutkijapalveluissa siirtymäajan kuluessa.

Muiden, manuaalisesti hankkeille vietyjen, aineistojen uudelleensuojaus tutkimushankkeiden tulee tehdä itse. Tällaisia aineistoja ovat

  • räätälöidyt aineistot
  • kertamaksulliset valmisaineistot
  • valmisaineistoista tehdyt poiminnat
  • ulkopuoliset aineistot
  • tutkijoiden työtiedostot

Tunnisteet tulee uudelleenpseudonymisoida vain, jos tietoja on tarpeen yhdistää uudella tunnisteella suojattuihin tietoihin.

Linkkitaulut tunnisteiden vaihtamiseen

FIONAan on tuotu linkkitaulut, joiden avulla vanhat tunnisteet voidaan vaihtaa uusiin. Linkkitaulut ja ohjeet löytyvät FIONAn kansiosta D:\keys.

Tunnisteiden uudelleen suojaus tehdään muodostamalla alkuperäisestä aineistosta kopio, jossa vanhat tunnisteet on korvattu linkkitaulusta poimituilla uusilla tunnisteilla. Kun uusi versio aineistosta on tehty ja sen sisältö on varmistettu oikeaksi, pyytäkää sähköpostilla tutkijapalveluita siirtämään päivitetty aineisto D-levylle. Uusi versio korvaa silloin aiemman, vanhoilla tunnisteilla suojatun version, joka poistetaan tässä yhteydessä. Tutkijapalvelut tarkastaa siirron yhteydessä sisällön vastaavuuden vain silmämääräisesti, jolloin vastuu laadun varmistuksesta on käyttäjällä.

Maksuton lisätila saatavilla pseudotunnisteiden vaihtoa varten

Tutkijapalvelut perustaa FIONAan uuden, väliaikaisen levyosion pseudotunnisteiden vaihtamisen tueksi. Levyosion tunnus on X:, ja se otetaan käyttöön kesän aikana. Tarkka ajankohta ilmoitetaan heti sen varmistuessa, tavoitteena on saada tila käyttöön mahdollisimman pian. 

X-levy on käytössä vuoden loppuun saakka, jolloin myös pseudotunnisteiden vaihdon siirtymäaika päättyy. 

Levytilan käyttöönotto

X-levylle perustetaan hankekohtaisia kansioita, joihin on luku- ja kirjoitusoikeus vain kyseisen hankkeen käyttäjillä. 

  • Kansio luodaan vain pyynnöstä
  • Pyynnöt osoitteeseen: tutkijapalvelut@stat.fi  
  • Viestissä tulee ilmoittaa FIONA-hanketunnus sekä pyyntö maksuttomasta lisätilasta pseudotunnisteiden vaihtoa varten

Ilmoittautuminen on avoinna välittömästi. Ensimmäinen erä pyyntöjä toimitetaan FIONA-ylläpidolle alustavan arvion mukaan 4.6., mutta pyyntöjä voi lähettää tämän jälkeenkin. 

X-levyn käyttötarkoitus 

X-levy on tarkoitettu ainoastaan pseudotunnisteiden vaihtamiseen. Levyä ei tule käyttää muuhun työskentelyyn tai aineistojen säilytykseen. 

Toimintaohje pseudotunnisteiden vaihdossa 

1. Nouda D-asemalla sijaitsevan aineiston uudet tunnisteet: 

  • Lähde: D:/keys-kansion linkkitaulu 
  • Avaimena käytetään vanhaa tunnistetta 

2. Muodosta uusi aineisto: 

  • Tallenna poiminnan tuloksena syntyvä tiedosto X-asemalle 

3. Tarkista aineisto huolellisesti: 

  • uudet tunnisteet ovat mukana 
  • vanhat tunnisteet on poistettu 

Tutkija vastaa itse aineiston oikeellisuudesta, joten tarkistus on tehtävä erityisen huolellisesti. 

Levytilan käyttö ja vapauttaminen 

X-levyn kapasiteetti jaetaan hankkeiden kesken. Jotta palvelu toimii sujuvasti kaikille:

  • Tarkista uuden aineistoversion laatu välittömästi 
  • Tämän jälkeen pyydä Tutkijapalveluita siirtämään aineisto D-asemalle 
  • Kun aineisto on siirretty, poista se X-levyltä viipymättä 

Yksittäisen hankkeen samanaikainen levytilan käyttö on rajattu enintään 500 gigatavuun

Käytännön vinkkejä ja havaintoja pseudotunnisteiden yhdistelystä

Henkilötunnisteiden uudelleenpseudonymisointia varten tutkijoille on toimitettu shnro–hid_e-linkkitaulu. Sen avulla vanhat pseudotunnisteet voidaan muuntaa uusiin. Linkkitaulua päivitetään edelleen, sillä noin 700 hid_e-tunnukseen liittyy kaksi eri shnro-tunnistetta. Toistaiseksi suositellaan hakemaan shnro-tunnisteelle hid_e (eikä päinvastoin), jolloin vastinpareja on yleensä vain yksi. Linkkitaulu on käytössä siirtymäajan, eli 31.12.2026 asti.

Ongelmia vanhojen ja uusien tunnisteiden yhdistymisessä

Vanha suojausmenetelmä on joissain tapauksissa antanut muuttujan eri arvoille saman pseudotunnisteen. Käytännössä tätä ongelmaa on lähinnä harvinaisissa, yksittäisten hankkeiden käyttämissä pseudotunnisteissa.

EDUC_TYHR-, EDUC_ESIPERUS- ja EDUC_OPISK -valmisaineistojen OID‑muuttujien pseudotunnisteiden muunnoksessa uuteen tunnisteeseen on havaittu epäjohdonmukaisuus. Tämä vaikuttaa kyseisten aineistojen OID‑muuttujien yhdisteltävyyteen muiden aineistojen OID‑muuttujiin.

Tutkijapalvelut käy läpi aineistoja ja pyrkii toteuttamaan korjaustoimenpiteitä mahdollisimman pian. Aiheesta tiedotetaan lisää tällä sivulla.

Yritystunnukset

Pseudotunnisteiden vaihto on heikentänyt yhdisteltävyyttä paljon käytetyssä suojattu yritystunnus -muuttujassa (syrtun). Ongelmia on syntynyt silloin, kun yritystunnus-muuttujaan on tallennettu muita arvoja kuin yritystunnus: tällöin vanhan ja uuden pseudotunnisteen välinen linkki ei epätyypillisten tunnusten osalta välttämättä toimi. Tällaisia tapauksia löytyy esimerkiksi henkilöyrittäjistä, joiden tunnisteena on erityisesti vanhemmissa aineistoissa yritystunnuksen sijaan henkilötunnus. Yritystunnuksiin liittyvä ongelma koskee erityisesti yritystunnuksia sisältäviä valmisaineistoja.

Yritystunnusten yhdistämisen korjaaminen

Yritystunnuksiin liittyvien yhdistämisongelmien korjaaminen on aloitettu FIRM FSS -valmisaineistosta.

Muuttujaan yrtun_s on päätynyt vääriä arvoja niissä tapauksissa, joissa syrtun on sisältänyt muun kuin yritystunnuksen, esimerkiksi henkilötunnuksen. Ongelman korjaaminen on aloitettu, ja ensimmäiseksi korjataan FIRM FSS -valmisaineisto. Jatkossa syrtun-muuttujan sisältämät erilaiset arvot jaetaan omiin muuttujiinsa, jolloin suojattu yritystunnus ja hid_e ovat aineistossa erikseen.

FIRM FSS -valmisaineiston osalta ongelma koskee erityisesti vanhempia vuosia. Näissä tapauksissa voidaan hyödyntää muuttujaa syrtun2 vuosina 1986–1998, joka sisältää yritystunnuksen niillä riveillä, joilla syrtun sisältää henkilötunnuksen. Jos arvot eroavat toisistaan, voidaan syrtun2-muuttujaa käyttää muuttujan yrtun_s linkittämiseen.

Valmisaineistojen tunnisteiden muutokset

Tutkijapalvelut uudelleensuojaa valmisaineistojen tunnisteet. Suurin osa valmisaineistosta on jo suojattu uudelleen, mutta osaa vielä käsitellään.

Aineistot, joiden uudelleensuojaus on vielä kesken:

  • EDUC_ESIPERUS_K, EDUC_OPISK_K, EDUC_TYHR_K, EDUC_HAREK, EDUC_VIRTA
  • FOLK_MUUTTO_MAANOSA, FOLK_MUUTTO_SUOMI_MUU, FOLK_VL_7085, FOLK_TKT
  • FLOWN
  • TRAFI_ajoneuvo, TRAFI_omistaja

Aineistot, joiden uudelleensuojaus on valmis:

  • EDUC_ESIPERUS, EDUC_OPISK, EDUC_TREK, EDUC_TYHR, EDUC_YTL
  • FIRM_BANKR, FIRM_BASE, FIRM_COMMOD, FIRM_CPI, FIRM_DEMOG, FIRM_EMPENT, FIRM_EMPEST, FIRM_ENTER, FIRM_ESTAB, FIRM_FAMBUS, FIRM_FSS, FIRM_GROUP, FIRM_GVC, FIRM_ICT, FIRM_IFATS,FIRM_OFATS, FIRM_PAT, FIRM_PROD, FIRM_RDINNO, FIRM_SUBSID, FIRM_TRADE, FIRM_TRANSP, FIRM_VAT
  • FOLK_ASKUN, FOLK_ASLII, FOLK_ENHEN, FOLK_JAKSOT (ELAKE, TYOTTOMAT, SIJOITETUT, TYONHAKIJAT, TKT, TYOSUHDE), FOLK_LAPS, FOLK_MUUTTO, FOLK_PERH, FOLK_PERUS, FOLK_TULO, FOLK_TUTK, FOLK_VAEN
  • INFRA_SIJAINTI
  • KEHA_URA, TEM_TYOKUNTO, TEM_TYONHAKIJA, TEM_TYONHAKU, TEM_TYOPAIKKA
  • MIGR_OLESK
  • PRH_BOARD
  • SES_BASE, SES_HAR
  • TAX_BENEFIT, TAX_INCOMES, TAX_SUMINCOMES, TAX_HELPPO, TAX_XPER
  • TULLI_COMMOD, TULLI_ENTER

Vaikutukset tutkimustulosten toistettavuuteen

Vanhan ja uuden suojausratkaisun erot voivat johtaa siihen, ettei eri menetelmillä suojatuilla aineistoilla saada täysin identtisiä tutkimustuloksia. Tämä on olennaista huomioida erityisesti hankkeissa, joilla on tutkimusartikkeli keskeneräisessä julkaisuprosessissa.

Jos vanhoilla pseudotunnisteilla suojattuja aineistoja ei ole tarpeen yhdistää uusiin tietoihin, uusia pseudotunnisteita ei tarvitse ottaa käyttöön. Tilanteissa, joissa uusiin tunnisteisiin siirtyminen on välttämätöntä, mutta vanhalla tavalla suojattuja aineistoja tarvitaan vielä, voidaan sopia poikkeusjärjestelystä. Tällöin tutkijapalvelut voi tarjota FIONAssa hankkeelle erillisen kansion, jonne tarvittavat koodit, aputiedostot ja tarvittaessa myös aineistot voidaan siirtää.

Jos hankkeella on tarve säilyttää vanhalla tunnisteella suojattuja aineistoja esimerkiksi julkaisuprosessissa olevan tutkimuksen tulosten toistettavuuden vuoksi, tulee sen lähettää ilmoitus tutkijapalveluille sähköpostilla 30.6.2026 mennessä. Ilmoituksessa tulee olla seuraavat tiedot:  

  • julkaisun nimi  
  • replikoinnin vaatimien tiedostojen kansio W-levyllä  
  • julkaisuprosessin sen hetkinen vaihe  
  • päivämäärä, johon saakka replikointitarve jatkuu 

Hanke sitoutuu poistamaan kansion sisällön ilmoittamansa ajan päätyttyä.

Tallennustilan riittävyys

Aineistojen uudelleenpseudonymisointi kuluttaa levytilaa, ja se voi aiheuttaa ongelmia erityisesti, jos hankkeella on käytössä suuria uudelleensuojattavia aineistoja.

Tutkijapalvelut tarjoaa maksutonta lisätilaa hankkeille kesästä alkaen vuoden 2026 loppuun asti. Lisätilan saa käyttöön ilmoittamalla tarpeesta tutkijapalveluille.

Aikataulu

Uusiin tunnisteisiin siirtymisen määräaikaa on jatkettu vuoden 2026 loppuun. Tutkimushankkeiden aineistojen tulee olla uudelleensuojattuja viimeistään 31.12.2026. 

Määräaika ei koske hankkeita, jotka eivät enää laajene. Jos hankkeille ei lisätä uusia aineistoja, vanhojen aineistojen käyttöä voi jatkaa vanhoilla tunnisteilla.  

Uudet aineistot hankkeille pseudonymisoidaan uusia tunnisteita käyttäen.

Yhteystiedot

Miksi tätä sisältöä ei näytetä?

Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.