Tietoa pseudotunnisteiden muutoksista

Päivitetty 3.3.2026.

FIONAssa käsiteltävien aineistojen pseudonymisointia uudistetaan. Vanhalla menetelmällä suojatut tunnisteet vaihdetaan siirtymäajan kuluessa uudella menetelmällä suojattuihin tunnisteisiin. Tutkijapalvelut tekee keskitetysti päivittyvien valmisaineistojen uudelleensuojauksen, mutta tutkimushankkeiden tulee suojata itse hankekansioissaan olevien muiden aineistojen tunnisteet, jos tietoja on tarpeen yhdistää uudella tunnisteella suojattuihin tietoihin.  

Uusi pseudonymisointiratkaisu parantaa tietoturvaa ja mahdollistaa aiempaa monipuolisempien tunnisteiden suojauksen.  

Siirtymäaikaa muutokselle on 31.12.2026 asti.

Mitä aineistoille pitää tehdä?

Päivittyvien valmisaineistojen uudelleensuojaus tehdään keskitetysti Tilastokeskuksen tutkijapalveluissa siirtymäajan kuluessa.

Muiden, manuaalisesti hankkeille vietyjen, aineistojen uudelleensuojaus tutkimushankkeiden tulee tehdä itse. Tällaisia aineistoja ovat

  • räätälöidyt aineistot
  • kertamaksulliset valmisaineistot
  • valmisaineistoista tehdyt poiminnat
  • ulkopuoliset aineistot
  • tutkijoiden työtiedostot

Tunnisteet tulee uudelleenpseudonymisoida vain, jos tietoja on tarpeen yhdistää uudella tunnisteella suojattuihin tietoihin.

Linkkitaulut tunnisteiden vaihtamiseen

FIONAan on tuotu linkkitaulut, joiden avulla vanhat tunnisteet voidaan vaihtaa uusiin. Linkkitaulut ja ohjeet löytyvät FIONAn kansiosta D:\keys.

Uudelleen suojaus tehdään W-asemalla. Kun suojaus on tehty, pyytäkää sähköpostilla tutkijapalveluita siirtämään päivitetty aineisto D-levylle.

Henkilötunnisteiden uudelleenpseudonymisointia varten tutkijoille on toimitettu shnro–hid_e-linkkitaulu. Sen avulla vanhat pseudotunnisteet voidaan muuntaa uusiin. Linkkitaulua päivitetään edelleen, sillä noin 700 hid_e-tunnukseen liittyy kaksi eri shnro-tunnistetta. Toistaiseksi suositellaan hakemaan shnro-tunnisteelle hid_e (eikä päinvastoin), jolloin vastinpareja on yleensä vain yksi. Linkkitaulu on käytössä siirtymäajan, eli 31.12.2026 asti.

Ongelmia vanhojen ja uusien tunnisteiden yhdistymisessä

Vanha suojausmenetelmä on joissain tapauksissa antanut muuttujan eri arvoille saman pseudotunnisteen. Käytännössä tätä ongelmaa on lähinnä harvinaisissa, yksittäisten hankkeiden käyttämissä pseudotunnisteissa.

Pseudotunnisteiden vaihto on heikentänyt yhdisteltävyyttä myös paljon käytetyssä suojattu yritystunnus -muuttujassa (syrtun). Ongelmia on syntynyt silloin, kun yritystunnus-muuttujaan on tallennettu muita arvoja kuin yritystunnus: tällöin vanhan ja uuden pseudotunnisteen välinen linkki ei epätyypillisten tunnusten osalta välttämättä toimi. Tällaisia tapauksia löytyy esimerkiksi henkilöyrittäjistä, joiden tunnisteena on erityisesti vanhemmissa aineistoissa yritystunnuksen sijaan henkilötunnus. Yritystunnuksiin liittyvä ongelma koskee erityisesti yritystunnuksia sisältäviä valmisaineistoja.

EDUC_TYHR-, EDUC_ESIPERUS- ja EDUC_OPISK -valmisaineistojen OID‑muuttujien pseudotunnisteiden muunnoksessa uuteen tunnisteeseen on havaittu epäjohdonmukaisuus. Tämä vaikuttaa kyseisten aineistojen OID‑muuttujien yhdisteltävyyteen muiden aineistojen OID‑muuttujiin.

Tutkijapalvelut käy läpi aineistoja ja pyrkii toteuttamaan korjaustoimenpiteitä mahdollisimman pian. Aiheesta tiedotetaan lisää tällä sivulla.

Vaikutukset tutkimustulosten toistettavuuteen

Vanhan ja uuden suojausratkaisun erot voivat johtaa siihen, ettei eri menetelmillä suojatuilla aineistoilla saada täysin identtisiä tutkimustuloksia. Tämä on olennaista huomioida erityisesti hankkeissa, joilla on tutkimusartikkeli keskeneräisessä julkaisuprosessissa.

Jos vanhoilla pseudotunnisteilla suojattuja aineistoja ei ole tarpeen yhdistää uusiin tietoihin, uusia pseudotunnisteita ei tarvitse ottaa käyttöön. Tilanteissa, joissa uusiin tunnisteisiin siirtyminen on välttämätöntä, mutta vanhalla tavalla suojattuja aineistoja tarvitaan vielä, voidaan sopia poikkeusjärjestelystä. Tällöin tutkijapalvelut voi tarjota FIONAssa hankkeelle erillisen kansion, jonne tarvittavat koodit, aputiedostot ja tarvittaessa myös aineistot voidaan siirtää.

Jos hankkeella on tarve säilyttää vanhalla tunnisteella suojattuja aineistoja esimerkiksi julkaisuprosessissa olevan tutkimuksen tulosten toistettavuuden vuoksi, tulee sen lähettää ilmoitus tutkijapalveluille sähköpostilla 30.6.2026 mennessä. Ilmoituksessa tulee olla seuraavat tiedot:  

  • julkaisun nimi  
  • replikoinnin vaatimien tiedostojen kansio W-levyllä  
  • julkaisuprosessin sen hetkinen vaihe  
  • päivämäärä, johon saakka replikointitarve jatkuu 

Hanke sitoutuu poistamaan kansion sisällön ilmoittamansa ajan päätyttyä.

Tallennustilan riittävyys

Aineistojen uudelleenpseudonymisointi kuluttaa levytilaa, ja se voi aiheuttaa ongelmia erityisesti, jos hankkeella on käytössä suuria uudelleensuojattavia aineistoja.

Tallennustilan riittämättömyys ymmärrettävästi vaikeuttaa pseudotunnisteiden vaihtoa. Tutkijapalvelut selvittää parhaillaan vaihtoehtoja tallennustilan lisäämiseksi.

Tällä hetkellä ongelmaa voi kiertää pilkkomalla aineiston osiin, ja siirtämällä tiedostot W-asemalta D-asemalle useassa erässä.

Aikataulu

Uusiin tunnisteisiin siirtymisen määräaikaa on jatkettu vuoden 2026 loppuun. Tutkimushankkeiden aineistojen tulee olla uudelleensuojattuja viimeistään 31.12.2026. 

Määräaika ei koske hankkeita, jotka eivät enää laajene. Jos hankkeille ei lisätä uusia aineistoja, vanhojen aineistojen käyttöä voi jatkaa vanhoilla tunnisteilla.  

Uudet aineistot hankkeille pseudonymisoidaan uusia tunnisteita käyttäen.

Yhteystiedot

Miksi tätä sisältöä ei näytetä?

Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.