Siirry etusivulle - Tilastokeskus
Tieto&trendit - etusivulle

Metsässä puita etsimässä – tulorekisteri tarjoaa tietoa nopeasti ja herättää kysymyksiä

Kuva: Alina Mäkynen

Vuodesta 2019 käytössä olleeseen tulo­rekisteriin on sijoitettu paljon toiveita tilastoinnin puolesta. Rekisteri­aineistojen etuja ovat kattavuus ja helppo saatavuus. Lisäksi tulo­rekisteristä tekee kiinnostavan sen ajantasaisuus: työnantajat toimittavat kaikki palkka- ja muut maksutiedot sekä monia taustatietoja rekisteriin käytännössä reaali­aikaisesti. Tämä mahdollistaa monien kehitys­kulkujen nopean tarkastelun.

Koronakriisin erilaisia vaikutuksia on tulorekisterin avulla jo analysoitukin, esimerkiksi Tilasto­keskuksessa ja Helsinki GSE:n tilanne­huoneessa.

Tulorekisteri sisältää paljon informaatiota, josta osaa on helpohkoa tulkita. Rekisterin sisältö on kuitenkin lähinnä palkkatietoja, joten esimerkiksi henkilön toimintaa täytyy yrittää päätellä niiden avulla. Toimintatietoja taas voidaan käyttää edelleen esimerkiksi sosio­ekonomisen aseman määrittämiseen.

Esimerkiksi palkansaajien määrittämiseen rekisteristä ei ole selvää reseptiä. Onneksi tulorekisteri sisältää kosolti muuttujia, joita tämän kaltaisissa tehtävissä voi hyödyntää. Parhaita tuloksia ovat toistaiseksi tuottaneet erilaiset koneoppimis­menetelmät, kuten yksinkertainen luokittelupuu. Menetelmät pystyvät luomaan ja kokeilemaan monimutkaisiakin sääntöjä suurella määrällä muuttujia.

Kuviossa 1 on ensin Tulo- ja elinolo­tutkimuksen (TUEL) kysely­aineiston perusteella tutkittu, millaiset rekisterin tiedot ennustavat palkansaajana toimimista parhaiten. Tämän jälkeen samalla säännöllä on määritetty palkansaajat koko rekisterin aineistosta.

Kuvio 1. Palkansaajien (tulorekisteri, luokittelupuun avulla) ja työllisten (työvoima­tutkimus) määriä 2019-7/2020
Kuvio 1. Palkansaajien (tulorekisteri, luokittelupuun avulla) ja työllisten (työvoima­tutkimus) määriä 2019-7/2020 Lähde: Tilastokeskus, työvoima­tutkimus ja tulorekisteri
Lähde: Tilastokeskus, työvoima­tutkimus ja tulorekisteri

Harhaa luvuissa esimerkiksi työvoima­tutkimuksen työllisyys­lukuihin verrattuna aiheuttavat ainakin erilaiset määritelmät, keruutapa ja aineistoihin liittyvät rajoitteet. Tulorekisteristä yrittäjien määrittäminen on vaikeaa, eivätkä lomautukset eroa rekisterin tiedoissa työttömyydestä tai työvoiman ulkopuolella olosta. Tällä karkealla tavalla laskettu arvio seurailee virallista työvoima­tutkimuksen tuottamaa työllisyys­lukua jokseenkin hyvin kehityksen osalta; tason eroja taas selittävät jonkin verran yrittäjien ja lomautettujen määrät.

Vuoden 2020 aikana erot kasvavat, mikä voi johtua poikkeuksellisesta tilanteesta työmarkkinoilla. Esimerkiksi taantuman vaikutuksia tulorekisterin tietojen laatuun on vaikeaa arvioida, sillä tietoa aiemmista tilanteista ei ole.

Koska tietoja ilmoitetaan rekisteriin kuukauden aikana, on ainakin teoriassa mahdollista käyttää jo kuukauden alkupuolen tietojakin reaali­aikaiseen työllisyyden mittaamiseen. Kuviossa 1 on esitetty nimellä ”ennuste” tällainen ”flash-estimaatti” joka kuukauden puolivälin tiedoilla laadittuna. Kuukauden puolivälissä havaittu palkansaajien määrä on tässä kerrottu sillä havaintojen osuudella, joka rekisterin käytön ensimmäisinä kuukausina ilmoitettiin kuun alkupuoliskolla. Ainakaan tällä yksinkertaisella tavalla lopullista määrää ei onnistuta ennustamaan kovin hyvin, joten lisää tietoa havaintojen kertymisestä tarvitaan tällaisten arvioiden tekemiseksi.

Monet koronakevään kehityskulut näkyvät tulorekisterissä. Palkansaajien kokonaismäärän lisäksi aineisto antaa mahdollisuuksia esimerkiksi alueellisen tai ikäryhmä­kohtaisen kehityksen tarkasteluun. Kuviossa 2 näkyy tulorekisterin mukaan palkansaajien määrä eri ikäluokissa. Palkansaajien lukumäärän väheneminen maalis-huhtikuussa 2020 on nuorilla ikäluokilla selkeämpi kuin vanhemmilla, joskin myös tavallinen kausittainen vaihtelu on näissä ryhmissä voimakkaampaa.

Kuvio 2. Palkansaajien osuus joissain ikäluokissa 2019-2020 (ikä 2019 lopun iän mukaan)
Kuvio 2. Palkansaajien osuus joissain ikäluokissa 2019-2020 (ikä 2019 lopun iän mukaan) Lähde: Tulorekisteri
Lähde: Tulorekisteri

Tulorekisteristä on myös mahdollista yhdistää työsuhteita ja tutkia niiden päättymistä ja päättyneiden työsuhteiden ominaisuuksia. Työsuhde on tässä asetettu päättyneeksi, mikäli siitä ei ole maksettu palkkaa yli kuukauteen. Kuvio 3 näyttää selvästi koholla olevia lukuja keväälle 2020 sekä alle 30-vuotiaiden että koko väestön keskuudessa.

Kuvio 3. Päättyneet työsuhteet (osuus kaikista työsuhteista) nuorilla ja koko väestöllä, 2019 ja 2020
Kuvio 3. Päättyneet työsuhteet (osuus kaikista työsuhteista) nuorilla ja koko väestöllä, 2019 ja 2020 Lähde: Tulorekisteri
Lähde: Tulorekisteri

Näidenkin alustavien tarkastelujen perusteella tulorekisterin sisällöstä voitaneen tulevaisuudessa tuottaa kiinnostavia tietoja yhteiskunnan kehityksestä nopealla aikataululla. Sisällön laajuudessa ja tietojen laadussa on paljon pohdittavaa, esimerkiksi ammatti-, osa-aikaisuus- ja toimipaikkatietojen osalta.

Myös aineiston laajentuminen ajan kuluessa auttaa hahmottamaan sitä, millaista tulorekisterin sisältämän aineiston käytettävyys todella on ja millaisia esimerkiksi kausittaiset vaihtelut ovat. Työtä rekisterin parissa siis tarvitaan, mutta myös mahdollisuuksia riittää.

 

Kirjoittaja työskenteli kesällä 2020 korkeakoulu­harjoittelijana Väestö- ja elinolotilastot -yksikössä ja opiskelee taloustiedettä Helsingin yliopistossa ja informaatio­verkostoja Aalto-yliopistossa.

Avainsanat:

Miksi tätä sisältöä ei näytetä?

Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.