Metsässä puita etsimässä – tulorekisteri tarjoaa tietoa nopeasti ja herättää kysymyksiä
Vuodesta 2019 käytössä olleeseen tulorekisteriin on sijoitettu paljon toiveita tilastoinnin puolesta. Rekisteriaineistojen etuja ovat kattavuus ja helppo saatavuus. Lisäksi tulorekisteristä tekee kiinnostavan sen ajantasaisuus: työnantajat toimittavat kaikki palkka- ja muut maksutiedot sekä monia taustatietoja rekisteriin käytännössä reaaliaikaisesti. Tämä mahdollistaa monien kehityskulkujen nopean tarkastelun.
Koronakriisin erilaisia vaikutuksia on tulorekisterin avulla jo analysoitukin, esimerkiksi Tilastokeskuksessa ja Helsinki GSE:n tilannehuoneessa.
Tulorekisteri sisältää paljon informaatiota, josta osaa on helpohkoa tulkita. Rekisterin sisältö on kuitenkin lähinnä palkkatietoja, joten esimerkiksi henkilön toimintaa täytyy yrittää päätellä niiden avulla. Toimintatietoja taas voidaan käyttää edelleen esimerkiksi sosioekonomisen aseman määrittämiseen.
Esimerkiksi palkansaajien määrittämiseen rekisteristä ei ole selvää reseptiä. Onneksi tulorekisteri sisältää kosolti muuttujia, joita tämän kaltaisissa tehtävissä voi hyödyntää. Parhaita tuloksia ovat toistaiseksi tuottaneet erilaiset koneoppimismenetelmät, kuten yksinkertainen luokittelupuu. Menetelmät pystyvät luomaan ja kokeilemaan monimutkaisiakin sääntöjä suurella määrällä muuttujia.
Kuviossa 1 on ensin Tulo- ja elinolotutkimuksen (TUEL) kyselyaineiston perusteella tutkittu, millaiset rekisterin tiedot ennustavat palkansaajana toimimista parhaiten. Tämän jälkeen samalla säännöllä on määritetty palkansaajat koko rekisterin aineistosta.
Harhaa luvuissa esimerkiksi työvoimatutkimuksen työllisyyslukuihin verrattuna aiheuttavat ainakin erilaiset määritelmät, keruutapa ja aineistoihin liittyvät rajoitteet. Tulorekisteristä yrittäjien määrittäminen on vaikeaa, eivätkä lomautukset eroa rekisterin tiedoissa työttömyydestä tai työvoiman ulkopuolella olosta. Tällä karkealla tavalla laskettu arvio seurailee virallista työvoimatutkimuksen tuottamaa työllisyyslukua jokseenkin hyvin kehityksen osalta; tason eroja taas selittävät jonkin verran yrittäjien ja lomautettujen määrät.
Vuoden 2020 aikana erot kasvavat, mikä voi johtua poikkeuksellisesta tilanteesta työmarkkinoilla. Esimerkiksi taantuman vaikutuksia tulorekisterin tietojen laatuun on vaikeaa arvioida, sillä tietoa aiemmista tilanteista ei ole.
Koska tietoja ilmoitetaan rekisteriin kuukauden aikana, on ainakin teoriassa mahdollista käyttää jo kuukauden alkupuolen tietojakin reaaliaikaiseen työllisyyden mittaamiseen. Kuviossa 1 on esitetty nimellä ”ennuste” tällainen ”flash-estimaatti” joka kuukauden puolivälin tiedoilla laadittuna. Kuukauden puolivälissä havaittu palkansaajien määrä on tässä kerrottu sillä havaintojen osuudella, joka rekisterin käytön ensimmäisinä kuukausina ilmoitettiin kuun alkupuoliskolla. Ainakaan tällä yksinkertaisella tavalla lopullista määrää ei onnistuta ennustamaan kovin hyvin, joten lisää tietoa havaintojen kertymisestä tarvitaan tällaisten arvioiden tekemiseksi.
Monet koronakevään kehityskulut näkyvät tulorekisterissä. Palkansaajien kokonaismäärän lisäksi aineisto antaa mahdollisuuksia esimerkiksi alueellisen tai ikäryhmäkohtaisen kehityksen tarkasteluun. Kuviossa 2 näkyy tulorekisterin mukaan palkansaajien määrä eri ikäluokissa. Palkansaajien lukumäärän väheneminen maalis-huhtikuussa 2020 on nuorilla ikäluokilla selkeämpi kuin vanhemmilla, joskin myös tavallinen kausittainen vaihtelu on näissä ryhmissä voimakkaampaa.
Tulorekisteristä on myös mahdollista yhdistää työsuhteita ja tutkia niiden päättymistä ja päättyneiden työsuhteiden ominaisuuksia. Työsuhde on tässä asetettu päättyneeksi, mikäli siitä ei ole maksettu palkkaa yli kuukauteen. Kuvio 3 näyttää selvästi koholla olevia lukuja keväälle 2020 sekä alle 30-vuotiaiden että koko väestön keskuudessa.
Näidenkin alustavien tarkastelujen perusteella tulorekisterin sisällöstä voitaneen tulevaisuudessa tuottaa kiinnostavia tietoja yhteiskunnan kehityksestä nopealla aikataululla. Sisällön laajuudessa ja tietojen laadussa on paljon pohdittavaa, esimerkiksi ammatti-, osa-aikaisuus- ja toimipaikkatietojen osalta.
Myös aineiston laajentuminen ajan kuluessa auttaa hahmottamaan sitä, millaista tulorekisterin sisältämän aineiston käytettävyys todella on ja millaisia esimerkiksi kausittaiset vaihtelut ovat. Työtä rekisterin parissa siis tarvitaan, mutta myös mahdollisuuksia riittää.
Kirjoittaja työskenteli kesällä 2020 korkeakouluharjoittelijana Väestö- ja elinolotilastot -yksikössä ja opiskelee taloustiedettä Helsingin yliopistossa ja informaatioverkostoja Aalto-yliopistossa.
Avainsanat:
Miksi tätä sisältöä ei näytetä?
Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.