Asiantuntija-artikkelit ja ajankohtaisblogit
Sivuston näkymät

Miksi tilastot valmistuvat niin hitaasti? – tilastotuotanto on tasapainoilua tarkkuuden ja ajantasaisuuden välillä

24.8.2020
Kuva: Shutterstock

Koronapandemian myötä Tilastokeskus on nopeuttanut joidenkin tilastojen julkaisua, mikä on ilahduttanut tietojen käyttäjiä. Olemme myös Twitterissä saaneet toiveita siitä, ettei paluuta hitaampien tilastojen aikaan enää tulisi.

Asia ei kuitenkaan ole niin yksinkertainen tilastoijan näkökulmasta. Tilaston tuottajien on tasapainoiltava tilaston tarkkuuden ja ajantasaisuuden välillä ottaen huomioon myös julkaistavien tietojen käyttötarkoitukset. Optimaalisen tasapainon löytämiseksi on hyvä huomioida useita näkökulmia.

Tilaston laatu koostuu monista tekijöistä, joista ajantasaisuus ja tarkkuus ovat tärkeitä kriteereitä. Muita kokonaislaatuun vaikuttavia keskeisiä tekijöitä ovat mm. tilastotietojen relevanssi, vertailukelpoisuus ja yhtenäisyys.

Suurin osa tilaston laadusta määräytyy oikeastaan jo sen perustamisvaiheessa, kun määritellään käsitteitä vastaavat tietolähteet, kulloinkin käytettävät menetelmät ja tilastojulkaisun sisältö. Eri ajanjaksojen välillä tilastoilta toivottua tasalaatuisuutta häiritsevät erilaiset tekijät, jotka liittyvät enimmäkseen tilastossa käytettävien lähdetietojen puutteisiin ja virheisiin.

Koronapandemian aiheuttama talousshokki aiheuttaa lisäongelmia suhdannetilastoille, sillä nopeasti julkaistavien tilastojen metodologia sisältää paljon aiempaan kehitykseen nojaavia elementtejä.

Tämän vuoksi julkaistavien suhdannetietojen validointityö on nyt haastavampaa ja normaaliaikataululla tuotettavienkin tilastojen tarkkuus on vaarassa heikentyä. 

Julkaisuviiveeseen vaikuttavat tietojen kertymisnopeus ja käsittelyyn käytetty aika

Tilastokeskus kerää vain pienen osan tilastoissa hyödynnettävistä tiedoista omien kyselyjen kautta. Valtaosa tilastoista pohjautuu muualla yhteiskunnassa syntyviin hallinnollisiin aineistoihin ja näiden aineistojen kertymisnopeus saattaa muuttua ajassa esimerkiksi suurten rekisteri- ja tietojärjestelmäuudistusten aikana.

Tietojen validointiin kuluva aika puolestaan riippuu pääosin lähdetietojen laadusta. Iso osa tietojen tarkistustyöstä on pystytty automatisoimaan. Jäljelle on kuitenkin jäänyt aikaa vievä puuttuvien tai virheellisiksi epäiltyjen tietojen selvittäminen yhteistyössä tiedonantajien kanssa.

On hyvä muistaa, että lähdeaineistojen tiedot eivät koskaan ole heti tilastointivalmiita. Niiden sisältämien puutteiden ja virheiden korjaamistakaan ei toisaalta kannata jatkaa loputtomiin tilaston ajantasaisuuden kustannuksella. Hyvä tilasto on ajassa tasalaatuinen, ja tilapäisille laatutason poikkeamille tulee olla hyvät perusteet. 

Optimaalisen tietojen täydentämiseen ja tarkistukseen käytetyn ajan määrittely lähtee tilaston käyttötarkoituksesta. Esimerkiksi laajasti yhteiskunnan toimijoiden välisissä sopimuksissa käytettävien hintatietojen tarkkuusvaatimukset eroavat oleellisesti talousennusteiden pohjana käytettävistä ennakollisista taloustiedoista.

Toisaalta myös samalla tilastolla on erilaisia käyttötarkoituksia, joiden tarkkuusvaatimukset voivat erota. Tämän vuoksi monista tilastoista on päädytty julkaisemaan ennakkotilastoja sallien tietojen myöhempi tarkentuminen.

Tasapainoilua eri käyttötarkoitusten välillä harjoitetaan myös julkaisemalla nopeasti karkeampaa tietoa ja yksityiskohtaisemmat tiedot vasta myöhemmin. Esimerkiksi tietyn kuukauden vähittäiskaupasta julkaistaan ennakko vajaan kuukauden viiveellä ja laajemmat kaupan myynnin kuukausittaiset tiedot julkaistaan noin puolentoista kuukauden viiveellä.

Käyttötarkoituksen lisäksi optimaalisen julkaisuajankohdan määrittelyssä tulee joidenkin tilastojen osalta huomioida myös vaatimukset kansainvälisestä vertailtavuudesta.

Esimerkiksi laajat taloustilastojen lukuja heiluttavat monikansallisten yritysten järjestelyt olisi hyvä selvittää yhteistyössä näihin järjestelyihin liittyvien vastapuolimaiden tilastoijien kanssa. Lisäksi EU-maiden kesken on joillekin tilastoille sovittu myöhempää tarkentumista rajoittavia vaatimuksia.

Tilaston julkaisuviive muuttuu ajassa

Myös poikkeusajat vaikuttavat optimaaliseen julkaisuajankohtaan, sillä eri tilastojen tietoihin kohdistuva tarve voi vaihdella merkittävästi ajassa. Esimerkiksi koronapandemian myötä nopeampaa tietoa on kaivattu selvästi aiempaa enemmän mm. kuolleista, lomautetuista ja eri toimialojen yritysten liiketoiminnan kehityksestä.

Nopeuttaakseen poikkeusoloissa tarvittavien tärkeiden tietojen tuotantoa Tilastokeskus voi kohdentaa lisää resursseja tiettyjen tilastojen tuotantoon tai sallia aiempaa epätarkempien ennakkotietojen julkaisemisen. Poikkeusaikojen jälkeen nopeutettujen tilastojen julkaisuviive voi kuitenkin palata aiempaan, kun resurssien käyttöä joudutaan normalisoimaan – tai jos aiempaa epätarkempien tietojen myöhemmästä tarkentumisesta aiheutuu liikaa ongelmia.

Jatkossakin Tilastokeskuksen yleinen tavoite on lyhentää tilastojen julkaisuviiveitä tuotantoprosessien automatisaatioastetta kasvattamalla sekä ottamalla käyttöön uusia aiempaa nopeammin valmistua tietoaineistoja ja uusia tiedonkeruumenetelmiä. Uusista nopeista ja kattavista aineistoista hyvä esimerkiksi on kansallinen tulorekisteri ja tiedonkeruumenetelmistä verkkoharavointi.

Yhteiskunnan kiihtyvä digitalisaatio tarjoaa jatkuvasti uusia mahdollisuuksia tilastojen sisältöjen ja ajantasaisuuden kehittämiseen.

Kristian Taskinen työskentelee kehittämis­­päällikkönä Tilasto­keskuksen talous- ja ympäristö­tilastot -yksikössä.

Tilaa Tieto&trendit-juttukooste sähköpostiisi

Blogikirjoitukset eivät ole Tilastokeskuksen virallisia kannanottoja. Asiantuntijat kirjoittavat omissa nimissään ja vastaavat kukin omista kirjoituksistaan.

Lue samasta aiheesta:

Blogi
28.4.2021
Hannele Orjala

Lapsia koskevaa tietoa on paljon, mutta usein koetaan, että se on sirpaleista ja hajallaan. Tätä puutetta Tilastokeskus paikkaa tuottamalla laajan Tieto&trendit -artikkelisarjan lasten maailmaa avaavista tilastotiedoista. Lapset Suomessa -artikkelisarja nostaa esille yhteiskunnallisesti merkittävän aiheen tuottamalla vuoden ajan analyysia lasten elinoloista noin 30 artikkelin välityksellä.

Artikkeli
26.3.2021
Hanna Jokimäki, Jari Nieminen, Aura Pasila, Jukka Pitkäjärvi, Kaija Ruotsalainen

Rekisterit ovat 1980-luvulta lähtien tehostaneet tilasto­tuotantoa merkittävästi. Viime vuosina monet rekisterin­pitäjät ovat rakentaneet uudenlaisia tieto­varantoja kuten Verohallinnon tulorekisteri. Ne tuovat tilastointiin mahdollisuuksia mutta myös niin paljon työtä, että uusia kustannus­säästöjä ja tuottavuus­loikkia ei ole ainakaan lyhyellä tähtäimellä luvassa – pikemminkin päinvastoin.

Blogi
10.3.2021
Ville Vertanen

Kun halutaan lisätä laadukkaan tilastotiedon käyttöä yhteiskunnassa, tulee tiedon löytämisen olla helppoa. Tilastotoimijoiden kunnianhimoisena tavoitteena on yhden luukun periaate, jossa kaikki virallinen tilastotieto löytyy samasta paikasta.

Artikkeli
9.3.2021
Rauli Kohvakka, Kaisa Saarenmaa

Joka toinen sosiaalisen median käyttäjä näkee verkossa vihapuhetta. Nettikiusaaminen ja epäasialliset lähestymiset puolestaan rasittavat erityisesti nuoria. Tilastokeskus on kartoittanut suomalaisten kokemaa nettihäirintää ja verkossa havaitsemia vihamielisiä viestejä nyt kolmena vuotena.

Blogi
15.2.2021
Miia Huomo

Syrjäisemmilläkin alueilla voi olla suhteessa asukasmäärään paljon yksinasuvia, enemmistö asuu kuitenkin isoissa kaupungeissa. Sen kertoo Paavo, Tilastokeskuksen postinumero­aluetilastot-palvelu. 

tk-icons