Miksi tilastot valmistuvat niin hitaasti? – tilastotuotanto on tasapainoilua tarkkuuden ja ajantasaisuuden välillä
Koronapandemian myötä Tilastokeskus on nopeuttanut joidenkin tilastojen julkaisua, mikä on ilahduttanut tietojen käyttäjiä. Olemme myös Twitterissä saaneet toiveita siitä, ettei paluuta hitaampien tilastojen aikaan enää tulisi.
Asia ei kuitenkaan ole niin yksinkertainen tilastoijan näkökulmasta. Tilaston tuottajien on tasapainoiltava tilaston tarkkuuden ja ajantasaisuuden välillä ottaen huomioon myös julkaistavien tietojen käyttötarkoitukset. Optimaalisen tasapainon löytämiseksi on hyvä huomioida useita näkökulmia.
Tilaston laatu koostuu monista tekijöistä, joista ajantasaisuus ja tarkkuus ovat tärkeitä kriteereitä. Muita kokonaislaatuun vaikuttavia keskeisiä tekijöitä ovat mm. tilastotietojen relevanssi, vertailukelpoisuus ja yhtenäisyys.
Suurin osa tilaston laadusta määräytyy oikeastaan jo sen perustamisvaiheessa, kun määritellään käsitteitä vastaavat tietolähteet, kulloinkin käytettävät menetelmät ja tilastojulkaisun sisältö. Eri ajanjaksojen välillä tilastoilta toivottua tasalaatuisuutta häiritsevät erilaiset tekijät, jotka liittyvät enimmäkseen tilastossa käytettävien lähdetietojen puutteisiin ja virheisiin.
Koronapandemian aiheuttama talousshokki aiheuttaa lisäongelmia suhdannetilastoille, sillä nopeasti julkaistavien tilastojen metodologia sisältää paljon aiempaan kehitykseen nojaavia elementtejä.
Tämän vuoksi julkaistavien suhdannetietojen validointityö on nyt haastavampaa ja normaaliaikataululla tuotettavienkin tilastojen tarkkuus on vaarassa heikentyä.
Julkaisuviiveeseen vaikuttavat tietojen kertymisnopeus ja käsittelyyn käytetty aika
Tilastokeskus kerää vain pienen osan tilastoissa hyödynnettävistä tiedoista omien kyselyjen kautta. Valtaosa tilastoista pohjautuu muualla yhteiskunnassa syntyviin hallinnollisiin aineistoihin ja näiden aineistojen kertymisnopeus saattaa muuttua ajassa esimerkiksi suurten rekisteri- ja tietojärjestelmäuudistusten aikana.
Tietojen validointiin kuluva aika puolestaan riippuu pääosin lähdetietojen laadusta. Iso osa tietojen tarkistustyöstä on pystytty automatisoimaan. Jäljelle on kuitenkin jäänyt aikaa vievä puuttuvien tai virheellisiksi epäiltyjen tietojen selvittäminen yhteistyössä tiedonantajien kanssa.
On hyvä muistaa, että lähdeaineistojen tiedot eivät koskaan ole heti tilastointivalmiita. Niiden sisältämien puutteiden ja virheiden korjaamistakaan ei toisaalta kannata jatkaa loputtomiin tilaston ajantasaisuuden kustannuksella. Hyvä tilasto on ajassa tasalaatuinen, ja tilapäisille laatutason poikkeamille tulee olla hyvät perusteet.
Optimaalisen tietojen täydentämiseen ja tarkistukseen käytetyn ajan määrittely lähtee tilaston käyttötarkoituksesta. Esimerkiksi laajasti yhteiskunnan toimijoiden välisissä sopimuksissa käytettävien hintatietojen tarkkuusvaatimukset eroavat oleellisesti talousennusteiden pohjana käytettävistä ennakollisista taloustiedoista.
Toisaalta myös samalla tilastolla on erilaisia käyttötarkoituksia, joiden tarkkuusvaatimukset voivat erota. Tämän vuoksi monista tilastoista on päädytty julkaisemaan ennakkotilastoja sallien tietojen myöhempi tarkentuminen.
Tasapainoilua eri käyttötarkoitusten välillä harjoitetaan myös julkaisemalla nopeasti karkeampaa tietoa ja yksityiskohtaisemmat tiedot vasta myöhemmin. Esimerkiksi tietyn kuukauden vähittäiskaupasta julkaistaan ennakko vajaan kuukauden viiveellä ja laajemmat kaupan myynnin kuukausittaiset tiedot julkaistaan noin puolentoista kuukauden viiveellä.
Käyttötarkoituksen lisäksi optimaalisen julkaisuajankohdan määrittelyssä tulee joidenkin tilastojen osalta huomioida myös vaatimukset kansainvälisestä vertailtavuudesta.
Esimerkiksi laajat taloustilastojen lukuja heiluttavat monikansallisten yritysten järjestelyt olisi hyvä selvittää yhteistyössä näihin järjestelyihin liittyvien vastapuolimaiden tilastoijien kanssa. Lisäksi EU-maiden kesken on joillekin tilastoille sovittu myöhempää tarkentumista rajoittavia vaatimuksia.
Tilaston julkaisuviive muuttuu ajassa
Myös poikkeusajat vaikuttavat optimaaliseen julkaisuajankohtaan, sillä eri tilastojen tietoihin kohdistuva tarve voi vaihdella merkittävästi ajassa. Esimerkiksi koronapandemian myötä nopeampaa tietoa on kaivattu selvästi aiempaa enemmän mm. kuolleista, lomautetuista ja eri toimialojen yritysten liiketoiminnan kehityksestä.
Nopeuttaakseen poikkeusoloissa tarvittavien tärkeiden tietojen tuotantoa Tilastokeskus voi kohdentaa lisää resursseja tiettyjen tilastojen tuotantoon tai sallia aiempaa epätarkempien ennakkotietojen julkaisemisen. Poikkeusaikojen jälkeen nopeutettujen tilastojen julkaisuviive voi kuitenkin palata aiempaan, kun resurssien käyttöä joudutaan normalisoimaan – tai jos aiempaa epätarkempien tietojen myöhemmästä tarkentumisesta aiheutuu liikaa ongelmia.
Jatkossakin Tilastokeskuksen yleinen tavoite on lyhentää tilastojen julkaisuviiveitä tuotantoprosessien automatisaatioastetta kasvattamalla sekä ottamalla käyttöön uusia aiempaa nopeammin valmistua tietoaineistoja ja uusia tiedonkeruumenetelmiä. Uusista nopeista ja kattavista aineistoista hyvä esimerkiksi on kansallinen tulorekisteri ja tiedonkeruumenetelmistä verkkoharavointi.
Yhteiskunnan kiihtyvä digitalisaatio tarjoaa jatkuvasti uusia mahdollisuuksia tilastojen sisältöjen ja ajantasaisuuden kehittämiseen.
Kristian Taskinen työskentelee kehittämispäällikkönä Tilastokeskuksen talous- ja ympäristötilastot -yksikössä.
Avainsanat:
Miksi tätä sisältöä ei näytetä?
Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.