Päätoimialojen liikevaihtoennakko

Julkistukset

Vuosi 2019

Taulukot

Miksi haluamme tuottaa päätoimialojen liikevaihtoennakkoa?

Suhdannekuvaajiin kohdistuu yhä voimakkaampia nopeuttamispaineita, koska toimialoista tarvitaan yhä ajantasaisempaa tietoa. Kansantalouden tuotannosta on keväästä 2019 saakka julkaistu kokeellisena koko talouden pikaestimaatteja. Samoilla ennustemenetelmillä on pystytty tutkimaan myös kuukausittain julkaistavien toimialoittaisten liikevaihtokuvaajien tuotantomahdollisuutta vain kuukauden viiveellä. Tällä hetkellä niiden tuotantoviive on puolitoista kuukautta.

Nowcasting-ennustemallien käytöllä voidaan merkittävästi lyhentää talouden tilaa kuvaavien tilastojen julkaisuviivettä. Ennustemalleja käyttämällä nopeaa informaatiota tarvitseville käyttäjille on näin tarjottavissa aiempaa huomattavasti ajantasaisempaa tilastotietoa.

Miksi päätoimialojen liikevaihtoennakko julkaistaan kokeellisena tilastona?

Suhdanteita kuvaava päätoimialojen liikevaihtoennakko tuotetaan kokeellisina tilastoina sen vuoksi, että mallien toimivuutta on ehditty testaamaan suhteellisen lyhyen aikaa. Tästä johtuen laatu voi vaihdella kuukausien välillä.

Julkaisemalla tilastot kokeellisina haluamme kerätä kokemuksia tuotantoprosessin sujuvuudesta, mikroaineistojen koneellisesta käsittelystä ja tarkistamisesta sekä itse estimoinnin toimivuudesta todenmukaisessa tilanteessa. Lisää testiaineistoa kertyy koko ajan ja näin ollen mallinvalinta voi vielä parantua ja ennustevirhe tasoittua. Nowcasting-menetelmillä tuotettu päätoimialojen liikevaihtoennakko ei ole Tilastokeskuksen virallinen tilasto.

Miten päätoimialojen liikevaihtoennakko tuotetaan?

Tilastokeskuksen käyttämässä nowcasting-menetelmässä hyödynnetään tiedusteluista kertyviä kuukausittaisia yritysten liikevaihtotietoja koneoppimisalgoritmin syötteenä ennustamaan juuri päättyneen kuukauden tilastojulkistusta.

Tilastokeskuksen etuna nowcasting-ennustemallien hyödyntämisessä on, että estimaattien tuottamisessa voidaan käyttää yritysten yksikkötason salassa pidettäviä aineistoja valmiiden tilastojen ja uutisanalyyseistä kerättyjen aineistojen sijaan. Lähdeaineistona on siis niin sanottua kovaa dataa, jota käytetään suhdannetilastojen laskennassa.

1. Aineisto

Pikaestimaattien laskennassa käytetään pääaineistona Tilastokeskuksen kuukausittain keräämää myyntitiedustelun aineistoa, jossa on mukana noin 2 000 teollisuuden, rakentamisen, kaupan ja palveluiden merkittävintä yritystä. Näiden yritysten liikevaihto kattaa kaiken kaikkiaan noin 70 prosenttia kaikkien yritysten liikevaihdosta. Tiedot toimitetaan Tilastokeskukselle noin 15 päivää tilastoitavan kuukauden päättymisen jälkeen. Lisäksi käytetään verohallinnon oma-aloitteisten verojen aineistoista arvonlisävero- ja työnantajasuoritustietoja.

2. Menetelmät

Menetelmässä hyödynnetään sellaisia malleja, jotka pystyvät käsittelemään suuria määriä muuttujia kerrallaan. Näitä ovat faktorianalyysi ja regularisointiregressiot.

Testausprosessissa on mukana noin 70 mallia, joista osumatarkkuuden ja harhattomuuden perusteella valikoituu yleensä 5–20 mallia, joiden ennusteiden keskiarvo vaikuttaisi tuottavan parhaan lopputuloksen. Estimaatti tuotetaan näiden parhaiden mallien tuottaman ennusteen keskiarvosta.
Lähdeaineistoihin tehdään validointia siten, että mallien selittäjissä ei ole selkeästi virheellisiä tai puuttuvia havaintoja. Uudet yritykset jäävät siten lähdeaineistosta pois. Tämä valinta perustuu aineiston laatuun.

Malleja validoidaan jatkuvasti, ja uusien havaintojen myötä osa malleista voi pudota joukosta pois tai uusia voidaan ottaa tilalle. Validointiprosessissa tarkastellaan ennusteiden osuvuutta käyttäen lähinnä keskivirhettä ja virheiden itseisarvojen keskiarvoa – tunnuslukuja, joita käytetään systemaattisen harhaisuuden ja revision mittareina. Mallien valinnassa ovat kriteereinä pieni revisio ja harhattomuus.

Lisätietoja: yliaktuaari Jukka Kovanen p. 029 551 3628
Sähköposti: palvelut.suhdanne@tilastokeskus.fi

Menetelmäseloste

 

Menetelmäartikkeli