Koko talouden pikaestimaatti (Nowcasting)

Julkistukset

Vuosi 2019

Taulukot

Miksi haluamme tuottaa koko talouden pikaestimaatteja?

Suhdannekuvaajia julkaistaan tällä hetkellä huomattavalla viiveellä. Esimerkiksi tuotannon suhdannekuvaaja ja neljännesvuositilinpito kertovat koko talouden tilasta noin kahden kuukauden tai liikevaihtokuvaajat yritysten kehityksestä runsaan kahden kuukauden viiveellä. Tämä johtuu sekä tilastoinnissa käytettävien aineistojen saatavuudesta että aikaa vievästä aineistojen validointiprosessista. Samaan aikaan käyttäjien tietotarpeet kasvavat ja tarvitaan entistä ajantasaisempaa tietoa taloudesta.

Nowcasting-ennustemallien käytöllä voidaan merkittävästi lyhentää talouden tilaa kuvaavien tilastojen julkaisuviivettä. Ennustemalleja käyttämällä nopeaa informaatiota tarvitseville käyttäjille on näin tarjottavissa aiempaa huomattavasti ajantasaisempaa tilastotietoa.

Miksi koko talouden pikaestimaatit julkaistaan kokeellisina tilastoina?

Suhdanteita kuvaavat pikaestimaatit tuotetaan kokeellisina tilastoina sen vuoksi, että käytetyt nowcasting-menetelmät eroavat perinteisesti käytössä olevista tilastotuotannon menetelmistä. Kyseessä on tekoälyalgoritmeilla tuotettu ajantasainen ennuste Tilastokeskuksen seuraavasta virallisesta julkistuksesta (tuotannon suhdannekuvaaja, neljännesvuositilinpito, liikevaihtokuvaajat).

Lisäksi aineistoa käytetään uudella tavalla sen ollessa vain osaksi kertynyttä ja tarkastamatonta mikroaineistoa. Tästä johtuen laatu voi vaihdella kuukausien välillä.

Julkaisemalla tilastot kokeellisina haluamme kerätä kokemuksia tuotantoprosessin sujuvuudesta, mikroaineistojen koneellisesta käsittelystä ja tarkistamisesta sekä itse estimoinnin toimivuudesta todenmukaisessa tilanteessa. Nowcasting-menetelmillä tuotetut suhdannekuvaajat eivät ole Tilastokeskuksen virallisia tilastoja.

Miten koko talouden pikaestimaatteja tuotetaan?

Tilastokeskuksen käyttämässä nowcasting-menetelmässä hyödynnetään tiedusteluista kertyviä kuukausittaisia yritysten liikevaihtotietoja koneoppimisalgoritmin syötteenä ennustamaan juuri päättyneen kuukauden tilastojulkistusta.

Tilastokeskuksen etuna nowcasting-ennustemallien hyödyntämisessä on, että estimaattien tuottamisessa voidaan käyttää yritysten yksikkötason salassa pidettäviä aineistoja valmiiden tilastojen ja uutisanalyyseistä kerättyjen aineistojen sijaan. Lähdeaineistona on siis niin sanottua kovaa dataa, jota käytetään suhdannetilastojen laskennassa.

1. Aineisto

Pikaestimaattien laskennassa käytetään pääaineistona Tilastokeskuksen kuukausittain keräämää myyntitiedustelun aineistoa, jossa on mukana noin 2 000 teollisuuden, rakentamisen, kaupan ja palveluiden merkittävintä yritystä. Näiden yritysten liikevaihto kattaa kaiken kaikkiaan noin 70 prosenttia kaikkien yritysten liikevaihdosta. Tiedot toimitetaan Tilastokeskukselle noin 15 päivää tilastoitavan kuukauden päättymisen jälkeen.

2. Menetelmät

Menetelmässä hyödynnetään sellaisia malleja, jotka pystyvät käsittelemään suuria määriä muuttujia kerrallaan. Näitä ovat faktorianalyysi, regularisointiregressiot, ja epälineaariset koneoppimisalgoritmit.

Testausprosessissa on mukana noin 180 mallia, josta osumatarkkuuden ja harhattomuuden perusteella valikoituu noin 15, joiden ennusteiden keskiarvo vaikuttaisi tuottavan parhaan lopputuloksen. Estimaatti tuotetaan näiden parhaiden mallien tuottaman ennusteen keskiarvosta.

Lähdeaineistoihin tehdään validointia siten, että mallien selittäjissä ei ole selkeästi virheellisiä tai puuttuvia havaintoja. Uudet yritykset jäävät siten lähdeaineistosta pois. Tämä valinta perustuu aineiston laatuun.

Malleja validoidaan jatkuvasti, ja uusien havaintojen myötä osa malleista voi pudota joukosta pois, tai uusia voidaan ottaa tilalle. Validointiprosessissa tarkastellaan ennusteiden osuvuutta käyttäen lähinnä keskivirhettä, ja virheiden itseisarvojen keskiarvoa – tunnuslukuja, joita käytetään systemaattisen harhaisuuden ja revision mittareina. Mallien valinnassa pienen revision lisäksi kriteerinä on harhattomuus, lisäksi tavoitellaan ensisijaisesti ennustevirheitä, jotka olisivat samaa tasoa kuin nykyisin tuotettavien suhdannekuvaajien revisiot.

Ennakot tuotetaan kokonaan koneellisesti automatisoidussa prosessissa. Menetelmä on kuvattu Nowcasting Finnish Real Economic Activity: a Machine Learning Approach (pdf) -artikkelissa, jossa on tarkemmin dokumentoitu suoritettujen testien tuloksia ja mallien osumistarkkuus.

3. Ennakoiden tuotanto ja laatu

Nowcasting-menetelmää on testattu Tilastokeskuksessa reaaliaikaisesti vuosien 2017 ja 2018 ajan sekä tehty takautuvasti vuosille 2012–2016. Tuotannon suhdannekuvaajan vuosimuutosten ero virallisesta julkistuksesta on tällä ajanjaksolla alle 0,8 prosenttiyksikköä, eikä keskivirhe eroa tilastollisesti nollasta. Neljännesvuosittaisen tilinpidon vuosimuutosten itseisarvojen ero virallisesta julkistuksesta on keskimäärin 0,5 prosenttiyksikköä.

Lisätietoja: yliaktuaari Henri Luomaranta p. 029 551 3595

Menetelmäartikkeli