Massa-aineistot nopeuttavat tietojen keruuta kuluttajahintaindeksiin
Digitalisaation myötä on käytettävissä entistä tarkempaa tietoa kansalaisten ostamien tuotteiden ja palveluiden myyntihinnoista ja ostetuista määristä. Perinteikäs kuluttajahintaindeksin laskenta mullistuu, kun hyödynnetään tätä massadataa.
Kuluttajahintaindeksi on yksi vanhimmista ja tunnetuimmista tilastollisista tunnusluvuista. Se mittaa yksityiseen kulutukseen hankittujen tuotteiden ja palveluiden hinnanmuutosta ajassa.
Aikaisemmin tiedonkeruu perustui tyypillisimmin ostettujen tuotteiden ja palveluiden hintaseurantaan. Kaikkien tavaroiden ja palvelujen hintoja ei voitu seurata, joten hyödykekoriin koottiin mahdollisimman edustava joukko hyödykkeitä, joita on yhtäläisesti saatavilla koko maassa.
Hyödykekoriin kuului noin 500 tuotetta ja palvelua, joista kerättiin kuukausittain lähes 50 000 hintaa usealta eri alueelta.
Tiedonkeruu vaati paljon työvoimaa, ja kuluttajahintaindeksin kustannukset ovatkin olleet yksi suurimmista Tilastokeskuksen tiedonkeruiden menoeristä.
Nykyisin kaikki tieto tallentuu tallennusjärjestelmiin. Näitä hyödyntämällä voidaan nopeuttaa tiedonkeruuta, lisätä hyödykekattavuutta ja kerätä entistä tarkempaa ja ajantasaista tietoa myynnistä.
Tähän mahdollisuuteen on nyt tartuttu, ja kokemuksia ns. massa-aineistojen hankinnasta ja käytöstä indeksilaskennassa on kerätty viimeisen neljän vuoden aikana.
Ensimmäiset käyttöön otetut kokonaisaineistot myynnistä kattoivat lääkkeiden ja alkoholin vähittäismyynnin kuluttajille. Nämä uudistukset olivat kohtuullisen helppoja toteuttaa, koska Suomessa näiden tuotteiden myynti on keskittynyttä ja tiedot on siten tallennettu muutaman toimijan järjestelmiin.
Seuraava iso askel massa-aineiston hyödyntämisessä otettiin tämän vuoden alussa, kun päivittäistavarakaupan myynti haetaan yhden toimijan järjestelmästä osaksi kuluttajahintaindeksin laskentaa.
Aiemmin | Nyt |
500 tuotetta ja palvelua | 10 000 tuotetta lääkkeistä, |
Aineiston laajuudesta johtuen käyttöön otettiin aluksi vain elintarviketuotteiden hinnat ja myyntimäärät. Seuraavien vuosien aikana siirrymme muihin tuotteisiin, kuten virvoitusjuomiin, vaatteisiin, pesuaineisin jne.
Tämän työn tehostamiseksi olemme testanneet luokittelualgoritmia, joka päättelee oikean hyödykeluokan tuotteen nimen, tuoteryhmän ja jopa hinnan perusteella. Näin tekniikkaa hyödyntämällä massiiviset datamäärät ja yksittäiset tuotteet pystytään mahdollisimman tarkasti ja tehokkaasti luokittelemaan.
Nyt käyttöön otetut massa-aineistot ovat kattavia, sisältäen kaikkien myytyjen tuotteiden myynnin arvon ja kappalemäärät nyky- ja vertailuajankohdalle. Muutos on merkittävä verrattuna perinteiseen keruuseen, jossa hinta otetaan myyntipakkauksen päältä tai hyllyn reunasta mutta ei tiedetä tuotteen todellisia myyntimääriä.
Jatkossa hinnanmuutosta voidaankin mitata entistä tarkemmin hyödyntämällä laajempaa aineistosisältöä ja indeksiteorian mukaisia laskentakaavoja, jotka huomioivat nyky- ja vertailuhetken myyntimäärissä tapahtuvan vaihtelun.
Tulosten tarkentumiseen ja harhattomuuteen vaikuttaa myös liike- ja hyödykeotoksista luopuminen, kun laskentaan otetaan kaikissa liikkeissä myydyt tuotteet.
Paljon hyvää saadaan siis aikaiseksi, mutta silti ei vielä voi huokaista. Tietosuojasta johtuen – jotta emme paljasta yhden toimijan tarkkoja tietoja – voimme julkistaa tuotteiden hinnanmuutoksen ainoastaan aiempaa karkeammalla tasolla.
Emme siis voi kertoa suurelle yleisölle, minkä yksittäisen tuotteen hinnanmuutos on ollut suurinta, vaikka massa-aineistot juuri mahdollistaisivat näin tarkan tiedon. Harmillinen tilanne.
Nyt tarvitaankin myös muilta toimijoilta vastaavanlaiset aineistot, jotta tarkkoja hinnanmuutoksia voidaan julkistaa avoimesti.
Neuvottelut aineistojen hankinnasta ovat käynnistyneet, mutta kokemus on osoittanut, että aika neuvotteluista käyttöönottoon on pitkä. Toivotaan, että hyvällä yhteistyöllä tätä viivettä voidaan lyhentää.
Kirjoittaja työskentelee yliaktuaarina Tilastokeskuksen Talous- ja ympäristötilastot -yksikössä.
Avainsanat:
Miksi tätä sisältöä ei näytetä?
Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.