Miten tilastomme syntyvät?

Julkaisemme lähes joka arkipäivä uusia tilastotietoja. Ennen kuin luvut ovat valmiita julkaistavaksi, ne ovat kulkeneet pitkän matkan. Koko tuon matkan ajan käsittelemme tietoja ammattimaisesti ja luottamuksellisesti ja varmistamme niiden tietosuojan.

Miksi tilastoja tehdään?

Miksi tätä sisältöä ei näytetä?

Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.

Ensin tarvitaan tietoaineisto

Tiedon matka tilastoksi lähtee usein erilaisista hallinnollisista aineistoista ja rekistereistä. Suomessa tähän on onneksi erinomaiset edellytykset. Viranomaisten aineistoihin tallentuvat tiedot muun muassa syntymästä, osoitteista, perhesuhteista, palkoista, yrityksistä, tuloista ja veroista. Käytämme tilastojen tekemiseen paljon esimerkiksi Digi- ja viestintäviraston, Verohallinnon sekä Patentti- ja rekisterihallituksen keräämiä aineistoja.

Infograafi kuvaa, miten erilaisia rekisteriaineistoja voidaan käyttää Tilastokeskuksen tilastojen tekemiseen ihmisen koko elinkaaren ajalta. Tiedot syntyneistä tulevat Tilastokeskukseen DVV:n aineistoista, tiedot oppilaitoksista valmistuneista Opetushallituksesta ja tiedot avioituneista DVV:stä. Tiedot maksetuista palkoista saadaan Verohallinnosta, tiedot eläköityneistä Eläketurvakeskuksesta ja tiedot kuolleista THL:stä.

Jos emme saa tietoja rekistereistä, kysymme

Kaikkea tietoa ei kuitenkaan löydy hallinnollista aineistoista tai rekistereistä. Ne eivät kerro esimerkiksi sitä, miten ihmiset suhtautuvat taloustilanteeseen tai tulevaisuuteensa. Tällaisia tietoja hankimme kysymällä niitä suoraan ihmisiltä. Kansalaisten lisäksi keräämme tietoja muun muassa yrityksiltä, organisaatioilta ja oppilaitoksilta.

Tilastokeskuksen kyselyihin vastataan verkkolomakkeella. Jotta saisimme mahdollisimman kattavasti vastauksia, voimme joissakin tapauksissa tavoitella vastaajia myös haastattelijoiden voimin. Haastattelijat auttavat ihmisiä muun muassa ymmärtämään, miksi on tärkeää vastata Tilastokeskuksen kyselyihin.

Jotta tilastot edustaisivat kattavasti kaikkia suomalaisia, tarvitsemme vastauksia eri ikäisiltä, eri väestöryhmiltä ja eri puolella Suomea asuvilta. Mitä useampi vastaa kyselyihimme, sitä tarkemman kuvan tilastot antavat yhteiskunnasta.

Miksi kyselyihimme vastaaminen on tärkeää?

Miksi tätä sisältöä ei näytetä?

Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.

Selvitämme uusien aineistojen hyödyntämistä

Yhteiskuntaan syntyy koko ajan uusia aineistoja. Tutkimme mahdollisuuksia hyödyntää niitä tilastoinnissa. Esimerkkejä uusista tietoaineistoista ovat ajantasaista tietoa palkoista ja ammateista kokoava tulorekisteri sekä sähkömarkkinoista tietoa kokoava DataHub. Hyödynnämme tilastojen tekemisessä osin myös aineistoja, joita keräämme internetistä verkkoharavoinnin avulla.

Mitä enemmän voimme käyttää muualla yhteiskunnassa syntyviä tietokokonaisuuksia tilastojen tekemiseen, sitä vähemmän meidän täytyy kysyä tietoja ihmisiltä, yrityksiltä ja organisaatioilta. Näin säästyy myös yhteiskunnan varoja.

Aineistojen yhdistäminen

Tilastot syntyvät useimmiten yhdistelemällä eri lähteistä saatuja aineistoja. Esimerkiksi yritystilastojen tekemistä varten täydennämme Verohallinnon tilinpäätösaineistoja yrityksiltä kerättävillä tiedoilla. Yhdistämme aineistoihin usein myös paikkatietoja ja muita luokitustietoja.

Kerättyjen tietojen tarkistaminen parantaa tilastojemme laatua

Tallennamme tiedot Tilastokeskuksen tietovarantoihin, jossa ne tarkistetaan ja käsitellään tilastokäyttöä varten. Tarkistukset tehdään menetelmällisesti niin hallinnollisiin aineistoihin kuin kansalaisilta ja yrityksiltä kerättyihin vastauksiin. Jos vastauksissa on puutteita, pyydämme vastaajia mahdollisesti täydentämään niitä.

Lähtöaineiston laatu ja onnistunut tarkistus- ja korjausprosessi vaikuttavat ratkaisevasti siihen, kuinka laadukas tilastosta tulee. Puutteellisista tai virheellisistä tiedoista ei synny luotettavia tuloksia.

Validointi, editointi, imputointi – määritellyt menetelmät aineistojen parantamiseen

Tietoja tarkistaessa pyritään tunnistamaan mahdolliset virheet ja ristiriidat, kuten poikkeavat, puuttuvat tai väärin luokitellut havainnot. Aineistoja korjataan yleensä tietyssä järjestyksessä ennalta määriteltyjen sääntöjen mukaisesti. Suuri osa tarkistuksista ja korjauksista perustuu kansainvälisiin ohjeistuksiin. Tätä tarkistamista ja korjaamista kutsutaan tilastokielellä validoinniksi.

Tietoaineistoja voidaan myös muokata korvaamalla vääriksi, puuttuviksi, epäluotettaviksi tai vanhentuneiksi todetut tiedot uusilla arvoilla tai poistamalla vanhentuneet tiedot. Termeillä editointi ja imputointi tarkoitetaan laajasti tähän soveltuvia, usein määrättyihin sääntöihin perustuvia tilastollisia menetelmiä.

Muuttujien johtaminen ja painotusten laskeminen

Tietoja myös luokitellaan sovittujen luokituskriteerien mukaisesti, ja osa tilastojen tiedoista johdetaan useammasta yksittäisestä muuttujasta. Esimerkiksi kotitalouksien kokonaistulot muodostetaan kotitalouteen kuuluvien henkilöiden tulotiedoista.

Haastattelututkimuksissa emme kysy asiaa kaikilta suomalaisilta, vaan kysely lähetetään otokseen satunnaisesti valikoituneille. Painotuksen avulla ”korotamme” saadut vastaukset edustamaan koko kansaa. Painotusten avulla voimme korjata myös haastattelututkimuksissa vastaamatta jättäneiden osuutta.

Tiesitkö?

Tilastojen tuotanto on laajasti lakisääteistä ja esimerkiksi tilastolaki määrittää monia tilaston tuotantoon liittyviä toimintatapoja aina aineistojen hankinnasta, niiden käsittelyyn, suojaamiseen ja jakeluun saakka. 

Tulosten analysointi

Kun tarvittavat tiedot on koostettu tilastoaineistoksi, aloitamme aineiston analysoinnin. Ensin muodostamme alustavat tulokset. Laskemme esimerkiksi indeksejä ja trendikomponentteja.

Arvioimme saatujen tulosten luotettavuutta. Vertaamme tuloksia aikaisempiin vastaaviin tietoihin tai aihetta koskeviin muihin tietoihin ja tilastoihin. Jos tuloksissa on epäjohdonmukaisuuksia, selvitämme, mistä ne johtuvat.

Kun analyysi varmistuu, tarkastamme julkaistavaksi aiottujen tietojen tietosuojan. Varmistamme, että julkaistuista tiedoista ei voi tunnistaa yksittäisiä henkilöitä tai yrityksiä.

Tilastojen julkaiseminen

Julkaisemme tiedot yleensä tietyin väliajoin, esimerkiksi kuukausittain tai vuosittain. Esimerkiksi väestön ennakkotilaston tietoja julkaistaan kerran kuussa ja väestörakennetilaston tietoja kerran vuodessa. Eri ajankohtina julkaistut tiedot pyritään pitämään vertailukelpoisina, jotta esimerkiksi väestökehitystä on helpompi seurata. Tarkkaan rajatut määritelmät, luokitukset ja toimintatavat auttavat siinä, että vertailukelpoisuus säilyy.

Kerromme verkkosivuillamme, milloin julkaisemme uusia tilastotietoja. Tiedot julkaistaan ennalta ilmoitettuna päivänä verkkosivuillamme ja StatFin-tietokannassamme.

Joskus tilastojen julkaisemisessa saattaa tapahtua virheitä. Korjaamme ne mahdollisimman nopeasti ja viestimme niistä avoimesti käyttäjille.

Tiedot kaikkien käytettävissä

Julkaisemme tilastotiedot tilastojen sivuilla ja StatFin-tietokannassa. Lisäksi julkaisemme verkkosivuillamme asiantuntijoiden kirjoittamia analyyseja tiedoista.

Edistämme tilastotiedon käyttöä monipuolisesti. Nostamme ajankohtaisia tilastotietoja esiin uutiskirjeessämme, tilaisuuksissamme ja sosiaalisessa mediassa. Tarjoamme opastusta ja oppimateriaaleja tilastojen käyttöön, ja osallistumme aktiivisesti yhteiskunnalliseen keskusteluun tuottamiemme tilastojen pohjalta. Tietopalvelumme ja tilastoasiantuntijamme vastaavat asiakkaiden ja tutkijoiden kysymyksiin tiedoista, ja parannamme tietosisältöjä saamamme palautteen pohjalta.

Kaikki verovaroin tuottamamme tilastotiedot ovat käytettävissä verkossa maksutta.

Miksi tätä sisältöä ei näytetä?

Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.