Lähdeaineistojen laatu näkyy tilastojen tarkkuudessa
Keskustelu Helsingin kaupungin keskustatunnelista nosti käytettyjen tilastotietojen osalta esille virheen vuoden 2000 työpaikkoja koskeneissa luvuissa. Arvioiden perusteella Tilastokeskuksen ”tilastovirhe” kasvatti vuoden 2000 työpaikkamäärää Helsingin keskustassa lähes kymmenellä tuhannella työpaikalla.
Virhe tarkastelun aloitusvuoden tiedoissa johti puolestaan siihen, että tulkinta keskustan kadonneista 15 000 työpaikasta vuoteen 2015 mennessä on kyseenalainen. Mikäli vertailun lähtötietoina käytettäisiin vuoden 2001 tietoja, niin arvio työpaikkojen muutoksesta keskustassa olisi erisuuruinen.
Työpaikkatietojen lähteenä on tarkastelussa käytetty Suomen ympäristökeskuksen (Syke) Liiteri-tietokantaa, jonka tiedot pohjautuvat puolestaan Tilastokeskuksen työssäkäyntitilaston tietoihin.
Työssäkäyntitilasto on vuositilasto, joka tuottaa alueittaista tietoa vuoden viimeisen päivän vakinaisen väestön toiminnasta ja työssäkäynnistä. Tilaston tiedot perustuvat pääasiassa hallinnollisiin rekistereihin, mutta joitakin tietoja kerätään myös suorilla tiedonkeruilla työnantajilta.
Keskustelun aiheena olevat työpaikkatiedot perustuvat hyvin pitkälti työnantajilta suorilla tiedonkeruilla kerättäviin toimipaikkatietoihin, joista saadaan tilastoon muun muassa palkansaajien työpaikkojen toimialat ja sijainti. Työnantajien ilmoittamien osoitetietojen pohjalta muodostetaan erilaisia alueluokituksia, esimerkiksi tässä tarkastelussa käytetyt Liiteri-palvelun tarkat aluetiedot.
Helsingin keskustan terveys- ja sosiaalipalveluun liittyvien työpaikkojen osalta on käynyt niin, että toimintaa harjoittava työnantaja on ilmoittanut vuonna 2000 työntekijöilleen saman keskustan osoitteen, jonka johdosta kaikki työnantajan työpaikat on sijoitettu samaan keskustassa sijaitsevaan karttaruutuun. Osan työpaikoista olisi kuitenkin pitänyt olla muilla kaupungin alueilla, kuten Meilahdessa.
Tapaus on hyvä esimerkki siitä, että lähdetietojen oikeellisuus vaikuttaa suoraan tilastojen laatuun. Tämä korostuu erityisesti pienaluetilastoissa.
Työssäkäyntitilaston aluetietoja käytetään paljon ja hyvin erilaisiin tarkoituksiin. Tarkkojen tietojen lähtökohtana ovat riittävän laadukkaat lähdeaineistot, joihin vain tietojen tuottajat voivat kunnolla vaikuttaa. Tilaston tekijän mahdollisuudet tietojen korjaamiseen ovat hyvin rajalliset.
Jotta Helsingin keskustan työpaikoista saadaan jatkossakin luotettava kuva, niin tilaston tekijänä toivon, että alueella toimivat työnantajat tuottavat tilastointia ja tietojen jatkokäyttöä varten laadukasta lähdeaineistoa, jossa muun muassa aluetietojen tuottamisessa käytettävät osoitetiedot ovat kunnossa, ja toimipaikat ja niiden henkilöstö on ilmoitettu tilastoinnin edellyttämällä tarkkuudella.
Tilastoista saadaan laadukkaita silloin, kun niiden lähdeaineistot pitävät paikkansa.
Kirjoittaja työskentelee tilastopäällikkönä Tilastokeskuksen Väestö- ja elinolot -yksikössä.
Avainsanat:
Miksi tätä sisältöä ei näytetä?
Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.