Työssäkäynti: tilaston dokumentaatio
Tilaston dokumentaatiossa kuvataan, miten tilasto on laadittu ja mitä menetelmiä laadinnassa on käytetty. Tiedot auttavat tulkitsemaan tilastojen lukuja sekä arvioimaan niiden luotettavuutta ja vertailukelpoisuutta. Laaturaportti pohjautuu EU:n SIMS-malliin. Dokumentaatiosta löytyvät myös tilaston muutoksista kertovat muutostiedotteet ja mahdolliset tarkentavat menetelmäkuvaukset.
Jos etsit tämän tilaston tilastolukuja, siirry tilaston sivulle: Työssäkäynti
Laaturaportti
Tilaston yleiskuvaus (SIMS 3.1)
Työssäkäyntitilasto tuottaa alueellista tietoa väestön toiminnasta ja työssäkäynnistä. Tilasto laaditaan yhdistämällä useita eri rekisteritietoja. Tiedot julkaistaan kerran vuodessa.
Kattavuus (SIMS 3.3)
Työssäkäyntitilasto on kokonaistilasto, joka kattaa vuoden lopun vakinaisen väestön.
Tietoa työllisistä ja työpaikoista tuotetaan eri kokoisista työnantajista kaikilta talouden toimialoilta ja sektoreilta.
Tilastoyksikkö (SIMS 3.5)
Työssäkäyntitilaston tilastoyksikkö on henkilö.
Eri rekisterien tiedot yhdistetään henkilötunnuksesta muodostetun pseudotunnuksen sekä yritys- ja toimipaikkatunnusten avulla.
Tilaston perusjoukko (SIMS 3.6)
Työssäkäyntitilaston henkilöperusjoukon muodostaa maassa vuoden viimeisenä päivänä vakinaisesti asuva väestö.
Viitealue (SIMS 3.7)
Työssäkäyntitilaston viitealue on koko Suomi. Tietoja voidaan tuottaa kaikilla hallinnollisilla aluejaoilla ja koordinaattipohjaisilla aluejaoilla (esimerkiksi maakunnat, hyvinvointialueet, työllisyysalueet, kunnat, postinumeroalueet, karttaruudut ja kuntien osa-alueet).
Ajallinen kattavuus (SIMS 3.8)
Työssäkäyntitilaston vuosittaiset tiedot ovat saatavilla tilaston verkkosivuilla vuodesta 1987 lähtien. Lisäksi tietoja on saatavilla väestölaskentavuosilta vuodesta 1950 lähtien.
Tietoja ammatista ja sosioekonomisesta asemasta on saatavilla vuosilta 1970, 1975, 1980, 1985, 1990, 1993, 1995, 2000 sekä vuodesta 2004 lähtien vuosittain.
Lisäksi vuoden 1950 väestölaskennasta on olemassa 10%:n otos, josta löytyy tietoa ammatista.
Mittayksikkö (SIMS 4)
Työssäkäyntitilaston mittayksikköjä ovat henkilöiden lukumäärä ja työpaikkojen lukumäärä.
Viiteajankohta (SIMS 5)
Työssäkäyntitilaston henkilöperusjoukko kuvaa vuoden viimeisen päivän tilannetta. Tiedot väestön toiminnasta ja työpaikasta ovat vuoden viimeiseltä viikolta. Tilastossa on myös kertymätietoja koko vuodelta (esimerkiksi tulotiedot sekä työ- ja työttömyyskuukaudet).
Luokitukset (SIMS 3.2)
Tilasto tuottaa tietoja pohjautuen alue-, ammatti-, ammattiasema-, pääasiallinen toiminta-, sektori-, toimiala- ja sosioekonominen asemaluokituksiin.
Tietoja tuotetaan useilla kuntapohjaisilla aluejaoilla kuten esimerkiksi lääni, maakunta, seutukunta ja kunta. Aluetietoja tuotetaan pohjautuen sekä työssäkäyntikuntaan että asuinkuntaan. Aluetiedot pohjautuvat aina uusimpaan julkistushetkellä voimassa olevaan aluejakoon.
Tietoja voidaan tuottaa myös postinumeroalueittain sekä karttakoordinaattipohjaisilla aluejaoilla esimerkiksi kuntien osa-alueluokituksella.
Luokitukset:
- Alue
- Ammattiasema
- Ammattiluokitus 2010
- Pendelöinti
- Pääasiallinen toiminta
- Sektoriluokitus 2012
- Sektoriluokitus 2023
- Toimialaluokitus TOL 2008
- Työnantajasektori
- Sosioekonominen asema 1989
Tilaston tuottamia tietoja julkaistaan sukupuolen ja eri ikäryhmä -luokitusten mukaan yhdistelemällä niitä myös muihin luokituksiin kuten kansalaisuuteen, kieleen, koulutusasteeseen tai taustamaahan.
Käsitteet ja määritelmät (SIMS 3.4)
Alueella asuva työllinen työvoima
Alueella asuvalla työllisellä työvoimalla tarkoitetaan kaikkia tällä alueella asuvia työllisiä riippumatta siitä, missä henkilön työpaikka sijaitsee. Alueella asuva työllinen työvoima muodostaa ns. työllisen yöväestön.
Alueella työssäkäyvät
Alueella työssäkäyvillä tarkoitetaan kaikkia tällä alueella työssäkäyviä henkilöitä riippumatta heidän asuinpaikastaan. Alueella työssäkäyvät muodostavat ns. työllisen päiväväestön, jonka määrää voidaan pitää mittarina alueen työpaikkojen määrälle.
Ammatti
Samankaltaista työtä tekevien henkilöiden rooli, joka perustuu tulonhankintatarkoituksessa tehdyn työn sisältöön ja joissain tapauksissa henkilön suorittamaan koulutukseen. Työssäkäyntitilastossa ammattien luokittelu perustuu eri rekistereistä saatuihin työnantajan työtekijälle antamiin ammattinimikkeisiin, jotka luokitellaan eri ammattikoodeiksi pääasiassa toimialan, koulutuksen, ammattiaseman ja sektorin perusteella. Ammattinimikettä kutsutaan joskus myös työ-, tehtävä- tai virkanimikkeeksi. Osa työssäkäyntitilaston ammattikoodeista (vrt. toimialakohtaiset ammattikoodistot ilman ammattinimikkeitä) saadaan valmiiksi luokiteltuina palkkarakennetilastosta. Ammatin kuvaamisessa käytetään kulloinkin voimassa olevaa Tilastokeskuksen kansallista ammattiluokitusta. Yksi ammattiluokka voi sisältää useita eri ammattinimikkeitä. Toisaalta sama ammattinimike voidaan luokitella useaan eri ammattiryhmään. Työllisille ammatit tuotetaan ensisijaisesti henkilön vuoden viimeisen viikon päätyösuhteen mukaan. Tiedot kerätään useista eri lähteistä: mm. tulorekisteristä ja palkkarakennetilastosta.
Ammattiasema
Ammattiasema kuvaa työllisten asemaa työelämässä. Käytetty luokitus on seuraava: - palkansaajat - yrittäjät Tieto ammattiasemasta perustuu henkilön eläkevakuutustietoihin sekä palkka- ja yrittäjätulon määrään.
Eläkeläinen
Eläkeläisiksi katsotaan kaikki ne, jotka tulorekisterin tietojen mukaan saavat eläkettä (pl. perhe-eläke) eivätkä ole ansiotyössä. Myös kaikki yli 74-vuotiaat on päätelty eläkeläisiksi. Osa henkilöistä on päätelty eläkeläisiksi myös eläketulon perusteella.
Muut työvoiman ulkopuolella olevat
Pääasiallisen toiminnan luokka, joka sisältää henkilöt, joiden toiminnasta ei ole saatu tietoa lähdeaineistoista, tai jotka eivät täytä kriteerejä muiden pääasiallisen toiminnan luokkien osalta.
Oikeudellinen muoto
Oikeudellisella muodolla yksilöidään juridisen henkilön oikeudellinen asema. Oikeudellisen muodon luokitus perustuu kaupparekisterin yhtiömuotoihin ja verolainsäädännön vaatimuksiin. Yritysten ja yhteisöjen oikeudellinen muoto on tallennettu Yritys- ja yhteisötietojärjestelmään (YTJ). Tilastokeskuksen oikeudellisen muodon luokituksen perustana on YTJ ja verohallinnon käyttämä oikeudellisen muodon koodisto. Tilastokeskuksen luokituksessa osa verohallinnon luokista on yhdistetty.
Omistajatyyppi
Yritys- ja toimipaikkarekisterin yritykset ja yhteisöt jaetaan omistajuuden perusteella seuraaviin luokkiin: Yksityinen kotimainen Valtio Kunta Ahvenanmaan maakunta Ulkomaalaisomisteinen Muu omistajatyyppi
Opiskelija
Opiskelija tai koululainen on 15 vuotta täyttänyt henkilö, joka opiskelee päätoimisesti jossakin oppilaitoksessa eikä ole ansiotyössä eikä työtön. Kun väestö luokitellaan sosioekonomisen aseman mukaan, opiskelijoiden alaikäraja on 16 vuotta. Tieto opiskelusta on saatu mm. Tilastokeskuksen opiskelijarekisteristä. Vuoden viimeisellä viikolla työvoimakoulutuksessa olevat lasketaan myös opiskelijoiksi. 15-vuotiaat on päätelty koululaisiksi. Alle 15-vuotiaat koululaiset kuuluvat pääasiallisen toiminnan luokkaan "0-14 -vuotiaat". Opiskelijana voidaan tietyissä tarkasteluissa pitää kaikkia perusasteen jälkeisissä oppilaitoksissa opiskelevia. Tieto opiskelusta on kerätty syyskuun tilanteen mukaisena. Vuoden viimeisellä viikolla he voivat pääasialliselta toiminnaltaan kuitenkin olla myös työllisiä, työttömiä tai varusmiehiä.
Osa-alue (kunnan)
Kunnan osa-alueet muodostuvat kunnan itsensä määrittelemistä toiminnallisista aluekokonaisuuksista, jotka ovat kunnan oman aluesuunnittelun ja -seurannan pohjana. Tilastokeskus hoitaa uusien osa-aluerajojen digitoinnin sekä raja- ja nimitiedostojen ylläpidon. Kunnilla on mahdollisuus tarkistaa osa-aluejakonsa kerran vuodessa. Osa-aluejako on hierarkkinen kolmitasoinen luokitus, jossa on 1-numeroinen suuraluetaso, 2-numeroinen tilastoaluetaso ja 3-numeroinen pienaluetaso. Osa-alueet numeroidaan juoksevasti käyttäen näitä kolmea hierarkkista tasoa. Kuusinumeroinen osa-alukoodi on sidottu kolminumeroiseen kuntakoodiin, joten kokonaisuudessaan osa-aluekoodi on yhdeksän merkin mittainen.
Palkansaaja
Palkansaajiksi määritellään 18–74-vuotiaat henkilöt, joilla on tulorekisterin mukaan vuoden viimeisellä viikolla voimassa oleva palkanmaksujakso ja työeläkevakuutus. Palkansaajiksi määritellään myös vuoden viimeisellä viikolla työllistävässä toimenpiteessä (muu kuin starttiraha) olevat henkilöt. Edellytyksenä on, että palkansaajaksi määriteltävä henkilö on vuoden aikana saanut palkkatuloa, ja että henkilö ei ole suorittamassa varusmies- tai siviilipalvelusta tai ole vuoden viimeisenä työpäivänä työttömänä työnhakijana työnhakijarekisterissä. Mikäli henkilöllä on työsuhteen kanssa samanaikaisesti voimassa yrittäjäeläkevakuutus, henkilö määritellään palkansaajaksi, jos hänen vuoden aikana kertyneet palkkatulonsa ovat yrittäjätuloja suuremmat ja hän ei edellisenä vuonna ole ollut yrittäjänä tilastossa. Mikäli henkilö ei ole yrittäjä, työtön, opiskelija, eläkeläinen, siviilipalvelusmies tai varusmies ja hänen palkkatulonsa ylittävät määritellyn tulorajan, määritellään hänet palkansaajaksi, vaikka hänellä ei työsuhdeaineistojen mukaan olisikaan voimassa olevaa työsuhdetta.
Pendelöinti
Pendelöinnillä (sukkuloinnilla) tarkoitetaan työssäkäyntiä oman asuinalueen ulkopuolella. Nettopendelöinnillä tarkoitetaan alueen ulkopuolella työssäkäyvien ja alueelle muualta töihin tulevien henkilöiden välistä erotusta. Positiivinen nettopendelöintiluku tarkoittaa, että alueelle tulevien työllisten määrä on suurempi kuin alueelta sen ulkopuolella työssäkäyvien määrä. Nettopendelöinti voidaan myös ilmoittaa esim. kahden yksittäisen alueen välisenä lukuna.
Pääasiallinen toiminta
Pääasiallisen toiminnan käsite kuvaa henkilön taloudellisen toiminnan laatua. Väestö jaetaan pääasiallisen toiminnan perusteella työvoimaan kuuluviin ja työvoiman ulkopuolella oleviin. Nämä ryhmät voidaan edelleen jakaa alaryhmiin. Luokitus perustuu tietoihin henkilön toiminnasta vuoden viimeisellä viikolla. Pääasiallisen toiminnan mukainen luokitus on seuraava: Työvoima - työlliset - työttömät Työvoiman ulkopuolella olevat - 0-14-vuotiaat - opiskelijat, koululaiset - eläkeläiset - varusmiehet, siviilipalvelusmiehet - muut työvoiman ulkopuolella olevat Tiedot pääasiallisesta toiminnasta perustuvat eri rekistereistä saatuihin tietoihin. Työvoimaan kuuluvuus on pääasiallisen toiminnan päättelyssä asetettu ensisijalle. Työvoiman sisällä taas on työttömien päättely tehty ennen työllisten päättelyä. Ryhmä "muut työvoiman ulkopuolella olevat" muodostuu henkilöistä, jotka ovat työvoiman ulkopuolella eivätkä myöskään kuulu seuraaviin ryhmiin: 0-14-vuotiaat, opiskelijat, varusmiehet tai eläkeläiset.
Siviilipalvelusmies
Siviilipalvelusmiehiksi määritellään henkilöt, jotka ovat olleet ELY-keskuksen mukaan siviilipalveluksessa tutkimusviikolla. Siviilipalvelus perustuu perustuslaissa säädettyyn maanpuolustusvelvollisuuteen ja toisaalta uskonnon- ja omantunnonvapauteen. Asevelvollinen voi uskonnolliseen tai eettiseen vakaumukseen perustuvista vakavista omantunnonsyistä hakeutua siviilipalvelukseen, jonka suorittaminen korvaa asevelvollisuuslain (1950/452) mukaisen palveluksen rauhan aikana.
Sosioekonominen asema
Sosioekonomisella asemalla tarkoitetaan henkilön asemaa yhteiskunnassa. Sosioekonomisen aseman muodostaminen henkilölle perustuu tietoihin henkilön pääasiallisesta toiminnasta, ammatista, ammattiasemasta sekä toimialasta. Luokittelussa käytetään Tilastokeskuksen kulloinkin voimassa olevaa sosioekonomisen aseman luokitusta. Työssäkäyntitilastossa henkilöt luokitellaan oman toimintansa perusteella lukuun ottamatta 0-15 -vuotiaita ja ryhmää "muut työvoimaan kuulumattomat" (lähinnä omaa kotitaloutta hoitavat), jotka saavat asuntokunnan viitehenkilön sosioekonomisen aseman. Opiskelijoiden sosioekonominen asema määräytyy vuoden lopun toiminnan perusteella. Yli 18-vuotiaat opiskelijat, joilla on vuoden lopussa voimassa oleva työsuhde, katsotaan kuuluvan työlliseen työvoimaan ja sitä kautta heidät määritellään ammattinsa perusteella sosioekonomiseen aseman eri luokkiin. Alle 18-vuotiaat työssä käyvät opiskelijat luokitellaan sitä vastoin opiskelijoiksi (lukuun ottamatta alle 16-vuotiaita, jotka luokitellaan aina asuntokunnan viitehenkilön mukaan).
Suomalaistaustainen
Suomalaistaustaisia ovat kaikki ne henkilöt, joilla vähintään toinen vanhemmista on syntynyt Suomessa. Suomessa ennen vuotta 1970 syntyneiden henkilöiden, joiden vanhemmista ei ole tietoa, on päätelty olevan suomalaistaustaisia, mikäli he puhuvat äidinkielenään kotimaista kieltä (suomi, ruotsi, saame). Kaikilla suomalaistaustaisilla henkilöillä taustamaa on Suomi. Ulkomailta adoptoitujen lasten osalta ottovanhemmat rinnastetaan biologisiksi vanhemmiksi. Näin ollen katsotaan, että Suomessa syntyneiden henkilöiden ulkomailta adoptoima lapsi on suomalaistaustainen ja taustamaa on siten Suomi.
Syntyperä ja taustamaa
Tilastokeskus on vuoden 2012 aikana ottanut käyttöön uuden syntyperä-luokituksen. Samantyyppinen luokitus on jo käytössä muissa Pohjoismaissa. Syntyperä ja taustamaa määräytyvät henkilön vanhempien syntymävaltiotiedon perusteella. Syntyperä-luokituksen avulla on helposti eriteltävissä ulkomailla ja Suomessa syntyneet ulkomaalaistaustaiset henkilöt. Väestörekisterikeskuksen Väestötietojärjestelmään ei ole viety ennen vuotta 1964 kuolleiden henkilöiden tietoja. Suomen väestössä on vajaat 900 000 Suomessa syntynyttä henkilöä, joiden kummankaan vanhempien syntymävaltiota ei tiedetä, koska näiden henkilöiden vanhemmat ovat kuolleet ennen Väestötietojärjestelmän perustamista. Suomessa ennen vuotta 1970 syntyneiden henkilöiden, joiden vanhemmista ei ole tietoa, on päätelty olevan suomalaistaustaisia, mikäli he puhuvat äidinkielenään kotimaista kieltä (suomi, ruotsi, saame). Suomalaistaustaisia ovat myös kaikki ne henkilöt, joilla vähintään toinen vanhemmista on syntynyt Suomessa. Kaikilla suomalaistaustaisilla henkilöillä taustamaa on Suomi. Ulkomaalaistaustaisia ovat ne henkilöt, joiden molemmat vanhemmat tai ainoa tiedossa oleva vanhempi on syntynyt ulkomailla. Ulkomaalaistaustaisia ovat myös ulkomailla syntyneet henkilöt, joiden kummastakaan vanhemmasta ei ole tietoa Väestötietojärjestelmässä. Suomessa ennen vuotta 1970 syntyneiden ja äidinkieltään vieraskielisten henkilöiden on päätelty olevan ulkomaistaustaisia samoin kuin vuonna 1970 tai sen jälkeen Suomessa syntyneiden henkilöiden, joiden kummastakaan vanhemmasta ei ole Väestötietojärjestelmässä tietoa. Mikäli henkilön molemmat vanhemmat ovat syntyneet ulkomailla, on taustamaa ensisijaisesti biologisen äidin syntymävaltio. Jos henkilöllä on vain tieto ulkomailla syntyneestä isästä, on taustamaa isän syntymävaltio. Jos kummankaan vanhemman syntymävaltiosta ei ole tietoa, on taustamaa ulkomailla syntyneiden henkilöiden osalta henkilön oma syntymävaltio. Suomessa syntyneiden henkilöiden, joiden vanhemmista ei ole tietoa, ja joiden on päätelty olevan ulkomaalaistaustaisia, taustamaa on tuntematon. Ulkomailta adoptoitujen lasten osalta adoptiovanhemmat rinnastetaan biologisiksi vanhemmiksi. Näin ollen katsotaan, että Suomessa syntyneiden henkilöiden ulkomailta adoptoima lapsi on suomalaistaustainen ja taustamaa on siten Suomi.
Taloudellinen huoltosuhde
Taloudellinen huoltosuhde kuvaa työttömien ja työvoiman ulkopuolella olevien yhteenlaskettua määrää suhteessa työllisten määrään. Työssäkäyntitilastossa lasketaan, kuinka monta työtöntä ja työvoiman ulkopuolella olevaa on sataa työllistä kohden.
Taustamaa
Tilastokeskus on vuoden 2012 aikana ottanut käyttöön uuden syntyperä-luokituksen. Samantyyppinen luokitus on jo käytössä muissa Pohjoismaissa. Syntyperä ja taustamaa määräytyvät henkilön vanhempien syntymävaltiotiedon perusteella. Syntyperä-luokituksen avulla on helposti eriteltävissä ulkomailla ja Suomessa syntyneet ulkomaalaistaustaiset henkilöt. Digi- ja väestötietoviraston Väestötietojärjestelmään ei ole viety ennen vuotta 1964 kuolleiden henkilöiden tietoja. Suomen väestössä on vajaat 900 000 Suomessa syntynyttä henkilöä, joiden kummankaan vanhempien syntymävaltiota ei tiedetä, koska näiden henkilöiden vanhemmat ovat kuolleet ennen Väestötietojärjestelmän perustamista. Suomessa ennen vuotta 1970 syntyneiden henkilöiden, joiden vanhemmista ei ole tietoa, on päätelty olevan suomalaistaustaisia, mikäli he puhuvat äidinkielenään kotimaista kieltä (suomi, ruotsi, saame). Suomalaistaustaisia ovat myös kaikki ne henkilöt, joilla vähintään toinen vanhemmista on syntynyt Suomessa. Kaikilla suomalaistaustaisilla henkilöillä taustamaa on Suomi. Ulkomaalaistaustaisia ovat ne henkilöt, joiden molemmat vanhemmat tai ainoa tiedossa oleva vanhempi on syntynyt ulkomailla. Ulkomaalaistaustaisia ovat myös ulkomailla syntyneet henkilöt, joiden kummastakaan vanhemmasta ei ole tietoa Väestötietojärjestelmässä. Suomessa ennen vuotta 1970 syntyneiden ja äidinkieltään vieraskielisten henkilöiden on päätelty olevan ulkomaistaustaisia samoin kuin vuonna 1970 tai sen jälkeen Suomessa syntyneiden henkilöiden, joiden kummastakaan vanhemmasta ei ole Väestötietojärjestelmässä tietoa. Mikäli henkilön molemmat vanhemmat ovat syntyneet ulkomailla, on taustamaa ensisijaisesti biologisen äidin syntymävaltio. Jos henkilöllä on vain tieto ulkomailla syntyneestä isästä, on taustamaa isän syntymävaltio. Jos kummankaan vanhemman syntymävaltiosta ei ole tietoa, on taustamaa ulkomailla syntyneiden henkilöiden osalta henkilön oma syntymävaltio. Suomessa syntyneiden henkilöiden, joiden vanhemmista ei ole tietoa, ja joiden on päätelty olevan ulkomaalaistaustaisia, taustamaa on tuntematon. Ulkomailta adoptoitujen lasten osalta ottovanhemmat rinnastetaan biologisiksi vanhemmiksi. Näin ollen katsotaan, että Suomessa syntyneiden henkilöiden ulkomailta adoptoima lapsi on suomalaistaustainen ja taustamaa on siten Suomi.
Työikäinen väestö
Työikäiseen väestöön kuuluvat kaikki 15-74 -vuotiaat henkilöt. Ikärajaus perustuu väestölaskenta-asetukseen.
Työllinen
Työlliseen työvoimaan luetaan kaikki 18-74 -vuotiaat henkilöt, jotka vuoden viimeisellä viikolla olivat ansiotyössä eivätkä olleet työttömänä työnhakijana KEHA-keskuksen työnhakijarekisterissä tai suorittamassa varusmies- tai siviilipalvelua. Tieto työllisyydestä perustuu tulorekisterin ja veroviranomaisten tietoihin.
Työllisyysaste
Työllisten osuus saman ikäisestä väestöstä. Työssäkäyntitilastossa työllisyysaste lasketaan 18–64-vuotiaasta väestöstä.
Työnantajasektori
Työnantajasektoriluokitus (juridinen muoto) kuvaa työpaikan omistajuutta ja yritysmuotoa. Sen avulla voidaan tehdä jako mm. julkisen ja yksityisen sektorin välillä. Käytetty luokitus on seuraava: - Julkinen sektori (valtio, kunta) - Valtioenemmistöiset oy:t - Yksityinen sektori - Muu tai tuntematon Tieto työnantajasektorista perustuu Tilastokeskuksen yritys- ja toimipaikkarekisterin tietoihin yritysten omistajatyypistä ja oikeudellisesta muodosta. Näihin liittyvät luokitukset on esitetty julkaisussa "Sektoriluokitus".
Työpaikka
Tietyllä alueella työskentelevien henkilöiden lukumäärää voidaan käyttää kuvaamaan työpaikkojen lukumäärää tällä alueella. Jokaisen työllisen henkilön on tällöin ajateltu muodostavan yhden työpaikan. Näin osa-aikaistakin työtä tekevä henkilö muodostaa laskennallisesti yhden työpaikan. Jos työtä esimerkiksi äitiysloman vuoksi hoitaa sijainen, saattaa vastaavasti muodostua kaksi työpaikkaa. Työsuhteet voivat olla luonteeltaan myös tilapäisiä ja lyhytaikaisia. Rekisteripohjaisissa väestölaskennoissa ja työssäkäyntitilastossa ei ole tehty eroa kiinteissä työpaikoissa tehtävän työn ja luonteeltaan liikkuvan työn välillä, vaan kaikki henkilöt on pyritty sijoittamaan johonkin toimipaikkaan työn luonteesta riippumatta. Tarkemman työpaikan sijaintitiedon puuttuessa on henkilöt kiinnitetty asuinkuntaansa. Valtaosalla yrittäjistä työpaikan sijaintikunta on henkilön asuinkunta. Lähtötietojen puutteellisuudet voivat vääristää työpaikkamääriä. Esimerkiksi monitoimipaikkaisen yrityksen palveluksessa olevan henkilön työpaikka on tarkemman tiedon puuttuessa kiinnitetty asuinkuntaan tai henkilöt ovat voineet kasaantua yrityksen päätoimipaikkoihin.
Työpaikkaomavaraisuus
Työpaikkaomavaraisuus ilmaisee alueella työssäkäyvien ja alueella asuvan työllisen työvoiman määrän välisen suhteen. Jos työpaikkaomavaraisuus on yli 100 %, on alueen työpaikkojen lukumäärä suurempi kuin alueella asuvan työllisen työvoiman lukumäärä. Jos taas työpaikkaomavaraisuus on alle 100 %, on tilanne päinvastainen.
Työssäolokuukaudet
Työssäolokuukausilla tarkoitetaan henkilön yhteenlaskettua työkuukausien määrää vuoden aikana. Tiedot työssäolokuukausista perustuvat eri rekistereihin. Vuodesta 2005 lähtien työssäolokuukaudet on laskettu työpäivien lukumäärästä. Yksi työssäolokuukausi ei välttämättä vastaa täyden kuukauden työssäoloa, vaan esimerkiksi 15-44 työpäivän kertymä vuoden ajalta vastaa yhtä työssäolokuukautta ja 45-74 työpäivän kertymä vastaa kahta työssäolokuukautta. Työssäolopäivien kertymiskuukaudella ole merkitystä työssäolokuukausien määrään.
Työttömyysaste
Työttömien osuus saman ikäisestä työvoimasta, eli työllisistä ja työttömistä. Työssäkäyntitilastossa työttömyysaste lasketaan 18–64-vuotiaasta työvoimasta.
Työttömyyskuukaudet
Työttömyyskuukausilla tarkoitetaan henkilön työttömyyskuukausien yhteismäärää vuoden aikana. Tiedot työttömyydestä on saatu työ- ja elinkeinoministeriön työnhakijarekisteristä. Vuodesta 2005 lähtien työttömyyskuukaudet on laskettu työttömyyspäivien lukumäärästä. Yksi työttömyyskuukausi ei välttämättä vastaa täyden kuukauden työttömyyttä, vaan esimerkiksi 15–44 työttömyyspäivän kertymä vuoden ajalta vastaa yhtä työttömyyskuukautta ja 45–74 työttömyyspäivän kertymä vastaa kahta työssäolokuukautta. Työttömyyspäivien kertymiskuukaudella ole merkitystä työttömyyskuukausien määrään.
Työtön
Työttömään työvoimaan luetaan vuoden viimeisenä arkipäivänä työttömänä olleet 16-64-vuotiaat henkilöt. Tieto työttömyydestä on saatu KEHA-keskuksen työnhakijarekisteristä.
Työvoima
Työvoimaan luetaan kaikki henkilöt, jotka vuoden viimeisellä viikolla olivat työllisiä tai työttömiä. Työvoimaan kuuluvuus on ratkaistu eri rekistereistä saatujen tietojen perusteella.
Työvoiman ulkopuolella olevat
Työvoiman ulkopuolella olevilla tarkoitetaan henkilöitä, jotka eivät vuoden lopussa olleet työllisiä tai työttömiä.
Ulkomaalaistaustainen
Ulkomaalaistaustaisia ovat ne henkilöt, joiden molemmat vanhemmat tai ainoa tiedossa oleva vanhempi on syntynyt ulkomailla. Ulkomaalaistaustaisia ovat myös ulkomailla syntyneet henkilöt, joiden kummastakaan vanhemmasta ei ole tietoa väestötietojärjestelmässä. Suomessa ennen vuotta 1970 syntyneiden ja äidinkieltään vieraskielisten henkilöiden on päätelty olevan ulkomaalaistaustaisia samoin kuin vuonna 1970 tai sen jälkeen Suomessa syntyneiden henkilöiden, joiden kummastakaan vanhemmasta ei ole väestötietojärjestelmässä tietoa. Vieraskielisiksi luetaan henkilöt, joiden äidinkieli on jokin muu kuin suomi, ruotsi tai saame.
Varusmies
Varusmiehiksi määritellään henkilöt, jotka ovat pääesikunnan mukaan olleet varusmiespalveluksessa vuoden viimeisellä viikolla. Varusmiehiksi ei katsota laskentaviikolla kertausharjoituksissa olleita henkilöitä.
Viitehenkilö
Asuntokunnille ja perheille on määritelty viitehenkilö. Viitehenkilöllä tarkoitetaan asuntokunnan suurituloisinta henkilöä. Tulotietoina on käytetty tilastointivuoden valtionveronalaisia tuloja. Mikäli suurituloisin on alle 25-vuotias lapsen asemassa oleva, häntä ei määritellä asuntokunnan viitehenkilöksi. Tällöin viitehenkilön määrittelyssä käytetään tulotietojen lisäksi ikätietoja. Mikäli asuntokunnassa ei kenelläkään ole valtionveronalaisia tuloja, viitehenkilö määritellään ikätietojen perusteella. Viitehenkilön tietoja käytetään esim. silloin, kun halutaan määritellä koko väestölle sosioekonominen asema tai toimiala.
Väestö
Väestöllä tarkoitetaan alueella (esim. koko maa, lääni, kunta) vakinaisesti asuvaa väestöä. Ne henkilöt, joilla väestötietojärjestelmän mukaan oli kotipaikka Suomessa vuodenvaihteessa 31.12., kuuluvat ko. vuoden väestöön kansalaisuudestaan riippumatta; samoin ne Suomen kansalaiset, jotka asuvat tilapäisesti ulkomailla. Ulkomaalaisella on kotipaikka Suomessa, jos hänen oleskelunsa on tarkoitettu kestämään tai on kestänyt vähintään yhden vuoden. Turvapaikan hakija saa kotipaikan vasta, kun hänen hakemuksensa on hyväksytty. Suomessa asuvat vieraan valtion lähetystöön, kaupalliseen edustustoon tai lähetetyn konsulin virastoon kuuluvat henkilöt sekä näiden perheenjäsenet ja henkilökohtainen palveluskunta eivät kuulu maassa asuvaan väestöön, elleivät ole Suomen kansalaisia. Sen sijaan Suomen ulkomailla olevien lähetystöjen ja kaupallisten edustustojen suomalainen henkilökunta sekä YK:n rauhanturvajoukoissa palvelevat luetaan maassa asuvaan väestöön.
Yrittäjä
Yrittäjiksi määritellään 18-74 -vuotiaat henkilöt, joilla on vuoden viimeisellä viikolla voimassa oleva yrittäjäeläkevakuutus ja jotka eivät ole työttömiä vuoden viimeisenä työpäivänä eivätkä varusmiehiä tai siviilipalvelusmiehiä vuoden viimeisellä viikolla. Mikäli henkilöllä on yrittäjäeläkevakuutuksen lisäksi samanaikaisesti voimassa oleva työsuhde, edellytetään, että yrittäjätulot ovat suuremmat kuin palkkatulot. Yrittäjiksi määritellään lisäksi henkilöt, joilla yrittäjätulot ylittävät määritellyn tulorajan, edellyttäen, että he eivät ole eläkkeellä tutkimusviikolla. Tuloraja määritellään vuosittain päättelyiden yhteydessä käyttäen hyväksi työvoimatutkimuksen yrittäjiä koskevia tietoja.
Toimintavaltuudet (SIMS 6)
Tilastolaki (Finlex.fi) ohjaa tilastojen laadintaa. Tilastolaissa säädetään muun muassa tiedonkeruusta, tietojen käsittelystä ja tiedonantovelvollisuudesta. Tietojen käsittelyyn tilastoja tuotettaessa sovelletaan tilastolain lisäksi yleistä tietosuoja-asetusta, tietosuojalakia sekä lakia viranomaisen toiminnan julkisuudesta.
Tilastokeskus soveltaa tilastoja laatiessaan EU:n tilastosäädöksiä, jotka ohjaavat kaikkien EU-maiden tilastovirastoja.
Lainsäädäntö ja muut sopimukset (SIMS 6.1)
Työssäkäyntitilaston tietojen tuottamisen taustalla on EU:n väestölaskenta-asetus Regulation (EC) No 763/2008, jonka mukaisesti väestölaskenta ja siihen liittyvä asunto- ja kiinteistölaskenta tehdään joka kymmenes vuosi. Suomessa väestölaskenta-asetuksen mukaiset tiedot (sis. työssäkäyntitilaston tiedot) tuotetaan vuosittain.
Työssäkäyntitilaston tietoja toimitetaan myös kansaivälisen raportointiin UOE-Personnel Eurostat, OECD, UNESCO yhteistyössä oppilaitostilaston kanssa. Tiedot opettajista ovat vain aggregoituja lukumäärätietoja ts. varsinaisesta aineiston siirrosta ei ole kyse. Taustalla KOMISSION ASETUS (EU) N:o 912/2013.
Tietojen jakaminen (SIMS 6.2)
- Kansallinen käyttö
- Muut tilastot
- Eurostat
Kustannukset ja vastausrasite (SIMS 16)
Aika ajoin tehdään vastausrasitemittauksia tiedoinkeruille, joiden pohjalta tiedonkeruita kehitetään. Vastausrasitetta pyritään minimoimaan muun muassa esitäyttämällä tiedonkeruulomakkeita.
Lähdeaineistot (SIMS 18.1)
Työssäkäyntitilaston tuotannossa käytetään usean eri rekisterin tai tietoaineiston tietoja. Keskeisimpiä näistä ovat:
- väestötietojärjestelmä (DVV)
- tulorekisteri
- veroaineisto
- KEHA-keskuksen työnhakijarekisteri
- eri opiskelijarekisterit
- OKM:n rekisteri yliopistojen henkilöstöstä ja toimipaikoista
- pääesikunnan asevelvollisuusrekisteri ja ELY-keskuksen siviilipalvelusrekisteri
- Eläketurvakeskuksen YEL/MYEL-vakuutettujen rekisteri
- Tilastokeskuksen yritys- ja toimipaikkarekisteri ja julkisyhteisöjen rekisteri
- Tilastokeskuksen tutkintorekisteri
- palkkarakennetilasto
Rekistereiden lisäksi tehdään tiedonkeruu monitoimipaikkaisilta yrityksiltä:
- Toimipaikkarakenne- ja henkilöstötiedustelu
Keskeistä järjestelmässä on se, että rekistereiden tunnusjärjestelmät ovat niin hyvät, että eri tietojen yhdisteleminen on mahdollista. Rekisterit voivat sisältää päällekkäistä tietoa, osin myös ristiriitaista tietoa.
Olennaista on, että rekisterit täydentävät toisiaan ja päällekkäisyys toisaalta varmistaa sen, että järjestelmä ei ole niin haavoittuva. Jos esimerkiksi työeläkejärjestelmästä ei saada tietoa työsuhteesta, voidaan tieto henkilön työllisyydestä päätellä verotuksen tietojen kautta.
Useat tiedot työssäkäyntitilastoon voidaan saada suoraan jostakin rekisteristä niitä juurikaan muuttamatta tai muokkaamatta. Tällaisia tietoja ovat esimerkiksi henkilön demografiset tiedot tai tulo- ja varallisuustiedot.
Monia tietoja tuotetaan myös niin sanotulla rekisteriestimointimenetelmällä, jossa käyttämällä hyväksi samanaikaisesti useita rekisteriaineistoja määritellään jokaiselle henkilölle kunkin muuttujan arvo.
Esimerkkinä tällaisesta muuttujasta on henkilön pääasiallinen toiminta. Sen päättelyssä tarvitaan tietoja henkilön iästä, työsuhteista, työttömyydestä, opiskelusta, eläkkeen saamisesta ja niin edelleen.
Päättelysäännöt on muodostettu siten, että ne tuottavat mahdollisimman lähelle lomakepohjaisesti kerättyjen tietojen mukaiset tiedot. Päättelysääntöjen muodostamisessa on käytetty apuna aikaisempien väestölaskentojen tietoja ja rekisteritietoja samalta ajankohdalta. Päättelysääntöihin sisältyy myös eri aineistojen priorisointi siinä tapauksessa, kun tiedot ovat ristiriitaisia.
Tiedonkeruun tiheys (SIMS 18.2)
Työssäkäyntitilaston rekisteripohjaiset lähdeaineistot kerätään vuosittain. Tulorekisterin käyttöönoton myötä ollaan siirtymässä jatkuvapäivitteisiin tietovarantoihin. Tiedustelu monitoimipaikkaisissa yrityksissä työskentelevien toimipaikoista toteutetaan vuosittain.
Tiedonkeruumenetelmä (SIMS 18.3)
Työssäkäyntitilaston rekisteripohjaiset aineistot toimitetaan Tilastokeskukseen tiedon toimittajien kanssa tehtyjen sopimusten mukaisesti.
Työssäkäyntitilaston ja Tilastokeskuksen yritys- ja toimipaikkarekisterin yhteinen toimipaikkarakenne- ja henkilöstötiedustelu lähetetään loppuvuodesta monitoimipaikkaisille yrityksille ja yhteisöille. Vuosittain tiedustelussa on mukana noin 5 000 yritystä tai yhteisöä. Tiedusteluun vastataan verkkolomakkeella. Lopuksi Tilastokeskuksen haastattelijat tavoittelevat vastaamattomia yrityksiä ja yhteisöjä.
Aineiston/datan validointi (SIMS 18.4)
Työssäkäyntitilastoon saapuvat lähdeaineistot tarkistetaan teknisesti. Aineistojen frekvenssejä verrataan aiempiin vuosiin ja tarvittaessa tarkistetaan aineiston toimittajalta, onko tilastoitavassa ilmiössä, aineiston tietosisällössä tai luokituksissa tapahtunut muutoksia.
Tiedon käsittely (SIMS 18.5)
Työssäkäyntitilaston tuotannon keskeiset prosessit ovat:
Pääasiallinen toiminta ja jaksotiedot, toimiala, sektori
Aineistojen käsittelyprosesseissa yhdistellään ja täydennetään tietoja sekä tarkistetaan ja korjataan tiedonkeruissa kerättyä dataa. Näitä prosesseja voidaan suorittaa sitä mukaa, kun lähdeaineistoja viedään tietokantaan. Prosessin vaiheita ovat toimipaikkatunnusten tarkistus ja korjaus, koneellinen yritys- ja yrittäjälinkkaus, manuaalinen yrityslinkkaus, koneellinen toimipaikkalinkkaus, tarkistusohjelmien ajo sekä aineiston manuaalinen korjaus.
Henkilöille valitaan mahdollisesti useiden työsuhteiden joukosta henkilön pää- ja sivutyösuhde sekä päätellään henkilön pääasiallinen toiminta (esimerkiksi työllinen, työtön, opiskelija, eläkeläinen jne.).
Työssäkäyntitilaston tuotannossa muodostetaan lisäksi useita jatkotietoja muun muassa (työttömyys, työnhaku, ase- ja siviilipalvelusvelvollisuus), joita voidaan hyödyntää eri viiteajankohtien tarkasteluissa.
Ammatti
Työssäkäyntitilastossa tiedot ammatista tuotetaan 18–74-vuotiaille palkansaajille ja yrittäjille ensisijaisesti henkilön vuoden viimeisen viikon päätyösuhteen mukaan.
Ammattikoodi muodostetaan pääasiassa henkilölle ammattinimikkeen, toimialatiedon, koulutuksen ja sektorin perusteella sovelluksella. Osa palkansaajien ammattitiedoista (työnantajajärjestöt) saadaan valmiskoodeina palkkatilastosta.
Ammattirekisterisovellukseen voi lisätä uusia ammattinimikkeitä hakusanoiksi tai hakusanan synonyymeiksi. Hakusanoille voi lisätä ja päivittää sääntöjä. Säännöt sisältävät toimipaikan tai yrityksen toimialatietoja, sektoritietoja ja yrityksen kokotietoja sekä henkilön koulutus ja ammattia-asema-tietoja (yrittäjä, palkansaaja). Ammattisovelluksen Ammattisanakirjassa ammatteihin liittyviä hakusanoja ja niihin liittyviä ehtoja on noin 30 000.
Myös yrittäjät luokitellaan Ammattirekisterisovelluksella. Yrittäjien päättelysäännöt pohjautuvat lähinnä toimialaan ja yrityskokoon. Muun muassa pienten, alle viisi henkillöä työllistävien yritysten omistajat ja toimitusjohtajat luokitellaan ammatteihin, johon työtehtävätkin liittyvät esimerkiksi kampaaja, taksinkuljettaja.
Yritysten, joissa työntekijöitä on 5–49, toimitusjohtajat luokitellaan johtajaluokkiin 12, 13 tai 14. Esimerkiksi toimitusjohtaja rakennusalan yrityksessä, jossa henkilökuntaa on 5 tai enemmän, mutta alle 50, luokitellaan luokkaan 1323 Rakennustoiminnan tuotantojohtajat. Yritysten, joissa henkilökuntaa on 50 tai enemmän, toimitusjohtajat luokitellaan luokkaan 1120 Toimitusjohtajat ja pääjohtajat.
Lisäksi ilman ammattiluokkaa jääneistä palkansaajista muodostetaan niin kutsuttu nimikkeettömien aineisto, jolle niin ikään sovelluksella ajetaan ammatit. Nimikkeettömien päättelysäännöissä toimialan, koulutuksen ja sektorin lisäksi on käytössä joillekin ammattikoodeille ikäraja ja palkkaraja ehtoja.
Jonkin verran, noin 6 %, ammatin päättelyä joudutaan tekemään myös manuaalisesti ja ne koskevat lähinnä yrittäjiä, nimikkeettömiä sekä tarkistusvaiheessa havaittuja virheitä. Tässä käytetään prosessin eri vaiheissa tarkentuneiden taustatietojen lisäksi apuna myös edellisten vuosien tietoja.
Koska lähteistä osalle henkilöistä löytyy useita ammattinimikkeitä, on tärkeää saada ammattitieto yhdistettyä vuoden viimeisen viikon pääasialliseen työsuhteeseen. Ammattitieto ja työsuhdetieto pyritään ensisijaisesti ottamaan samasta rekisteristä, mutta aina näin ei pystytä tekemään. Tällöin henkilön ammatti ja työssäkäyntitilastossa valittu päätyösuhde toimialoineen voivat kuvata eri työsuhdetta.
Sosioekonominen asema
Tiedot sosioekonomisesta asemasta muodostetaan koko väestölle eli tilastovuoden viimeisenä päivänä Suomessa vakinaisesti asuville henkilöille.
Sosioekonomisen aseman luokat tuotetaan sovelluksella. Tiedot sosioekonomisesta asemasta perustuvat tietoihin henkilön iästä, pääasiallisesta toiminnasta, ammatista, ammattiasemasta sekä toimialasta.
Sosioekonomisen aseman tietojen pohjana käytetään vuoden 2010 tiedoista lähtien vuoden 2010 ammattiluokitusta. Henkilöt on luokiteltu oman toimintansa perusteella lukuun ottamatta 0–15 -vuotiaita ja ryhmää "muut työvoimaan kuulumattomat" (lähinnä omaa kotitaloutta hoitavat), jotka ovat saaneet asuntokunnan viitehenkilön sosioekonomisen aseman.
Käyttäjien tarpeet (SIMS 12.1)
Työssäkäyntitilaston keskeiset käyttäjät ovat: Suomen julkinen hallinto, kunnat, maakunnat, elinkeinoelämä, tutkijat ja kansalaiset.
Tilaston tietoja käytetään muun muassa koulutuksen suunnittelussa, työvoimapoliittisessa suunnittelussa, selvityksissä ja tutkimuksissa.
Käyttäjätyytyväisyys (SIMS 12.2)
Työssäkäyntitilaston käyttäjätyytyväisyyttä seurataan keräämällä palautetta useista lähteistä, kuten Tilastokeskuksen verkkosivujen palautekanavien kautta sekä suoraan asiantuntijoille osoitetuista yhteydenotoista.
Lisäksi käyttäjien tarpeita ja näkemyksiä kartoitetaan säännöllisessä vuorovaikutuksessa keskeisten sidosryhmien kanssa, kuten ministeriöiden, tutkimuslaitosten ja muiden viranomaisten kanssa.
Saatu palaute kohdistuu tyypillisesti tietojen ajantasaisuuteen, alueelliseen tarkkuuteen, käsitteiden selkeyteen sekä aineistojen saatavuuteen ja käytettävyyteen. Työssäkäyntitilastoa pidetään yleisesti luotettavana ja kattavana tietolähteenä erityisesti alueellisen työmarkkinatiedon osalta, mutta käyttäjät toivovat usein nopeampaa julkaisemista ja lisää joustavuutta aineistojen hyödyntämiseen.
Käyttäjäpalautetta hyödynnetään tilaston kehittämisessä, esimerkiksi tietosisältöjen tarkentamisessa, dokumentaation parantamisessa sekä jakelukanavien ja -muotojen kehittämisessä.
Tarkkuus ja luotettavuus yleisesti (SIMS 13.1)
Työssäkäyntitilaston lähdeaineistoina käytetään lähinnä hallinnollisia rekistereitä ja muita rekisteripohjaisia tietoaineistoja. Tilaston laatu on siten suoraan riippuvainen lähdeaineistojen laadusta. Suoraa tiedonkeruuta tapahtuu vain toimipaikkatietojen määrittämisessä monitoimipaikkaisten yritysten palveluksessa oleville.
Suomessa rekisteripohjaisten tietojen luotettavuutta tutkittiin jo ennen päätöstä rekisteripohjaiseen väestölaskentajärjestelmään siirtymisestä.
Vuosien 1980 ja 1985 laskennoissa väestön taloudellista toimintaa ja työssäkäyntiä kuvaavat tiedot kerättiin vielä lomakkeilla, mutta samanaikaisesti oli saatavilla myös rekisteripohjaisia tietoja. Vuoden 1980 väestölaskennassa tehtiin vertailututkimus 20 kunnan osalta ja vuoden 1985 väestölaskennan yhteydessä kaikkien kuntien osalta.
Tutkimuksessa verrattiin rekisteripohjaisesti määriteltyä tietoa väestön pääasiallisesta toiminnasta ja ammattiasemasta lomakkeella kerättyyn tietoon. Erot rekisteripohjaisesti ja lomakepohjaisesti tuotettujen tietojen osalta todettiin niin pieniksi, että päätös rekisteripohjaiseen tilastotuotantoon siirtymisestä voitiin tehdä.
Ensimmäisen kokonaan rekisteripohjaisen väestölaskennan yhteydessä vuonna 1990 tehtiin laaja luotettavuustutkimus. Rekisteritilastoja verrattiin otospohjaisen lomaketiedustelun antamiin tietoihin. Otos käsitti noin kaksi prosenttia rakennuksista, asunnoista ja henkilöistä.
Luotettavuustutkimus osoitti, kuinka suurella osalla lomaketieto ja rekisteritieto poikkesivat toisistaan, mutta ei lopulta sitä, kumpi tieto oli oikea. Esimerkiksi useampaa työtä tekevä ilmoitti lomaketiedustelussa pääasialliseksi työkseen eri toimen kuin mihin rekisteripäättelyssä päädyttiin. Työssäkäyvä opiskelija tuli määritellyksi rekisteritiedoilla väistämättä työlliseksi, vaikka hän itse olisikin jättänyt työnsä kertomatta.
Tutkimukset ovat osoittaneet, ettei rekisteripohjaisten ja lomakepohjaisten tietojen ero ole suurempi kuin kahden lomakepohjaisen tiedon välinen ero. Vertailututkimuksia on julkaistu Tilastokeskuksen sarjoissa.
Tärkeimmäksi rekisteripohjaisen työssäkäyntitilaston laadunvalvontamenetelmäksi on kehittynyt työvoimatutkimuksen käyttö vertailuaineistona. Myös vuosien 1995 ja 2000 väestölaskennan luotettavuustutkimukset perustuivat työvoimatutkimuksen käyttöön vertailutietona.
Työvoimatutkimuksen käyttö vertailuaineistona toimii kahdella tasolla. Toisaalta seurataan näiden kahden menetelmän tuottamien tulosten tasoa ja toisaalta sitä, miten hyvin menetelmät tuottavat yksikkötasolla samalla tavoin luokiteltua tietoa.
Yksikkötason vertailu tehdään ristiintaulukoimalla työvoimatutkimuksen otosaineiston henkilöiden saman ajankohdan rekisteripohjaiset ja haastatteluun perustuvat tiedot pääasiallisesta toiminnasta ja toimialasta keskenään. Vertailuja on tehty vuodesta 1987 lähtien.
Usein poikkeamat ovat selitettävissä rekisterijärjestelmän ja haastattelumenetelmän eroilla, eikä aina voida yksikäsitteisesti sanoa, kumpi menetelmä tuottaa oikean tuloksen eli välttämättä haastattelemallakaan saatu tieto ei ole absoluuttisen oikea.
Usein todellisuudessa on niin, että henkilö itse tai haastattelija joutuu tekemään päätöksen ristiriitaisen informaation pohjalta, kun taas rekisterimenetelmässä on laadittu yksikäsitteinen sääntö. Rekisterimenetelmän etuna on tällöin sen loogisuus: kone tekee ratkaisun aina samalla tavalla, mutta saman informaation omaavat henkilöt voivat päätyä eri lopputulokseen.
Mittausvirhe (SIMS 13.3.2)
Työssäkäyntitilaston mittausvirhe liittyy pääasiassa rekisteriaineistojen ominaisuuksiin, sillä tiedot perustuvat useiden hallinnollisten rekisterien yhdistelyyn. Virheitä voi syntyä rekisterien erilaisista kirjauskäytännöistä sekä tietojen ajoittumisesta eri ajankohtiin.
Lisäksi mahdolliset tekniset virheet tiedonsiirrossa tai rekisterien päivityksissä sekä raportointikäytäntöjen muutokset voivat vaikuttaa tietojen yhtenäisyyteen ajassa.
Suora tiedonkeruu voi sisältää tavanomaisia mittausvirheitä, kuten vastaajien tulkintaeroja ja muistivirheitä sekä lomakemuotoiluun liittyviä epäselvyyksiä, vaikka niiden merkitys on kokonaisuuden kannalta vähäinen. Mittausvirhe voi vaikuttaa yksittäisten henkilöiden luokitteluun, mutta koko tilaston tasolla vaikutukset ovat yleensä rajallisia rekisteripohjaisen tiedon laajuuden vuoksi.
Mittausvirhettä pyritään hallitsemaan yhdistämällä tietoja useista lähteistä, soveltamalla yhtenäisiä luokittelu- ja päättelysääntöjä sekä tekemällä aineistoon automaattisia tarkistuksia ja editointia.
Lisäksi aikasarjoja seurataan systemaattisesti, muutokset dokumentoidaan ja rekisterinpitäjien kanssa tehdään yhteistyötä tietojen laadun ja yhtenäisten kirjauskäytäntöjen varmistamiseksi.
Käsittelyvirhe (SIMS 13.3.4)
Käsittelyvirheellä tarkoitetaan virheitä, joita voi syntyä aineiston yhdistelyssä, muokkauksessa, luokittelussa ja muussa tietojenkäsittelyssä tilastotuotannon aikana. Työssäkäyntitilastossa virheitä voi aiheutua erityisesti rekisteritietojen yhdistämisestä tunnisteiden perusteella, luokittelusääntöjen soveltamisesta sekä tietojenkäsittelyn teknisistä toteutuksista.
Virheet voivat vaikuttaa yksittäisiin havaintoihin tai näkyä laajempina poikkeamina tilastossa. Niitä hallitaan automaattisilla tarkistuksilla ja validoinneilla, vertailulaskennoilla ja aikasarjaseurannalla sekä varmistamalla tuotantoprosessin toistettavuus ja versionhallinta, jolloin mahdolliset virheet voidaan havaita ja korjata hallitusti.
Laadunvarmistus (SIMS 11.1)
Laadunhallinta edellyttää toiminnan kokonaisvaltaista ohjausta. Euroopan tilastoja koskevat käytännesäännöt muodostavat Euroopan tilastojärjestelmän yhteisen laatujärjestelmän perustan. Käytännesäännöt perustuvat 16 periaatteeseen, jotka koskevat tilastoviranomaisen riippumattomuutta, vastuuvelvollisuutta sekä prosessien ja julkaistavan tiedon laatua.
Periaatteet ovat yhteensopivat YK:n tilastokomission hyväksymien virallisen tilaston periaatteiden kanssa ja täydentävät niitä. Suomen virallisen tilaston laatukriteerit ovat yhteensopivat Euroopan tilastojen käytännesääntöjen kanssa.
Lisätietoja:
Laadun arviointi (SIMS 11.2)
Työssäkäyntitilaston laatua arvioidaan Suomen virallisen tilaston laatulinjauksen mukaisesti tilastoprosessin eri vaiheissa.
Tilaston relevanssia voidaan pitää hyvänä, sillä se vastaa laajasti keskeisiin yhteiskunnallisiin tietotarpeisiin erityisesti alueellisen työmarkkinatilanteen, väestön toiminnan ja työssäkäynnin osalta. Rekisteripohjaisuuden ansiosta tilaston kattavuus ja tarkkuus ovat pääosin korkeita, vaikka yksittäisiin tietoihin voi liittyä epävarmuutta.
Tilaston ajantasaisuus on rekisteriaineistoihin perustuvaksi tilastoksi kohtuullinen, mutta tuotantoprosessin laajuuden ja useiden lähteiden yhdistelyn vuoksi viive on pidempi kuin otospohjaisissa tilastoissa. Täsmällisyys julkaisuaikataulujen noudattamisessa on pääosin hyvä.
Tilaston yhtenäisyys ja vertailukelpoisuus ovat pääosin hyviä ajassa ja alueiden välillä, mutta muutokset lähdeaineistoissa, luokituksissa tai tuotantomenetelmissä voivat vaikuttaa vertailtavuuteen, mikä huomioidaan dokumentoinnissa.
Tilaston saatavuus ja selkeys ovat hyvät, sillä tiedot julkaistaan avoimesti Tilastokeskuksen verkkopalvelussa kattavien metatietojen kera, mikä tukee tulkintaa ja käyttöä.
Kokonaisuutena työssäkäyntitilasto täyttää hyvin viralliselle tilastolle asetetut keskeiset laatukriteerit. Eri laatutekijät, kuten tarkkuus, ajantasaisuus ja kattavuus, voivat kuitenkin painottua eri tavoin tuotantoratkaisuista riippuen, minkä vuoksi niiden välistä tasapainoa arvioidaan jatkuvasti tilastoa kehitettäessä.
Tietojen revisoitumislinjaukset (SIMS 17.1)
Jo julkistettujen tilastotietojen tarkentuminen eli revisio on osa normaalia tilastotuotantoa ja merkitsee laadun parantumista. Periaatteena on, että tilastotiedot perustuvat parhaaseen saatavilla olevaan aineistoon ja tietoon tilastoitavasta ilmiöstä. Toisaalta tarkentumisesta pyritään tiedottamaan mahdollisimman läpinäkyvästi ennakkoon. Ennakkoviestinnällä varmistetaan, että käyttäjät pystyvät varautumaan tietojen tarkentumiseen.
Tilastojulkistusten tietojen tarkentumisen taustalla on useimmiten aineiston täydentyminen. Tällöin uusi, revisioitu tilastoluku perustuu laajempaa tietopohjaan ja kuvaa ilmiötä entistä tarkemmin.
Tilaston tietojen tarkentuminen voi liittyä myös käytettävään laskentamenetelmään, kuten lukujen vuosittaiseen täsmäytykseen tai painorakenteen päivitykseen. Myös perusvuoden ja käytettyjen luokitusten muutoksesta aiheutuu tietojen tarkentumista.
Oikea-aikaisuus (SIMS 14.1)
Pääasiallinen toiminta ja ammattiasema valmistuvat noin 12 kuukautta, työpaikkatiedot 20 kuukautta ja ammatti ja sosioekonominen asema noin 22 kuukautta viiteajankohdan jälkeen.
Täsmällisyys (SIMS 14.2)
Työssäkäyntitilaston tiedot on pääsääntöisesti julkistettu julkistamiskalenterin mukaisina päivinä. Mahdolliset viivästykset ovat johtuneet muun muassa lähdeaineistojen viivästymisestä.
Maantieteellinen vertailukelpoisuus (SIMS 15.1)
Muuttuvat alueluokitukset (kuten kuntamuutokset) vaikuttavat tiettyjen tietojen (esimerkiksi kuntien välinen pendelöinti) vertailukelpoisuuteen.
Tarkkojen aluejakojen (esimerkiksi postinumeroalueet) tiedoissa voi olla virhettä johtuen lähdeaineistojen laadusta. Työssäkäynti Suomen rajojen ulkopuolella voi aiheuttaa virhettä rajakuntien työllisyystietoihin.
Ajallinen vertailukelpoisuus (SIMS 15.2)
Työssäkäyntitilaston laatiminen on aloitettu vuodesta 1987. Työssäkäyntitilaston perusjoukko ja määrittelyt ovat pysyneet suunnilleen samana vuodesta 1987 lähtien.
Tilastossa käytetyt luokitukset ovat muuttuneet vuosien mittaan. Esimerkiksi toimialaluokitus on muuttunut vuosina 1993, 2001 ja 2007 ja ammattiluokitus vuosina 1995 ja 2010.
Luokitusmuutokset vaikuttavat aikaisempien vuosien vertailtavuuteen, sillä täydellisiä avaimia ei kaikkien luokitusten välille voi rakentaa. Tilastossa käytettävät luokitukset ja luokitusten väliset avaimet löytyvät Tilastokeskuksen verkkosivuilta.
Myös muutokset lainsäädännössä vaikuttavat tilastojen vertailtavuuteen. Vuoden 1998 alusta tuli voimaan niin sanottu pätkätyölaki, jolloin myös lyhyet työsuhteet tulivat eläkevakuutuksen piiriin. Tämä lisäsi työllisten määrää jonkin verran.
Vuodesta 2005 vuoteen 2016 työeläkevakuutuksen piiriin kuuluivat 18–67-vuotiaat. Ennen vuotta 2005 työeläkevakuutuksen piiriin henkilöt kuuluivat 14 vuoden iästä lähtien. Tämä näkyy työssäkäyntitilastossa vuodesta 2005 alkaen nuorten työllisyyden vähenemisenä ja opiskelijoiden määrän kasvuna.
Vuoden 2017 eläkeuudistuksen yhteydessä työeläkevakuuttamisen alaikäraja laskettiin 17 ikävuoteen. Yrittäjäeläkevakuutuksen alaikäraja säilyi 18 ikävuodessa. Työssäkäyntitilaston työllisten päättelyssä vuoden 2017 muutosta ei ole huomioitu, vaan työllisten alaikärajana on edelleen 18 vuotta.
Apurahansaajat on vuoden 2009 alusta lähtien vakuutettu maatalousyrittäjän eläkelain (MYEL) mukaisen lakisääteisen työeläketurvan piiriin, minkä seurauksena heidät määritellään yrittäjiksi.
Vuoden 2010 tilastosta lähtien yrittäjien määrittelyssä otetaan huomioon yrittäjätulojen lisäksi myös henkilöverotuksessa palkkatuloihin kuuluva niin sanottu yrittäjäpalkka (YEL-/MYEL-vakuutetun yrittäjän palkka), jota yrittäjänä toimiva voi saada esimerkiksi avoimen yhtiön yhtiömiehenä, kommandiittiyhtiön vastuunalaisena yhtiömiehenä ja osakeyhtiön johtavassa asemassa toimivana osakkaana.
Jos henkilö toimii vuoden viimeisellä viikolla sekä yrittäjänä että palkansaajana, henkilö määritellään yrittäjäksi, jos hänen yhteenlasketut yrittäjätulonsa ja -palkkansa ovat suuremmat kuin muut palkkatulot, ja päinvastoin. Yrittäjäpalkan huomioiminen yrittäjien määrittelyssä lisäsi yrittäjien määrää noin 3 300 henkilöllä vuoden 2010 tilastossa.
Vuosina 2010–2011 yrittäjien määrä nousi koko maassa 9 600:lla. Nousuun vaikutti se, että yrittäjän ja maatalousyrittäjän eläkelain yrittäjämääritelmä laajeni vuoden 2011 alusta. Yrittäjäksi määritellään osakeyhtiössä tai muussa yhteisössä johtavassa asemassa työskentelevä henkilö, joka omistaa yksin yli 30 % yrityksen osakkeista tai jolla on yksin yli 30 % osakkeiden tuottamasta äänimäärästä tai jolla on muussa yhteisössä vastaava määräämisvalta. Aiemmin raja oli 50 %.
Varusmiespalvelusajan ja siviilipalveluksen kestoa lyhennettiin 15 vuorokaudella 1.2.2013 (lait asevelvollisuuslain ja siviilipalveluslain muuttamisesta). Lakiuudistuksen myötä iso osa asevelvollisista kotiutuu palveluksesta ennen joulua, eikä siten ole työssäkäyntitilaston viiteajankohtana (vuoden viimeisellä viikolla) enää varusmies- tai siviilipalveluksessa. Uudistuksen seurauksena asevelvollisten määrä väheni vuosina 2012–2013 lähes 9 400:lla.
Työttömyyseläkkeellä olevien määrä on vähentynyt voimakkaasti 2000-luvun lopusta lähtien. Työttömyyseläkkeitä ei ole myönnetty vuoden 2011 jälkeen.
Vuoden 2013 tilastosta alkaen toimialaluokkaan 97000 Kotitalouksien toiminta kotitaloustyöntekijöiden työnantajina tilastoitiin työllisiä aiempaa kattavammin. Tilastovuonna 2013 toimiala 97000 kasvoi lähes 7 600 työllisellä. Jos henkilöt olivat edellisvuonna työllisiä, yleisin aiempi toimiala oli tuntematon.
Vuoden 2015 tilastosta alkaen maatalouden toimialatiedot ovat tarkentuneet. Muutokset tilastovuosien 2014–2015 välillä näkyvät toimialan 01 (Kasvinviljely ja kotieläintalous, riistatalous ja niihin liittyvät palvelut) tarkemmilla luokitustasoilla siirtyminä maatalouden tuotantosuuntaa tarkemmin kuvaaviin luokkiin.
Vuonna 2017 aloitettiin työttömien työnhakijoiden määräaikaishaastattelut, joiden avulla työnhakijarekisteriä pystyttiin ajantasaistamaan. Työttömien määrän laskuun 2016–2017 välillä voi osin vaikuttaa haastatteluiden myötä tehdyt päivitykset työnhakijarekisteriin. Tarkkaa tietoa haastatteluiden vaikutuksesta työttömien määrään ei ole, mutta Työ- ja elinkeinoministeriössä on arvioitu vaikutuksen voivan olla 20 00 –30 000 henkilöä (TEM-analyyseja 83/2017).
Palkansaajien päättelyssä käytettäviä palkka- ja yrittäjätulojen käsitteitä laajennettiin vuonna 2014. Käytettävät määritelmät vastaavat nyt tulonjaon kokonaistilaston vastaavia tulokäsitteitä.
Vuonna 2019 työssäkäyntitilastossa otettiin käyttöön tulorekisteri uutena lähdeaineistona. Tulorekisteri korvasi useita tilastossa aiemmin käytössä olleita työsuhdeaineistoja. Vuodesta 2023 lähtien myös eläketiedot tulevat tulorekisteristä.
Aineisto 9. ja 10. luokalla olevista henkilöistä muodostettiin vuonna 2019 ensimmäistä kertaa Koski-tietovarannosta. Tietojen tallennustavan vuoksi tiedot olivat osittain puutteelliset. Tämän seurauksena noin 400–800 16-vuotiasta on luokittunut opiskelijoiden sijasta ryhmään muut työvoiman ulkopuoliset.
Ennen vuotta 1987 väestön taloudellista toimintaa kuvaavia kuntatasoisia tietoja on tuotettu lomakepohjaisissa väestölaskennoissa (vuosilta 1950, 1960, 1970, 1975, 1980 ja 1985). Erot rekisteri- ja lomakepohjaisesti tuotettujen tietojen välillä ovat osoittautuneet sen verran pieniksi, että vertailtavuutta ajassa voidaan pitää suhteellisen hyvänä muiden kuin edellä mainittujen luokitusmuutosten vuoksi.
Yhtenäisyys yli tilastoalueiden (SIMS 15.3)
Tietoja väestön taloudellisesta toiminnasta saadaan myös Tilastokeskuksen työvoimatutkimuksesta, joka on kuukausittain tehtävä otostutkimus. Tiedot poikkeavat keruutavasta ja työllisten päättelystä johtuen jonkin verran työssäkäyntitilaston tiedoista. Muun muassa työllisten määrä on työvoimatutkimuksessa joitakin prosentteja suurempi.
Ammattitietoja koskevia tilastoja julkaistaan Tilastokeskuksessa työssäkäyntitilaston lisäksi myös palkkarakennetilastossa ja työvoimatutkimuksessa. Palkkarakennetilaston ja työssäkäyntitilaston ammattitiedot ovat tärkeimpien yhteisten tietolähteiden vuoksi melko lähellä toisiaan.
Palkkarakennetilaston tiedoista puuttuvat kuitenkin yrittäjät sekä yritykset, joiden päätoimialana on maa-, metsä- tai kalatalous. Työssäkäyntitilaston ja työvoimatutkimuksen ammattitiedot tulevat eri lähteistä ja koskevat eri ajanjaksoja – työvoimatutkimus tehdään kuukausittain, kun työssäkäyntitilaston viiteajanjakso on vuoden viimeinen viikko.
Myös tilastojen käyttämät käsitteet poikkeavat hieman toisistaan. Esimerkiksi työssäkäyntitilastossa yrittäjistä luokitellaan johtajiksi ainoastaan ne, joiden yrityksen koko on yritysrekisterin mukaan vähintään 5 henkilötyövuotta, muuten yrittäjien ammatit määritellään yrityksen toimialan mukaan muihin ammattien pääryhmiin.
KEHA-keskus julkaisee tilastoa työttömien työnhakijoiden määrästä. KEHA-keskuksen työnhakijarekisterin tiedot kertovat työttömien työnhakijoiden määrän kuukauden viimeisenä arkipäivänä.
Työssäkäyntitilaston tieto työttömyydestä perustuu KEHA-keskuksen työnhakijarekisterin tietoihin. Siten työssäkäyntitilaston ja KEHA-keskuksen luvut työttömyydestä ovat suhteellisen lähellä toisiaan.
Yhtenäisyys kansantalouden tilinpidon kanssa (SIMS 15.3.2)
Vastaavia tietoja julkistetaan kansantalouden tilinpidossa, mutta käsitteet ja määritelmät poikkeavat toisistaan eri tilastoissa.
Sisäinen yhtenäisyys (SIMS 15.4)
Muiden työmarkkinatilastojen perusjoukot, käsitteet, määritelmät, luokitukset, viiteajankohdat ja menetelmät poikkeavat työssäkäyntitilastosta.
Julkistamiskalenteri (SIMS 8.1)
Tilastokeskus julkistaa uutta tilastotietoa arkipäivisin kello 8.00 verkkopalvelussaan. Tilastojen julkistamisajankohdat kerrotaan ennakkoon verkkopalvelusta löytyvässä julkistamiskalenterissa. Tiedot ovat julkisia sen jälkeen, kun ne ovat päivittyneet verkkopalveluun.
Lisätietoja tilastojen julkistamisperiaatteista Tilastokeskuksessa.
Pääsy julkistamiskalenteriin (SIMS 8.2)
Käyttäjien käyttöoikeudet (SIMS 8.3)
Tiedot julkistetaan kaikille käyttäjille samanaikaisesti. Tilaston tietoja saa Tilastokeskuksessa käsitellä ja niistä saa antaa tietoja ennen julkistamista vain henkilö, joka osallistuu kyseisen tilaston laadintaan tai tarvitsee kyseisen tilaston tietoja omassa työssään ennen tietojen julkistamista.
Lisätietoja: Tilastojen julkistamisperiaatteet Tilastokeskuksessa
Tilastokeskus on aineistojen tuottaja ja tekijänoikeuden haltija, ellei tuotteen, tiedon tai palvelun yhteydessä erikseen toisin ilmoiteta.
Lisätietoja: Tilastotietojen käyttöehdot
Julkaisutiheys (SIMS 9)
Työssäkäyntitilasto tehdään vuosittain.
Pääasiallinen toiminta ja ammattiasema valmistuvat noin 12 kuukautta, työpaikkatiedot 20 kuukautta ja ammatti ja sosioekonominen asema noin 22 kuukautta viiteajankohdan jälkeen.
Tilastojulkistus (SIMS 10.1)
Tiedote julkaistaan vuosittain tilaston sivulla.
Julkaisut (laajemmat/muut) (SIMS 10.2)
Tilastosta ei tehdä muita säännöllisiä julkistuksia.
Verkkotietokanta (SIMS 10.3)
Tilaston tietokantataulukot löytyvät StatFin-tietokannasta. Tilaston vanhemmat aikasarjat löytyvät arkistokannasta.
Yksikkötason aineistojen saatavuus (SIMS 10.4)
Tilastotarkoituksiin kerättävät tiedot ovat viranomaisten toiminnan julkisuudesta annetun lain (621/1999) 24 §:n mukaan salassapidettäviä. Vastausaineistoa käytetään ainoastaan tilastollisiin tarkoituksiin.
Tutkimusaineiston tiedot suojataan Tilastokeskuksen antamien tietosuojamääräysten mukaisesti, eikä tilastotaulukoista käy ilmi yksittäisen toimipaikan antamia vastauksia.
Tilastokeskus voi tilastolain (280/2004) 13 §:n mukaan luovuttaa erillisen käyttölupapäätöksen perusteella tietoja tieteellisiä tutkimuksia ja tilastollisia selvityksiä varten ilman suoran tunnistamisen mahdollistavia tietoja.
Tilastolaki kieltää tilastotarkoituksiin kerättyjen tietojen käytön tutkinnassa, valvonnassa, oikeuden-käynnissä, hallinnollisessa päätöksenteossa tai yritystä koskevan asian käsittelyssä.
Työssäkäyntitilaston tiedot ovat usein käytettyjä yhteiskunta- ja taloustieteellisessä tutkimuksessa.
Muu tiedonjakelu (SIMS 10.5)
Työssäkäyntitilaston tietoja jaetaan mikroaineistoluovutusten lisäksi toimeksiantoina ja tietopalveluina. Lisäksi tilaston tietoja löytyy tilastollisesta vuosikirjasta, tietoa teemoittain -sivuilta(tasa-arvo) ja Tieto&trendit -artikkeleista ja blogeista.
Menetelmädokumentointi (SIMS 10.6)
Pääasiallisen toiminnan päättelyn sekä ammatin ja sosioekonomisen tiedon tuottamisen menetelmäselosteet ovat saatavissa erillisinä tiedostoina työssäkäyntitilaston dokumentaatiosivulta.
Tietosuojaperiaatteet (SIMS 7.1)
Tilastotarkoituksiin kerätyn tiedon tietosuoja taataan. Tilastonlaadintaa ohjaa tilastolaki. Henkilötietojen käsittelyssä tilastolain ohella sovellettavaksi tulee EU:n yleinen tietosuoja-asetus ja suomalainen tietosuojalaki. Tilastotarkoituksiin kerättyjen tietojen salassapidosta säädetään julkisuuslaissa.
Tietoja käsittelevät vain ne henkilöt, jotka tietoja työssään tarvitsevat. Tietojen käyttö on rajattu käyttövaltuuksin. Kaikki Tilastokeskuksen henkilökuntaan kuuluvat ovat allekirjoittaneet salassapitositoumuksen, jossa he sitoutuvat pitämään salassa tilastolain tai viranomaisten toiminnan julkisuudesta annetun lain perusteella salassa pidettäväksi säädetyt tiedot. Lisätietoja tietosuojasta.
Tietosuoja ja -turva tietoja käsiteltäessä (SIMS 7.2)
Tilaston tietoja ei luovuteta tunnistettavassa muodossa Tilastokeskuksen ulkopuolelle. Aineiston käyttö tieteellistä tutkimusta ja tilastollisia selvityksiä varten on mahdollista ainoastaan erillisen käyttölupapäätöksen perusteella ja tunnistamattomassa muodossa. Lisätietoja käyttöluvista.
Tiedot iästä, sukupuolesta, ammatista, sosioekonomisesta asemasta ja koulutuksesta voidaan kuitenkin luovuttaa edellä mainittuihin tarkoituksiin myös tunnistetietoineen.
Suojattavat tiedot
Taulukkomuotoisella aineistolla tarkoitetaan aineistoa, jossa yksikkötasoista aineistoa on aggregoitu ja tiedot on järjestetty taulukkomuotoon. Tilaston tietopalvelussa tilastoyksikkönä voi olla henkilö, perhe, kotitalous, asunto, asuntokunta tai rakennus. Näiden tietojen lisäksi voidaan julkistaa tietoja yrityksistä tai toimipaikoista.
Taulukkoaineisto voi olla käyttökohteen mukaan joko
- frekvenssitaulukko, joissa soluarvot ovat soluun kuuluvien tilastoyksiköiden (esim. työllisten) lukumääriä tai
- määrätaulukko, joissa soluarvot ovat jonkin taulukoitavan muuttujan (esim. tulotietojen) summia, keskiarvoja tai muita vastaavia tunnuslukuja tai
- edellisten yhdistelmä, jossa on näkyvissä sekä solufrekvenssit että määrätietoja.
Taulukkoaineistoon kohdistuu tietosuojariski aina silloin, kun jokin taulukossa esiintyvä yksikkö on vaarassa paljastua. Riskiä määriteltäessä huomioidaan muun muassa seuraavat asiat: taulukon arkaluonteiset muuttujat tai erityisryhmät (ulkomaalaiset, korkeatuloiset), muuttujien ja luokituksen luokkien määrä, solu- ja luokkafrekvenssit (kynnysarvosääntö) sekä tilastointialueen koko ja sijaintitarkkuus.
Erityistä huomiota kiinnitetään henkilötietolaissa määriteltyihin arkaluonteisiin tietoihin, jotka koskevat henkilön
- rotua tai etnistä alkuperää,
- yhteiskunnallista, poliittista tai uskonnollista vakaumusta tai ammattiliittoon kuulumista,
- rikollista tekoa, rangaistusta tai muuta rikoksen seuraamusta,
- terveydentilaa, sairautta tai vammaisuutta taikka henkilöön kohdistettuja hoitotoimenpiteitä tai niihin verrattavia toimia,
- seksuaalista suuntautumista tai käyttäytymistä tai
- sosiaalihuollon tarvetta tai hänen saamiaan sosiaalihuollon palveluita, tukitoimia ja muita sosiaalihuollon etuuksia
sekä muihin arkaluonteisiin tietoihin, kuten
- kuolinsyy,
- kieli, kansalaisuus, syntyperä tai synnyinmaa,
- tulot, velat ja varallisuus sekä
- pääasiallinen toiminta, ammattiasema, harvinainen ammatti tai muu sosioekonomista asemaa kuvaava muuttuja.
Silloin, kun taulukossa on kolme tai useampia muuttujia ja joista vähintään yksi muuttuja on arkaluonteinen tai aluetaso on maakuntaa pienempi (esim. kunta tai osa-alue), on paljastumisriski todennäköinen ja suojaamiseen kiinnitetään enemmän huomiota.
Periaatteena on, että työpaikkaan tai asuinkuntaan (esim. työlliset toimialoittain tai pendelöintitiedot kunnittain) pelkästään liittyviä tietoja ei tarvitse suojata tietosuojariskin vuoksi. Suojaamista ei myöskään tehdä silloin, kun julkaistaan pelkkiä lukumäärätietoja, eikä esimerkiksi yksittäisistä henkilöistä paljastu mitään erikoista.
Tietojen suojaamiseen kiinnitetään enemmän huomiota aina silloin, kun tilastointiyksiköstä voi paljastua taulukon kautta lisää tietoa (esim. yllä luetellut arkaluonteiset tiedot, tulot jne.) tai silloin, kun aluetietona on maakuntaa tarkempi aluejako, joka edesauttaa välillisen tunnistamisen mahdollisuutta.
Jos paljastumisriski on olemassa, täytyy taulukossa olevat tiedot suojata riittävästi. Paljastumisriskin määrittelyssä käytetään vastuualueen tilastoissa solukohtaista kynnysarvoa 3. Dominanssisääntöä ei tilastossa käytetä. Suojausmenetelmät Taulukoiden suojausmenetelmänä käytetään lähes aina peittämistä tai luokituksen/taulukon rakenteen muuttamista:
- Peittämisessä huomioidaan ensisijainen, paljastumisriskissä olevien solujen peittäminen sekä toissijainen peittäminen. Toissijaisella peittämisellä varmistetaan, ettei taulukon rivi- tai saraketotaalien avulla pystytä laskemaan peitettyjen solujen arvoja. Toissijainen peittäminen voidaan hoitaa siten, että pienimmän solufrekvenssin lisäksi myös toiseksi pienin solufrekvenssi peitetään (SAS-koodiin pohjautuva suojaus) tai siten, että minimoidaan peitettävien solujen määrä (Tau-Argus). Solun arvo korvataan peittämisessä symbolilla ”..”.
- Peittäminen voidaan tehdä tarvittaessa myös rivikohtaisesti. Tällä tarkoitetaan sitä, että jos taulukon johonkin rivitotaaliin kuuluu vain pieni määrä tilastoyksiköitä (vähemmän kuin käytetty kynnysarvo 3), peitetään kyseinen rivi kokonaisuudessaan. Rivin solujen arvot korvataan peittämisessä symbolilla ”..”.
- Jos taulukossa on paljon suojattavia soluja tai suojattavat solut ovat keskittyneet ainoastaan muutamaan luokkaan, suojaaminen voidaan tehdä myös taulukon rakennetta muuttamalla. Taulukon rakennetta voidaan muuttaa esimerkiksi vähentämällä muuttujien määrää tai muuttamalla muuttujien luokituksia. Taulukon muuttujien määrän tulee olla sitä vähäisempi mitä pienempien alueiden tilastoista on kyse. Pienaluetilastoissa tulee myös välttää usean muuttujan ristiintaulukointeja.
- Luokitusta muuttamalla taulukosta pyritään hävittämään paljastumisriskissä olevat solut yhdistämällä niitä sisältävät luokat muihin taulukon luokkiin tai muodostamalla uusi luokka (esim. muut). Luokituksen muuttaminen tarkoittaa usein luokituksen karkeistamista.
Taulukkoaineiston sisältämien yksiköiden paljastumisriski arvioidaan aina taulukoita suunniteltaessa ja ennen tietojen julkaisemista. Tietosuojatoimenpiteet pyritään tekemään niin, että paljastumisriski on pieni, mutta suojauksen myötä aineistosta ei menetetä tarpeettomasti tietoa.