Tiedon laatukehikossa käytetyt käsitteet

Tällä sivulla käydään läpi käsitteet ja termit, joiden ymmärtämistä tiedon laatukehikon käyttöönotto vaatii. Mittaristoihin liittyvät käsitteet on jaoteltu niihin liittyvien mittaristokysymysten perusteella.

Termien kuvaukset

Yleiset termit

Kohdeyksikkö (luokka, tilastoyksikkö, yksikkö, kohde)

Tietoaineistossa tarkasteltava yksikkö.

Koodisto

Kokoelma ryhmiä, jotka eroavat toisistaan tietyiltä piirteiltään.

Laatukriteeri

Tekijä, joka kuvaa laatukuvauksen laatua tietystä näkökulmasta.

Mittari

Laatukriteerin näkökulmaa konkretisoiva ja tietoaineiston ominaisuutta mittaava mittari. Kukin mittari viittaa tiettyyn laatukriteeriin. Yhdelle laatukriteerille voidaan soveltaa useita mittareita.

Mittarisammio

Mittariaihioiden, mittariehdotusten muodostama kokonaisuus, josta hankkeen aikana poimittiin sopivin kokonaisuus laatukriteerien mittaristoksi. Jatkossa mittarisammio toimii paitsi mittariehdotuksien myös mittaristoa täydentävien mittareiden kokoelmana.

Mittaristo

Tiedon laatukriteerien soveltamiseen tuotettu erillisten mittarien muodostama mittarikokoelma.

Ominaisuus (attribuutti, kohde, muuttuja)

Kohdeyksikköä kuvaava tieto.

Perustietovaranto

Perustietovaranto on alemman jalostusasteen tietovaranto tai jalostetun tiedon taustalla oleva tietovaranto.

Rakenteinen data

Koneluettava tieto, johon on liitetty metatietojen avulla määritetty rakenne, jonka avulla tietoa voidaan jäsentää.

Skeema

Tietoaineiston rakenteen määrämuotoinen esitys.

Standardiluokitus (luokitusstandardi)

Luokitussuositus, joka perustuu esimerkiksi EU-direktiiveillä vahvistettuihin kansainvälisiin standardeihin.

Tiedon käyttäjä

Tietoa käyttävä henkilö. Tiedon käsittelyprosessin näkökulmasta prosessin viimeinen, tietoa todella käyttävä henkilö. Tiedon käyttäjä voi myös edelleen jatkojalostaa tietoa, mutta tämä on uusi käsittelyprosessi verrattuna tiedon laadun kuvaukseen.

Tiedon laatu

Se, missä määrin jonkin tietoaineiston ominaisuudet täyttävät vaatimuksia tai tavoitteita. Tiedon soveltuvuus siihen käyttötarkoitukseen, johon käyttäjä aikoo sitä käyttää ja tiedon tuottaja sitä tarjoaa.

Tieto

Tiedolla voi viitata monenlaisiin asioihin: merkkijono, viesti, tosiasia, havainto, tulkinta tai käsitys. Tässä tiedolla tarkoitetaan ilmiöistä koottua alimman jalostusasteen tietoa tai siitä jalostamalla tuotettua informaatiota.

Tietoaineisto

Aineisto, joka sisältää tietovälineelle tallennettuja tietoja.

Tietovaranto

Tiettyä tarkoitusta varten muodostettu, loogisesti tai fyysisesti yhteenkuuluvien tietojen muodostama tietoaineisto tai tietoaineistojen kokoelma.

Tunniste

Yksilöimiseen käytettävä merkkijono.

Tilastolliset termit

Alipeitto, tilastomenetelmäkäsite

Alipeitto liittyy tutkimuksessa käytettyyn perusjoukkoon. Perusjoukosta täytyy olla käytettävissä kehikko eli luettelo kohteista, joita koskevia tietoja halutaan otantatutkimuksella kerätä. Alipeitolla tarkoitetaan sitä, että käytettävissä olevasta kehikosta puuttuu osa perusjoukon eli tutkimuksen kohdejoukon alkioista. Esim. henkilöt, joilla ei ole puhelinta, puuttuvat puhelinhaastattelun kehikosta.

Imputointi (paikkaus), tilastomenetelmä

Imputointi tarkoittaa havaintoaineistossa olevan puutteen tai poikkeavan havainnon korvaamista jollain imputointimenetelmällä.

Imputointimenetelmiä ovat mm.:

  • looginen imputointi, jossa korjataan loogisesti mahdottomat virheet
    • esim. lapsi ei voi olla vanhempi kuin vanhempansa
  • hot deck -imputointi, jossa puutteelle haetaan arvo toiselta vastaajalta
  • cold deck -imputointi, jossa havainto haetaan saman vastaajan edellisestä vastauksesta
  • regressio- ja muut malliperusteiset menetelmät, jossa käytetään tilastollista mallia ennustamaan arvo puutteelle.

Perusjoukko (populaatio), tilastomenetelmäkäsite

Perusjoukko on tutkimuksen kohteena oleva ryhmä, jota koskevia tietoja halutaan kerätä, esim. äänestysikäiset kansalaiset. Siitä käytetään myös tarkempaa nimitystä kohdeperusjoukko.

Siitä erillään on kehikkoperusjoukko, jolla tarkoitetaan tutkimuksen käytössä olevan rekisterin tai muun luettelon peittämää kohdejoukkoa, joka ei kuitenkaan aina vastaa yksi yhteen kohdeperusjoukkoa (ks. ylipeitto, alipeitto).

Poikkeava havainto (outlier), tilastomenetelmäkäsite

Poikkeava havainto (outlier) on sellainen muuttujan arvo, joka poikkeaa suuresti havaittujen arvojen valtaenemmistöstä ja se voi olla joko oikea tai virheellinen. Poikkeavilla arvoilla voi olla merkittävästi vääristävä vaikutus käytettyihin tilastollisiin tunnuslukuihin, kuten keskiarvoon, hajontaan, regressiosuoraan.

Ylipeitto, tilastomenetelmäkäsite

Ylipeitto tarkoittaa otoskehikkoon sisältyviä kohdeyksiköitä, jotka eivät enää kuulu kohdeperusjoukkoon, esim. laitoksiin siirtyneitä, kuolleita, maasta muuttaneita. Tällaisia tapauksia esiintyy aina jonkin verran otosyksiköiden joukossa, koska rekisterit, joista otokset poimitaan, eivät ole täysin ajantasaisia.

Mittaristoon liittyvät termit

Mittaristoihin liittyvät käsitteet on jaoteltu niihin liittyvien mittaristokysymysten perusteella.

Miten tieto kuvaa todellisuutta?

Menetelmällisesti tuotetut arvot

Menetelmällisesti tai korvaavaa tietoa käyttäen tuotettujen arvojen osuus ominaisuuden kaikista arvoista.

Virheelliset ominaisuusarvot

Virheellisiä ominaisuusarvoja saavien kohdeyksiköiden osuus kaikista kohdeyksiköistä.

Väärinluokittelu

Virheellisesti luokiteltuja ominaisuuden arvoja saavien kohdeyksiköiden osuus kaikista kohdeyksiköistä.

Keskihajonta

Ominaisuuksien arvojen vaihtelu keskiarvon ympärillä.

Poikkeavat havainnot

Poikkeavien havaintojen lukumäärän suhde kaikkien kohdeyksiköiden lukumäärään.

Tietoloogisuus tarkastettu

Tiedon keräämisessä, koostamisessa tai käsittelyssä on käytetty loogisuusehtoja.

Viiteajankohta

Ajankohta, jota tietoaineisto kuvaa.

Luontiajankohta

Kohdeyksikön tai ominaisuuden luontiajankohta.

Tarkistusajankohta

Kohdeyksikön tai ominaisuuden tarkistusajankohta.

Muutosajankohta

Kohdeyksikön tai ominaisuuden muutosajankohta.

Ajallinen tavoitekattavuus

Tietoaineiston tavoiteltava ajallinen kattavuus ja tiheys on kuvattu.

Alueellinen tavoitekattavuus

Tietoaineiston tavoiteltava alueellinen kattavuus ja tiheys on kuvattu.

Tavoitekohdeyksiköt

Tietoaineiston aineistokuvauksessa on selkeästi määritelty ajallisen ja alueellisen tavoitekattavuuden lisäksi muut tietoaineiston rajaukset.

Tavoiteominaisuuksissa puutteita

Tietoaineiston ilmiön kannalta keskeisiä ominaisuuksia puuttuu arvioitavasta tietoaineistosta.

Puuttuvat kohdeyksiköt

Tietoaineiston alipeitto eli tietoaineiston tavoitekohdejoukosta puuttuvien kohdeyksiköiden prosentuaalinen osuus.

Ylimääräiset kohdeyksiköt

Tietoaineiston ylipeitto eli tietoaineistossa mukana olevien, mutta tietoaineiston tavoiteperusjoukkoon kuulumattomien kohdeyksiköiden prosentuaalinen osuus.

Puutteelliset kohdeyksiköt

Yhdenkin puuttuvan ominaisuustiedon sisältävien kohdeyksiköiden osuus tietoaineiston kaikista kohdeyksiköistä.

Puutteelliset ominaisuustiedot

Puuttuvan ominaisuustiedon omaavien kohdeyksiköiden osuus kaikista kohdeyksiköistä ominaisuuksittain tarkasteltuna.

Miten tieto on kuvattu?

Tietolähde

Tietoaineiston, kohdeyksikön tai ominaisuuden lähdetieto on saatavilla.

Tiedon elinkaari

Tietoaineiston elinkaari on määritelty ja kuvaus siitä on saatavilla.

Muutosten hallinta

Ominaisuustiedoissa tapahtuvia rakenteellisia tai lähdetietojen muutoksia seurataan.

Aineistokuvaus

Mitä kieliversioita tietoaineiston aineistokuvauksesta on saatavilla?

Käsitteiden määritelmät

Kieliversiot, joilla keskeisten käsitteiden määritelmät ovat saatavilla.

Ominaisuuksien tietokuvaukset

Kieliversiot, joilla keskeisten käsitteiden määritelmät ovat saatavilla.

Ymmärrettävyyden asiakaspalaute

Ymmärrettävyydestä on mahdollista antaa asiakaspalautetta, saatua palautetta seurataan ja siihen reagoidaan.

Noudatettavat säädökset ja standardit

Tietoaineiston noudattamat säädökset, standardit, hyvät käytänteet ja suositukset ovat listattuna tietoaineiston kuvauksissa.

Miten tietoa voi käyttää?

Tietoaineiston tietomalli

Tietoaineisto on rakenteisesti kuvattu.

Kohdeyksikön pysyvä tunniste

Tietoaineiston kohdeyksiköillä on vähintään tietoaineistokohtainen pysyvä tunniste.

Koneluettavuuden asiakaspalaute

Koneluettavuudesta on mahdollista antaa asiakaspalautetta, saatua palautetta seurataan ja siihen reagoidaan.

Käyttöoikeus

Kuvataan tietoaineiston käyttöoikeuden rajaukset: esim. käsittelijä, käsittely-ympäristö.

Käytön rajoitukset

Kuvataan tietoaineiston käyttötarkoitusten rajoitukset: esim. avoimen datan lisenssit tai käyttöehtoja.

Määräpäivien noudattaminen

Tietoaineiston toimitusaikataulun seuranta toteutuneeseen toimitusaikatauluun verrattuna.

Päivitystiheys

Tietoaineiston säännöllinen päivitystiheys.

Päivityksessä muuttuneet ominaisuustiedot

Päivityksessä muuttuneiden ominaisuusarvojen osuus kaikista tietoaineiston ominaisuusarvoista.