Tiedon laatukehikossa käytetyt käsitteet

Tällä sivulla käydään läpi käsitteet ja termit, joiden ymmärtämistä tiedon laatukehikon käyttöönotto vaatii. Mittaristoihin liittyvät käsitteet on jaoteltu niihin liittyvien mittaristokysymysten perusteella.

Termien kuvaukset

Yleiset termit

Kohdeyksikkö (luokka, tilastoyksikkö, yksikkö, kohde)
⁠Tietoaineistossa tarkasteltava yksikkö.

Koodisto
Kokoelma ryhmiä, jotka eroavat toisistaan tietyiltä piirteiltään.

Laatukriteeri
Tekijä, joka kuvaa laatukuvauksen laatua tietystä näkökulmasta.

Mittari
Laatukriteerin näkökulmaa konkretisoiva ja tietoaineiston ominaisuutta mittaava mittari. Kukin mittari viittaa tiettyyn laatukriteeriin. Yhdelle laatukriteerille voidaan soveltaa useita mittareita.

Mittarisammio
Mittariaihioiden, mittariehdotusten muodostama kokonaisuus, josta hankkeen aikana poimittiin sopivin kokonaisuus laatukriteerien mittaristoksi. Jatkossa mittarisammio toimii paitsi mittariehdotuksien myös mittaristoa täydentävien mittareiden kokoelmana.

Mittaristo
Tiedon laatukriteerien soveltamiseen tuotettu erillisten mittarien muodostama mittarikokoelma.

Ominaisuus (attribuutti, kohde, muuttuja)
⁠Kohdeyksikköä kuvaava tieto.

Perustietovaranto
Perustietovaranto on alemman jalostusasteen tietovaranto tai jalostetun tiedon taustalla oleva tietovaranto.

Rakenteinen data
Koneluettava tieto, johon on liitetty metatietojen avulla määritetty rakenne, jonka avulla tietoa voidaan jäsentää.

Skeema
Tietoaineiston rakenteen määrämuotoinen esitys.

Standardiluokitus (luokitusstandardi)
⁠Luokitussuositus, joka perustuu esimerkiksi EU-direktiiveillä vahvistettuihin kansainvälisiin standardeihin.

Tiedon käyttäjä
Tietoa käyttävä henkilö. Tiedon käsittelyprosessin näkökulmasta prosessin viimeinen, tietoa todella käyttävä henkilö. Tiedon käyttäjä voi myös edelleen jatkojalostaa tietoa, mutta tämä on uusi käsittelyprosessi verrattuna tiedon laadun kuvaukseen.

Tiedon laatu
Se, missä määrin jonkin tietoaineiston ominaisuudet täyttävät vaatimuksia tai tavoitteita. Tiedon soveltuvuus siihen käyttötarkoitukseen, johon käyttäjä aikoo sitä käyttää ja tiedon tuottaja sitä tarjoaa.

Tieto
Tiedolla voi viitata monenlaisiin asioihin: merkkijono, viesti, tosiasia, havainto, tulkinta tai käsitys. Tässä tiedolla tarkoitetaan ilmiöistä koottua alimman jalostusasteen tietoa tai siitä jalostamalla tuotettua informaatiota.

Tietoaineisto
Aineisto, joka sisältää tietovälineelle tallennettuja tietoja.

Tietovaranto
Tiettyä tarkoitusta varten muodostettu, loogisesti tai fyysisesti yhteenkuuluvien tietojen muodostama tietoaineisto tai tietoaineistojen kokoelma.

Tunniste
Yksilöimiseen käytettävä merkkijono.

Tilastolliset termit

Alipeitto, tilastomenetelmäkäsite
Alipeitto liittyy tutkimuksessa käytettyyn perusjoukkoon. Perusjoukosta täytyy olla käytettävissä kehikko eli luettelo kohteista, joita koskevia tietoja halutaan otantatutkimuksella kerätä. Alipeitolla tarkoitetaan sitä, että käytettävissä olevasta kehikosta puuttuu osa perusjoukon eli tutkimuksen kohdejoukon alkioista. Esim. henkilöt, joilla ei ole puhelinta, puuttuvat puhelinhaastattelun kehikosta.

Imputointi (paikkaus), tilastomenetelmä
⁠Imputointi tarkoittaa havaintoaineistossa olevan puutteen tai poikkeavan havainnon korvaamista jollain imputointimenetelmällä.

Imputointimenetelmiä ovat mm.:

  • looginen imputointi, jossa korjataan loogisesti mahdottomat virheet
    • esim. lapsi ei voi olla vanhempi kuin vanhempansa
  • hot deck -imputointi, jossa puutteelle haetaan arvo toiselta vastaajalta
  • cold deck -imputointi, jossa havainto haetaan saman vastaajan edellisestä vastauksesta
  • regressio- ja muut malliperusteiset menetelmät, jossa käytetään tilastollista mallia ennustamaan arvo puutteelle.

Perusjoukko (populaatio), tilastomenetelmäkäsite
⁠Perusjoukko on tutkimuksen kohteena oleva ryhmä, jota koskevia tietoja halutaan kerätä, esim. äänestysikäiset kansalaiset. Siitä käytetään myös tarkempaa nimitystä kohdeperusjoukko.

Siitä erillään on kehikkoperusjoukko, jolla tarkoitetaan tutkimuksen käytössä olevan rekisterin tai muun luettelon peittämää kohdejoukkoa, joka ei kuitenkaan aina vastaa yksi yhteen kohdeperusjoukkoa (ks. ylipeitto, alipeitto).

Poikkeava havainto (outlier), tilastomenetelmäkäsite
⁠Poikkeava havainto (outlier) on sellainen muuttujan arvo, joka poikkeaa suuresti havaittujen arvojen valtaenemmistöstä ja se voi olla joko oikea tai virheellinen. Poikkeavilla arvoilla voi olla merkittävästi vääristävä vaikutus käytettyihin tilastollisiin tunnuslukuihin, kuten keskiarvoon, hajontaan, regressiosuoraan.

Ylipeitto, tilastomenetelmäkäsite
⁠Ylipeitto tarkoittaa otoskehikkoon sisältyviä kohdeyksiköitä, jotka eivät enää kuulu kohdeperusjoukkoon, esim. laitoksiin siirtyneitä, kuolleita, maasta muuttaneita. Tällaisia tapauksia esiintyy aina jonkin verran otosyksiköiden joukossa, koska rekisterit, joista otokset poimitaan, eivät ole täysin ajantasaisia.

Mittaristoon liittyvät termit

Mittaristoihin liittyvät käsitteet on jaoteltu niihin liittyvien mittaristokysymysten perusteella.

Miten tieto kuvaa todellisuutta?

Menetelmällisesti tuotetut arvot
⁠Menetelmällisesti tai korvaavaa tietoa käyttäen tuotettujen arvojen osuus ominaisuuden kaikista arvoista.

Virheelliset ominaisuusarvot
⁠Virheellisiä ominaisuusarvoja saavien kohdeyksiköiden osuus kaikista kohdeyksiköistä.

Väärinluokittelu
⁠Virheellisesti luokiteltuja ominaisuuden arvoja saavien kohdeyksiköiden osuus kaikista kohdeyksiköistä.

Keskihajonta
⁠Ominaisuuksien arvojen vaihtelu keskiarvon ympärillä.

Poikkeavat havainnot
⁠Poikkeavien havaintojen lukumäärän suhde kaikkien kohdeyksiköiden lukumäärään.

Tietoloogisuus tarkastettu
⁠Tiedon keräämisessä, koostamisessa tai käsittelyssä on käytetty loogisuusehtoja.

Viiteajankohta
⁠Ajankohta, jota tietoaineisto kuvaa.

Luontiajankohta
⁠Kohdeyksikön tai ominaisuuden luontiajankohta.

Tarkistusajankohta
⁠Kohdeyksikön tai ominaisuuden tarkistusajankohta.

Muutosajankohta
⁠Kohdeyksikön tai ominaisuuden muutosajankohta.

Ajallinen tavoitekattavuus
⁠Tietoaineiston tavoiteltava ajallinen kattavuus ja tiheys on kuvattu.

Alueellinen tavoitekattavuus
⁠Tietoaineiston tavoiteltava alueellinen kattavuus ja tiheys on kuvattu.

Tavoitekohdeyksiköt
⁠Tietoaineiston aineistokuvauksessa on selkeästi määritelty ajallisen ja alueellisen tavoitekattavuuden lisäksi muut tietoaineiston rajaukset.

Tavoiteominaisuuksissa puutteita
⁠Tietoaineiston ilmiön kannalta keskeisiä ominaisuuksia puuttuu arvioitavasta tietoaineistosta.

Puuttuvat kohdeyksiköt
⁠Tietoaineiston alipeitto eli tietoaineiston tavoitekohdejoukosta puuttuvien kohdeyksiköiden prosentuaalinen osuus.

Ylimääräiset kohdeyksiköt
⁠Tietoaineiston ylipeitto eli tietoaineistossa mukana olevien, mutta tietoaineiston tavoiteperusjoukkoon kuulumattomien kohdeyksiköiden prosentuaalinen osuus.

Puutteelliset kohdeyksiköt
⁠Yhdenkin puuttuvan ominaisuustiedon sisältävien kohdeyksiköiden osuus tietoaineiston kaikista kohdeyksiköistä.

Puutteelliset ominaisuustiedot
⁠Puuttuvan ominaisuustiedon omaavien kohdeyksiköiden osuus kaikista kohdeyksiköistä ominaisuuksittain tarkasteltuna.

Miten tieto on kuvattu?

Tietolähde
⁠Tietoaineiston, kohdeyksikön tai ominaisuuden lähdetieto on saatavilla.

Tiedon elinkaari
⁠Tietoaineiston elinkaari on määritelty ja kuvaus siitä on saatavilla.

Muutosten hallinta
⁠Ominaisuustiedoissa tapahtuvia rakenteellisia tai lähdetietojen muutoksia seurataan.

Aineistokuvaus
⁠Mitä kieliversioita tietoaineiston aineistokuvauksesta on saatavilla?

Käsitteiden määritelmät
⁠Kieliversiot, joilla keskeisten käsitteiden määritelmät ovat saatavilla.

Ominaisuuksien tietokuvaukset
⁠Kieliversiot, joilla keskeisten käsitteiden määritelmät ovat saatavilla.

Ymmärrettävyyden asiakaspalaute
⁠Ymmärrettävyydestä on mahdollista antaa asiakaspalautetta, saatua palautetta seurataan ja siihen reagoidaan.

Noudatettavat säädökset ja standardit
⁠Tietoaineiston noudattamat säädökset, standardit, hyvät käytänteet ja suositukset ovat listattuna tietoaineiston kuvauksissa.

Miten tietoa voi käyttää?

Tietoaineiston tietomalli
⁠Tietoaineisto on rakenteisesti kuvattu.

Kohdeyksikön pysyvä tunniste
⁠Tietoaineiston kohdeyksiköillä on vähintään tietoaineistokohtainen pysyvä tunniste.

Koneluettavuuden asiakaspalaute
⁠Koneluettavuudesta on mahdollista antaa asiakaspalautetta, saatua palautetta seurataan ja siihen reagoidaan.

Käyttöoikeus
⁠Kuvataan tietoaineiston käyttöoikeuden rajaukset: esim. käsittelijä, käsittely-ympäristö.

Käytön rajoitukset
⁠Kuvataan tietoaineiston käyttötarkoitusten rajoitukset: esim. avoimen datan lisenssit tai käyttöehtoja.

Määräpäivien noudattaminen
⁠Tietoaineiston toimitusaikataulun seuranta toteutuneeseen toimitusaikatauluun verrattuna.

Päivitystiheys
⁠Tietoaineiston säännöllinen päivitystiheys.

Päivityksessä muuttuneet ominaisuustiedot
⁠Päivityksessä muuttuneiden ominaisuusarvojen osuus kaikista tietoaineiston ominaisuusarvoista.

Miksi tätä sisältöä ei näytetä?

Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.