Tiedon laatukehikossa käytetyt käsitteet
Tällä sivulla käydään läpi käsitteet ja termit, joiden ymmärtämistä tiedon laatukehikon käyttöönotto vaatii. Mittaristoihin liittyvät käsitteet on jaoteltu niihin liittyvien mittaristokysymysten perusteella.
Tällä sivulla:
Termien kuvaukset
Yleiset termit
Kohdeyksikkö (luokka, tilastoyksikkö, yksikkö, kohde)
Tietoaineistossa tarkasteltava yksikkö.
Koodisto
Kokoelma ryhmiä, jotka eroavat toisistaan tietyiltä piirteiltään.
Laatukriteeri
Tekijä, joka kuvaa laatukuvauksen laatua tietystä näkökulmasta.
Mittari
Laatukriteerin näkökulmaa konkretisoiva ja tietoaineiston ominaisuutta mittaava mittari. Kukin mittari viittaa tiettyyn laatukriteeriin. Yhdelle laatukriteerille voidaan soveltaa useita mittareita.
Mittarisammio
Mittariaihioiden, mittariehdotusten muodostama kokonaisuus, josta hankkeen aikana poimittiin sopivin kokonaisuus laatukriteerien mittaristoksi. Jatkossa mittarisammio toimii paitsi mittariehdotuksien myös mittaristoa täydentävien mittareiden kokoelmana.
Mittaristo
Tiedon laatukriteerien soveltamiseen tuotettu erillisten mittarien muodostama mittarikokoelma.
Ominaisuus (attribuutti, kohde, muuttuja)
Kohdeyksikköä kuvaava tieto.
Perustietovaranto
Perustietovaranto on alemman jalostusasteen tietovaranto tai jalostetun tiedon taustalla oleva tietovaranto.
Rakenteinen data
Koneluettava tieto, johon on liitetty metatietojen avulla määritetty rakenne, jonka avulla tietoa voidaan jäsentää.
Skeema
Tietoaineiston rakenteen määrämuotoinen esitys.
Standardiluokitus (luokitusstandardi)
Luokitussuositus, joka perustuu esimerkiksi EU-direktiiveillä vahvistettuihin kansainvälisiin standardeihin.
Tiedon käyttäjä
Tietoa käyttävä henkilö. Tiedon käsittelyprosessin näkökulmasta prosessin viimeinen, tietoa todella käyttävä henkilö. Tiedon käyttäjä voi myös edelleen jatkojalostaa tietoa, mutta tämä on uusi käsittelyprosessi verrattuna tiedon laadun kuvaukseen.
Tiedon laatu
Se, missä määrin jonkin tietoaineiston ominaisuudet täyttävät vaatimuksia tai tavoitteita. Tiedon soveltuvuus siihen käyttötarkoitukseen, johon käyttäjä aikoo sitä käyttää ja tiedon tuottaja sitä tarjoaa.
Tieto
Tiedolla voi viitata monenlaisiin asioihin: merkkijono, viesti, tosiasia, havainto, tulkinta tai käsitys. Tässä tiedolla tarkoitetaan ilmiöistä koottua alimman jalostusasteen tietoa tai siitä jalostamalla tuotettua informaatiota.
Tietoaineisto
Aineisto, joka sisältää tietovälineelle tallennettuja tietoja.
Tietovaranto
Tiettyä tarkoitusta varten muodostettu, loogisesti tai fyysisesti yhteenkuuluvien tietojen muodostama tietoaineisto tai tietoaineistojen kokoelma.
Tunniste
Yksilöimiseen käytettävä merkkijono.
Tilastolliset termit
Alipeitto, tilastomenetelmäkäsite
Alipeitto liittyy tutkimuksessa käytettyyn perusjoukkoon. Perusjoukosta täytyy olla käytettävissä kehikko eli luettelo kohteista, joita koskevia tietoja halutaan otantatutkimuksella kerätä. Alipeitolla tarkoitetaan sitä, että käytettävissä olevasta kehikosta puuttuu osa perusjoukon eli tutkimuksen kohdejoukon alkioista. Esim. henkilöt, joilla ei ole puhelinta, puuttuvat puhelinhaastattelun kehikosta.
Imputointi (paikkaus), tilastomenetelmä
Imputointi tarkoittaa havaintoaineistossa olevan puutteen tai poikkeavan havainnon korvaamista jollain imputointimenetelmällä.
Imputointimenetelmiä ovat mm.:
- looginen imputointi, jossa korjataan loogisesti mahdottomat virheet
- esim. lapsi ei voi olla vanhempi kuin vanhempansa
- hot deck -imputointi, jossa puutteelle haetaan arvo toiselta vastaajalta
- cold deck -imputointi, jossa havainto haetaan saman vastaajan edellisestä vastauksesta
- regressio- ja muut malliperusteiset menetelmät, jossa käytetään tilastollista mallia ennustamaan arvo puutteelle.
Perusjoukko (populaatio), tilastomenetelmäkäsite
Perusjoukko on tutkimuksen kohteena oleva ryhmä, jota koskevia tietoja halutaan kerätä, esim. äänestysikäiset kansalaiset. Siitä käytetään myös tarkempaa nimitystä kohdeperusjoukko.
Siitä erillään on kehikkoperusjoukko, jolla tarkoitetaan tutkimuksen käytössä olevan rekisterin tai muun luettelon peittämää kohdejoukkoa, joka ei kuitenkaan aina vastaa yksi yhteen kohdeperusjoukkoa (ks. ylipeitto, alipeitto).
Poikkeava havainto (outlier), tilastomenetelmäkäsite
Poikkeava havainto (outlier) on sellainen muuttujan arvo, joka poikkeaa suuresti havaittujen arvojen valtaenemmistöstä ja se voi olla joko oikea tai virheellinen. Poikkeavilla arvoilla voi olla merkittävästi vääristävä vaikutus käytettyihin tilastollisiin tunnuslukuihin, kuten keskiarvoon, hajontaan, regressiosuoraan.
Ylipeitto, tilastomenetelmäkäsite
Ylipeitto tarkoittaa otoskehikkoon sisältyviä kohdeyksiköitä, jotka eivät enää kuulu kohdeperusjoukkoon, esim. laitoksiin siirtyneitä, kuolleita, maasta muuttaneita. Tällaisia tapauksia esiintyy aina jonkin verran otosyksiköiden joukossa, koska rekisterit, joista otokset poimitaan, eivät ole täysin ajantasaisia.
Mittaristoon liittyvät termit
Mittaristoihin liittyvät käsitteet on jaoteltu niihin liittyvien mittaristokysymysten perusteella.
Miten tieto kuvaa todellisuutta?
Menetelmällisesti tuotetut arvot
Menetelmällisesti tai korvaavaa tietoa käyttäen tuotettujen arvojen osuus ominaisuuden kaikista arvoista.
Virheelliset ominaisuusarvot
Virheellisiä ominaisuusarvoja saavien kohdeyksiköiden osuus kaikista kohdeyksiköistä.
Väärinluokittelu
Virheellisesti luokiteltuja ominaisuuden arvoja saavien kohdeyksiköiden osuus kaikista kohdeyksiköistä.
Keskihajonta
Ominaisuuksien arvojen vaihtelu keskiarvon ympärillä.
Poikkeavat havainnot
Poikkeavien havaintojen lukumäärän suhde kaikkien kohdeyksiköiden lukumäärään.
Tietoloogisuus tarkastettu
Tiedon keräämisessä, koostamisessa tai käsittelyssä on käytetty loogisuusehtoja.
Viiteajankohta
Ajankohta, jota tietoaineisto kuvaa.
Luontiajankohta
Kohdeyksikön tai ominaisuuden luontiajankohta.
Tarkistusajankohta
Kohdeyksikön tai ominaisuuden tarkistusajankohta.
Muutosajankohta
Kohdeyksikön tai ominaisuuden muutosajankohta.
Ajallinen tavoitekattavuus
Tietoaineiston tavoiteltava ajallinen kattavuus ja tiheys on kuvattu.
Alueellinen tavoitekattavuus
Tietoaineiston tavoiteltava alueellinen kattavuus ja tiheys on kuvattu.
Tavoitekohdeyksiköt
Tietoaineiston aineistokuvauksessa on selkeästi määritelty ajallisen ja alueellisen tavoitekattavuuden lisäksi muut tietoaineiston rajaukset.
Tavoiteominaisuuksissa puutteita
Tietoaineiston ilmiön kannalta keskeisiä ominaisuuksia puuttuu arvioitavasta tietoaineistosta.
Puuttuvat kohdeyksiköt
Tietoaineiston alipeitto eli tietoaineiston tavoitekohdejoukosta puuttuvien kohdeyksiköiden prosentuaalinen osuus.
Ylimääräiset kohdeyksiköt
Tietoaineiston ylipeitto eli tietoaineistossa mukana olevien, mutta tietoaineiston tavoiteperusjoukkoon kuulumattomien kohdeyksiköiden prosentuaalinen osuus.
Puutteelliset kohdeyksiköt
Yhdenkin puuttuvan ominaisuustiedon sisältävien kohdeyksiköiden osuus tietoaineiston kaikista kohdeyksiköistä.
Puutteelliset ominaisuustiedot
Puuttuvan ominaisuustiedon omaavien kohdeyksiköiden osuus kaikista kohdeyksiköistä ominaisuuksittain tarkasteltuna.
Miten tieto on kuvattu?
Tietolähde
Tietoaineiston, kohdeyksikön tai ominaisuuden lähdetieto on saatavilla.
Tiedon elinkaari
Tietoaineiston elinkaari on määritelty ja kuvaus siitä on saatavilla.
Muutosten hallinta
Ominaisuustiedoissa tapahtuvia rakenteellisia tai lähdetietojen muutoksia seurataan.
Aineistokuvaus
Mitä kieliversioita tietoaineiston aineistokuvauksesta on saatavilla?
Käsitteiden määritelmät
Kieliversiot, joilla keskeisten käsitteiden määritelmät ovat saatavilla.
Ominaisuuksien tietokuvaukset
Kieliversiot, joilla keskeisten käsitteiden määritelmät ovat saatavilla.
Ymmärrettävyyden asiakaspalaute
Ymmärrettävyydestä on mahdollista antaa asiakaspalautetta, saatua palautetta seurataan ja siihen reagoidaan.
Noudatettavat säädökset ja standardit
Tietoaineiston noudattamat säädökset, standardit, hyvät käytänteet ja suositukset ovat listattuna tietoaineiston kuvauksissa.
Miten tietoa voi käyttää?
Tietoaineiston tietomalli
Tietoaineisto on rakenteisesti kuvattu.
Kohdeyksikön pysyvä tunniste
Tietoaineiston kohdeyksiköillä on vähintään tietoaineistokohtainen pysyvä tunniste.
Koneluettavuuden asiakaspalaute
Koneluettavuudesta on mahdollista antaa asiakaspalautetta, saatua palautetta seurataan ja siihen reagoidaan.
Käyttöoikeus
Kuvataan tietoaineiston käyttöoikeuden rajaukset: esim. käsittelijä, käsittely-ympäristö.
Käytön rajoitukset
Kuvataan tietoaineiston käyttötarkoitusten rajoitukset: esim. avoimen datan lisenssit tai käyttöehtoja.
Määräpäivien noudattaminen
Tietoaineiston toimitusaikataulun seuranta toteutuneeseen toimitusaikatauluun verrattuna.
Päivitystiheys
Tietoaineiston säännöllinen päivitystiheys.
Päivityksessä muuttuneet ominaisuustiedot
Päivityksessä muuttuneiden ominaisuusarvojen osuus kaikista tietoaineiston ominaisuusarvoista.