Tiedon laatukriteerit
Laatukriteerien avulla voidaan kuvata ja arvioida tietoaineistojen laatua. Kriteerit ovat osa Tiedon laatukehikkoa. Ne auttavat käyttäjää arvioimaan, onko tietoaineisto tarpeeksi laadukasta aiottuun käyttötarkoitukseen. Pidemmällä tähtäimellä laatukriteerit tukevat tietoaineistojen ja tietovarantojen laadun parannuksessa.
Laatukriteerit on tarkoitettu joustavaksi työkaluksi; kaikki kriteerit tai varsinkaan mittarit eivät välttämättä ole merkityksellisiä kaikissa tilanteissa tai tietoaineistoissa. Lisäksi on hyvä huomata, että käyttötarkoitus määrittää sen, millaista tasoa laatukriteerin kuvaaman laadun osalta tavoitellaan. Laatukriteerit, ja erityisesti näiden mittarit, kohdistuvat rakenteiseen dataan.
Laatukriteerit mittareineen muodostavat hierarkkisen rakenteen, mutta laatukriteerit ja mittarit vaikuttavat ja linkittyvät paljon toisiinsa. Laadun parannus jonkin laatukriteerin suhteen voi jopa heikentää toisen laatukriteerin avulla kuvattua tiedon laatua, esimerkiksi jos tavoitellaan tietoaineiston täydellistä kattavuutta tai ominaisuustietojen erityisen hyvää tarkkuutta niin tiedon ajantasaisuus yleensä heikkenee.
Tiedon laatukriteerit ja mittarit on kuvattu oheisessa tiedostossa. Tällä sivulla on tiivistelmä tiedoston sisällöstä.
Laatukriteereihin ja mittareihin liittyvä sanasto on selitetty käsite-sivulla.
Taustatietoja
Tiedon laatukehikko kehitettiin TiHA-hankkeen osahankkeessa.
Tiivistelmä tiedon laatukriteereistä
Tiedon laatukriteerit on järjestetty tiedonkäyttäjän näkökulmaa ajatellen kolmen kysymyksen alle:
Miten tieto kuvaa todellisuutta?
Virheettömyys
Synonyymit: oikeellisuus
Kuvaus: Virheettömyys kuvaa sitä, miten tietoaineiston tiedot vastaavat todellisuutta. Tiedon virheettömyyttä tarkastelemalla voidaan saada kiinni myös systemaattisia vääristymiä tietoaineistossa.
Esimerkit: Se tieto, mikä operatiiviseen päätökseen päätyy, on käytännössä paras käsitys siitä, mikä tieto on oikea. Tieto on oikeellista esimerkiksi tilanteessa, jossa verotuksessa kerrottu palkka on sama kuin todellisuudessa maksettu palkka.
Mittarit: Menetelmällisesti tuotetut arvot, Virheelliset ominaisuusarvot, Väärinluokittelu
Tarkkuus
Synonyymit: harhattomuus
Kuvaus: Tarkkuus kuvaa sitä, miten hyvin tietoaineiston tiedot vastaavat sitä mitä tavoitellaan. Tarkkuus kuvaa sitä, kuinka hyvin tieto osuu oikeaan.
Esimerkit: Esimerkkejä tarkkuudesta ovat mitattujen arvojen hajonta ja tietoaineiston poikkeavien havaintojen osuus sekä lisäksi luokittelun osuvuus ja mittaustaso esim. desimaalit, ajan tai koordinaattien mittaustaso.
Mittarit: Keskihajonta, Poikkeavat havainnot
Kattavuus
Synonyymit: täydellisyys
Kuvaus: Kattavuus kuvaa tietoaineiston tavoitellun ajallisen ja alueellisen kattavuuden sekä tavoitellut kohdeyksiköt ja ominaisuustiedot. Toisaalta kattavuus kertoo miltä osin tietoaineisto sisältää tavoiteltuja tietoja.
Esimerkit: Tietoaineisto kattaa määritellyn tarkastelualueen yksiköt, esimerkiksi kaikki Suomen yritykset. Alueellinen kattavuus kertoo, ovatko kaikki käsiteltävät alueet mukana, esimerkiksi kaikki Suomen kunnat tai kattaako tietoaineisto Ahvenanmaan. Ylipeitto kertoo, että tietoaineistossa on siihen kuulumattomia yksiköitä. Alipeitto kertoo, että tietoaineistosta puuttuu siihen kuuluvia yksiköitä. Vastuskato on alipeittoa. Toisaalta kattavuus kertoo myös sisältääkö tietoaineisto kaikki määritellyt ominaisuustiedot tietoaineistossa oleville kohdeyksiköille, esimerkiksi tietoaineistossa olevien Suomen kuntien väkiluku- ja pinta-alatiedot tai onko kaikilla yrityksillä tiedossa esimerkiksi osoite- tai liikevaihtotieto.
Mittarit: Ajallinen tavoitekattavuus, Alueellinen tavoitekattavuus, Tavoitekohdeyksiköt, Tavoiteominaisuuksissa puutteita, Puuttuvat kohdeyksiköt, Ylimääräiset kohdeyksiköt, Puutteelliset kohdeyksiköt, Puutteelliset ominaisuustiedot
Ajantasaisuus
Kuvaus: Ajantasaisuus kuvaa tietoaineiston tietojen aikaulottuvuutta. Ajantasaisuus on sitä parempi mitä lähempänä tiedon viiteajankohta on nykyhetkeä. Viiteajankohta on se ajankohta, jota tieto koskee.
Esimerkit: Tietoaineiston tietoon liittyvä viiteajankohta on kerrottu tiedon yhteydessä. Sen avulla pystytään päättelemään tiedon tuoreus. Viiteajankohta voi olla esimerkiksi vuoden alun ja lopun välinen aika tai yhden tietyn päivän tilanne. Tiedon tuotannossa tarkastellaan erilaisia tiedon tarkastus- ja muutosajankohtia.
Mittarit: Viiteajankohta, Luontiajankohta, Tarkistusajankohta, Muutosajankohta
Johdonmukaisuus
Synonyymit: säännönmukaisuus, tiedon looginen eheys
Kuvaus: Johdonmukaisuus kertoo siitä, että tietoaineisto on yhtenäinen ja ristiriidaton. Johdonmukaisuudella voidaan kuvata myös eri tietoaineistojen keskinäistä johdonmukaisuutta.
Esimerkit: Esimerkiksi seuraavat tilanteet eivät ole johdonmukaisia: asuinrakennuksella ei ole yhtään asuntoa tai henkilön avioliiton solmimispäivä on aikaisempi kuin syntymäpäivä. Johdonmukaisuutta voidaan tarkistaa tarkistussäännöillä/laatusäännöillä.
Mittarit: Tieto loogisuustarkastettu
Miten tieto on kuvattu?
Alkuperäisyys
Synonyymit: jäljitettävyys, kiistämättömyys
Kuvaus: Alkuperäisyys kertoo siitä, että tietoaineistoon ja sen tietoihin tehdyt muutokset voidaan jäljittää. Tiedon alkuperä tunnetaan.
Esimerkit: Tiedon alkuperä ja muutostapahtumat on kuvattu, muutosten aikaleimat ovat saatavilla. Tieto voidaan todistaa kiistämättömäksi, tietoaineiston tiedot voidaan todentaa uudelleen.
Mittarit: Tietolähde, Tiedon elinkaari, Muutosten hallinta
Metatietojen ymmärrettävyys
Synonyymit: tulkittavuus, käsitettävyys
Kuvaus: Metatietojen ymmärrettävyys kuvaa sitä, miten kattavasti tietoaineistolla on sellaisia metatietoja, jotka auttavat tiedon ymmärtämisessä sitä käytettäessä.
Esimerkit: Tietoaineisto ja sen ominaisuustiedot on kuvattu metatietokuvauksessa riittävällä tasolla siten, että tietosisällön ja merkityksen ymmärtäminen helpottuu. Ominaisuustiedoissa käytetyt koodistot on kirjattu ja ne ovat datan kanssa yhteneväiset. Koodistojen kuvaukset ovat saatavilla esimerkiksi linkkien kautta. Olennaiset käsitteet on kuvattu ja linkit tarpeellisiin sanastoihin on liitetty metatietokuvauksiin.
Mittarit: Aineistokuvaus, Käsitteiden määritelmät, Ominaisuuksien tietokuvaukset, Ymmärrettävyyden asiakaspalaute
Suositustenmukaisuus
Synonyymit: yhteensopivuus, semanttinen yhdenmukaisuus, yhdenmukaisuus
Kuvaus: Suositustenmukaisuus kertoo siitä, että tietoaineisto ja sen ominaisuustiedot noudattavat tunnettuja standardeja, käytäntöjä ja säädöksiä ja ne on kerrottu tietoaineiston yhteydessä.
Esimerkit: Kansallista yhdenmukaisuutta tukee muun muassa yhtenäisten kansallisten sanastojen ja koodistojen käyttö tietoaineistojen tietoja suunniteltaessa. Kansainvälistä yhdenmukaisuutta tukevat esimerkiksi EU:n vahvistamat standardiluokitukset ja ISO-kielikoodisto.
Mittarit: Noudatettavat säädökset ja standardit
Miten tietoa voi käyttää?
Koneluettavuus
Kuvaus: Koneluettavuus kuvaa, onko tietoaineisto rakenteistettu siten, että sitä voidaan käsitellä koneellisesti ja käsittely on mahdollista eri tietojärjestelmissä.
Esimerkit: Tietoaineisto on rakenteisessa formaatissa, esim. csv, json, xml. Tietoaineiston rakenne on kuvattu, esim. skeema.
Mittarit: Tietoaineiston tietomalli, Kohdeyksikön pysyvä tunniste, Koneluettavuuden asiakaspalaute
Käyttöoikeudet
Kuvaus: Käyttöoikeudet kuvaa sitä, miten tietoaineiston käyttöoikeus on määritelty ja mitä aineistolla voi tehdä eli mihin käyttötarkoituksiin tietoaineistoa voi hyödyntää.
Esimerkit: Esimerkiksi tietoaineisto on tietyin rajoituksin käytettävissä tieteelliseen tutkimukseen. Avoin data on lisensoitu.
Mittarit: Käyttöoikeus, Käytön rajoitukset
Oikea-aikaisuus
Synonyymit: täsmällisyys
Kuvaus: Täsmällisyys tarkoittaa sitä, että tietoaineisto on käytettävissä ilmoitettuna ajankohtana ja riittävän tiheästi tietoaineistossa tapahtuviin muutoksiin nähden.
Esimerkit: Tietojen julkistamisaika ja julkistamistiheys on ilmoitettu. Julkistamisaikataulujen muutoksista kerrotaan etukäteen.
Mittarit: Määräpäivien noudattaminen, Päivitystiheys, Päivityksessä muuttuneet ominaisuustiedot