Tiedon laatukriteerit

Laatukriteerien avulla voidaan kuvata ja arvioida tietoaineistojen laatua. Kriteerit ovat osa Tiedon laatukehikkoa. Ne auttavat käyttäjää arvioimaan, onko tietoaineisto tarpeeksi laadukasta aiottuun käyttötarkoitukseen. Pidemmällä tähtäimellä laatukriteerit tukevat tietoaineistojen ja tietovarantojen laadun parannuksessa.

Laatukriteerit on tarkoitettu joustavaksi työkaluksi; kaikki kriteerit tai varsinkaan mittarit eivät välttämättä ole merkityksellisiä kaikissa tilanteissa tai tietoaineistoissa. Lisäksi on hyvä huomata, että käyttötarkoitus määrittää sen, millaista tasoa laatukriteerin kuvaaman laadun osalta tavoitellaan. Laatukriteerit, ja erityisesti näiden mittarit, kohdistuvat rakenteiseen dataan.

Laatukriteerit mittareineen muodostavat hierarkkisen rakenteen, mutta laatukriteerit ja mittarit vaikuttavat ja linkittyvät paljon toisiinsa. Laadun parannus jonkin laatukriteerin suhteen voi jopa heikentää toisen laatukriteerin avulla kuvattua tiedon laatua, esimerkiksi jos tavoitellaan tietoaineiston täydellistä kattavuutta tai ominaisuustietojen erityisen hyvää tarkkuutta niin tiedon ajantasaisuus yleensä heikkenee.

Tiedon laatukriteerit ja mittarit on kuvattu oheisessa tiedostossa. Tällä sivulla on tiivistelmä tiedoston sisällöstä. 

Laatukriteereihin ja mittareihin liittyvä sanasto on selitetty käsite-sivulla.

Tiivistelmä tiedon laatukriteereistä

Tiedon laatukriteerit on järjestetty tiedonkäyttäjän näkökulmaa ajatellen kolmen kysymyksen alle:

  1. Miten tieto kuvaa todellisuutta?
  2. Miten tieto on kuvattu?
  3. Miten tietoa voi käyttää?

Miten tieto kuvaa todellisuutta?

Miten tieto kuvaa todellisuutta? -ryhmään kuuluvat virheettömyys, tarkkuus, kattavuus, ajantasaisuus, johdonmukaisuus.

Virheettömyys

Synonyymit: oikeellisuus

Kuvaus: Virheettömyys kuvaa sitä, miten tietoaineiston tiedot vastaavat todellisuutta. Tiedon virheettömyyttä tarkastelemalla voidaan saada kiinni myös systemaattisia vääristymiä tietoaineistossa.

Esimerkit: Se tieto, mikä operatiiviseen päätökseen päätyy, on käytännössä paras käsitys siitä, mikä tieto on oikea. Tieto on oikeellista esimerkiksi tilanteessa, jossa verotuksessa kerrottu palkka on sama kuin todellisuudessa maksettu palkka.

Mittarit: Menetelmällisesti tuotetut arvot, Virheelliset ominaisuusarvot, Väärinluokittelu

Tarkkuus

Synonyymit: harhattomuus

Kuvaus: Tarkkuus kuvaa sitä, miten hyvin tietoaineiston tiedot vastaavat sitä mitä tavoitellaan. Tarkkuus kuvaa sitä, kuinka hyvin tieto osuu oikeaan.

Esimerkit: Esimerkkejä tarkkuudesta ovat mitattujen arvojen hajonta ja tietoaineiston poikkeavien havaintojen osuus sekä lisäksi luokittelun osuvuus ja mittaustaso esim. desimaalit, ajan tai koordinaattien mittaustaso.

Mittarit: Keskihajonta, Poikkeavat havainnot

Kattavuus

Synonyymit: täydellisyys

Kuvaus: Kattavuus kuvaa tietoaineiston tavoitellun ajallisen ja alueellisen kattavuuden sekä tavoitellut kohdeyksiköt ja ominaisuustiedot. Toisaalta kattavuus kertoo miltä osin tietoaineisto sisältää tavoiteltuja tietoja. 

Esimerkit: Tietoaineisto kattaa määritellyn tarkastelualueen yksiköt, esimerkiksi kaikki Suomen yritykset. Alueellinen kattavuus kertoo, ovatko kaikki käsiteltävät alueet mukana, esimerkiksi kaikki Suomen kunnat tai kattaako tietoaineisto Ahvenanmaan. Ylipeitto kertoo, että tietoaineistossa on siihen kuulumattomia yksiköitä. Alipeitto kertoo, että tietoaineistosta puuttuu siihen kuuluvia yksiköitä. Vastuskato on alipeittoa. Toisaalta kattavuus kertoo myös sisältääkö tietoaineisto kaikki määritellyt ominaisuustiedot tietoaineistossa oleville kohdeyksiköille, esimerkiksi tietoaineistossa olevien Suomen kuntien väkiluku- ja pinta-alatiedot tai onko kaikilla yrityksillä tiedossa esimerkiksi osoite- tai liikevaihtotieto.

Mittarit: Ajallinen tavoitekattavuus, Alueellinen tavoitekattavuus, Tavoitekohdeyksiköt, Tavoiteominaisuuksissa puutteita, Puuttuvat kohdeyksiköt, Ylimääräiset kohdeyksiköt, Puutteelliset kohdeyksiköt, Puutteelliset ominaisuustiedot

Ajantasaisuus

Kuvaus: Ajantasaisuus kuvaa tietoaineiston tietojen aikaulottuvuutta. Ajantasaisuus on sitä parempi mitä lähempänä tiedon viiteajankohta on nykyhetkeä. Viiteajankohta on se ajankohta, jota tieto koskee.

Esimerkit: Tietoaineiston tietoon liittyvä viiteajankohta on kerrottu tiedon yhteydessä. Sen avulla pystytään päättelemään tiedon tuoreus. Viiteajankohta voi olla esimerkiksi vuoden alun ja lopun välinen aika tai yhden tietyn päivän tilanne. Tiedon tuotannossa tarkastellaan erilaisia tiedon tarkastus- ja muutosajankohtia.

Mittarit: Viiteajankohta, Luontiajankohta, Tarkistusajankohta, Muutosajankohta

Johdonmukaisuus

Synonyymit: säännönmukaisuus, tiedon looginen eheys

Kuvaus: Johdonmukaisuus kertoo siitä, että tietoaineisto on yhtenäinen ja ristiriidaton. Johdonmukaisuudella voidaan kuvata myös eri tietoaineistojen keskinäistä johdonmukaisuutta.

Esimerkit: Esimerkiksi seuraavat tilanteet eivät ole johdonmukaisia: asuinrakennuksella ei ole yhtään asuntoa tai henkilön avioliiton solmimispäivä on aikaisempi kuin syntymäpäivä. Johdonmukaisuutta voidaan tarkistaa tarkistussäännöillä/laatusäännöillä.

Mittarit: Tieto loogisuustarkastettu

Miten tieto on kuvattu?

Miten tieto on kuvattu? -ryhmään kuuluvat jäljitettävyys, metatietojen ymmärrettävyys, suositustenmukaisuus.

Alkuperäisyys

Synonyymit: jäljitettävyys, kiistämättömyys

Kuvaus: Alkuperäisyys kertoo siitä, että tietoaineistoon ja sen tietoihin tehdyt muutokset voidaan jäljittää. Tiedon alkuperä tunnetaan.

Esimerkit: Tiedon alkuperä ja muutostapahtumat on kuvattu, muutosten aikaleimat ovat saatavilla. Tieto voidaan todistaa kiistämättömäksi, tietoaineiston tiedot voidaan todentaa uudelleen.

Mittarit: Tietolähde, Tiedon elinkaari, Muutosten hallinta

Metatietojen ymmärrettävyys

Synonyymit: tulkittavuus, käsitettävyys

Kuvaus: Metatietojen ymmärrettävyys kuvaa sitä, miten kattavasti tietoaineistolla on sellaisia metatietoja, jotka auttavat tiedon ymmärtämisessä sitä käytettäessä.

Esimerkit: Tietoaineisto ja sen ominaisuustiedot on kuvattu metatietokuvauksessa riittävällä tasolla siten, että tietosisällön ja merkityksen ymmärtäminen helpottuu. Ominaisuustiedoissa käytetyt koodistot on kirjattu ja ne ovat datan kanssa yhteneväiset. Koodistojen kuvaukset ovat saatavilla esimerkiksi linkkien kautta. Olennaiset käsitteet on kuvattu ja linkit tarpeellisiin sanastoihin on liitetty metatietokuvauksiin. 

Mittarit: Aineistokuvaus, Käsitteiden määritelmät, Ominaisuuksien tietokuvaukset, Ymmärrettävyyden asiakaspalaute

Suositustenmukaisuus

Synonyymit: yhteensopivuus, semanttinen yhdenmukaisuus, yhdenmukaisuus

Kuvaus: Suositustenmukaisuus kertoo siitä, että tietoaineisto ja sen ominaisuustiedot noudattavat tunnettuja standardeja, käytäntöjä ja säädöksiä ja ne on kerrottu tietoaineiston yhteydessä.

Esimerkit: Kansallista yhdenmukaisuutta tukee muun muassa yhtenäisten kansallisten sanastojen ja koodistojen käyttö tietoaineistojen tietoja suunniteltaessa. Kansainvälistä yhdenmukaisuutta tukevat esimerkiksi EU:n vahvistamat standardiluokitukset ja ISO-kielikoodisto.

Mittarit: Noudatettavat säädökset ja standardit

Miten tietoa voi käyttää?

Miten tietoa voi käyttää? -ryhmään kuuluvat koneluettavuus, käyttöoikeudet, oikea-aikaisuus.

Koneluettavuus

Kuvaus: Koneluettavuus kuvaa, onko tietoaineisto rakenteistettu siten, että sitä voidaan käsitellä koneellisesti ja käsittely on mahdollista eri tietojärjestelmissä.

Esimerkit: Tietoaineisto on rakenteisessa formaatissa, esim. csv, json, xml. Tietoaineiston rakenne on kuvattu, esim. skeema.

Mittarit: Tietoaineiston tietomalli, Kohdeyksikön pysyvä tunniste, Koneluettavuuden asiakaspalaute

Käyttöoikeudet

Kuvaus: Käyttöoikeudet kuvaa sitä, miten tietoaineiston käyttöoikeus on määritelty ja mitä aineistolla voi tehdä eli mihin käyttötarkoituksiin tietoaineistoa voi hyödyntää. 

Esimerkit: Esimerkiksi tietoaineisto on tietyin rajoituksin käytettävissä tieteelliseen tutkimukseen. Avoin data on lisensoitu.

Mittarit: Käyttöoikeus, Käytön rajoitukset

Oikea-aikaisuus

Synonyymit: täsmällisyys

Kuvaus: Täsmällisyys tarkoittaa sitä, että tietoaineisto on käytettävissä ilmoitettuna ajankohtana ja riittävän tiheästi tietoaineistossa tapahtuviin muutoksiin nähden.

Esimerkit: Tietojen julkistamisaika ja julkistamistiheys on ilmoitettu. Julkistamisaikataulujen muutoksista kerrotaan etukäteen.

Mittarit: Määräpäivien noudattaminen, Päivitystiheys, Päivityksessä muuttuneet ominaisuustiedot