Julkaistu: 25.11.2004

Perusviivasta ongelmia

Howard Wainerin mainiossa artikkelissa, kuinka tehdään epäonnistunut tilastokuvio (H. Wainer: How to Display Data Badly. The American Statistician, 1984), yksi säännöistä kuului: muuttele perusviivaa. Tämä sääntö koski yksinomaan niin sanottua summaviivakuviota tai kumulatiivista viivakuviota. Tällainen kuvio tehdään niin, että viivakuvion (oikeammin aluekuvion) osat sijoitetaan päällekkäin eli lasketaan yhteen. Tällöin ylin viiva osoittaa kaikkien viivojen yhteismäärän.

Tällä kuviotyypillä pystyy esittämään sen, millä lailla jonkin kokonaisuuden rakenne on muuttunut ajan myötä. Tietyllä tavalla, ehkä vähän kaukaa hakien, sitä voisi verrata aikasarjaan, jossa kussakin aikapisteessä on piirakkakuvio. Ajatuksena tämä on kiinnostava esitystapa, mutta kuviotyyppi ei kuitenkaan toimi aivan niin kuin voisi odottaa. Ongelmaksi nousee se, että jos kuviossa alempana olevissa osissa on huomattavaa vaihtelua, se siirtyy ja myös kumuloituu ylempänä oleviin osiin. Tästä johtuen esimerkiksi ylimpänä olevan osan perusviiva on toiseksi ylimpänä olevan osan yläviiva jne. Wainerin sääntö tarkoitti juuri tätä: kunkin osan perusviiva vaihtelee. Onko se sitten jokin ongelma?

Kuvion rakenteesta seuraa visuaalisen vääristymän mahdollisuus. Tämä käy hyvin selville vertailemalla oheisen kuvion 1 paneelia A ja B. (Kuvion kaikissa paneeleissa on tarkalleen samat luvut, mutta osat on pantu eri järjestykseen.) Paneelista A havaitsee parhaiten lukujen suhteet: sininen osa on vakio yli koko tarkastelujakson, vihreä osa on tasaisesti kasvava ja punaisessa osassa on enemmän vaihtelua.

Kuvio 1.

Paneelissa B sininen vakio-osa on päällimmäisenä, eli sen pitäisi näyttää yhtä leveältä koko matkaltaan. Mutta se ei näytä, vaan alueen leveys näyttää vaihtelevan koko matkaltaan. Vihreä alue puolestaan kasvaa vasemmalta oikealle, eli se on leveimmillään oikeassa reunassa. Tosin sitä on erittäin vaikea uskoa paneelista B tai paneelista D.

Tällainen visuaalinen harha syntyy siksi, että vaistomaisesti arvioimme alueen leveyttä eri tavalla kuin kuvion rakenne edellyttää. Leveyttä pitäisi nimittäin arvioida pystysuunnassa, siis oletettujen hilaviivojen suuntaisesti, mutta visuaalinen järjestelmämme arvioi leveyttä kohtisuoraan alueen yli (ks. kuvio2). Näiden arviointitapojen välinen ero on sitä suurempi mitä jyrkemmässä kulmassa alue kulkee, ja vaikutus on sitä suurempi mitä enemmän vaihtelua tämän suunnan suhteen esiintyy.

Kuvio 2.

Mahdollisesta visuaalisesta harhasta huolimatta tällä kuviolla on kyllä oma paikkansa kuviotyyppien joukossa. Joissain tilanteissa se on havainnollisin esitystapa kuvaamaan rakenteen muutosta. Tällaisia kuvioita tehtäessä on kuitenkin otettava huomioon kuvion ilmiasun mahdollinen vaihtelu. Parhaiten tämä käy päinsä vaihtelemalla osien järjestystä (jos se on loogisesti mahdollista) ja arvioimalla, miten paljon järjestys vaikuttaa kuvion oikein ymmärtämiseen.

Useimmiten paras järjestys on sellainen, jossa alimpana on osa, jonka vaihtelu on kaikkein vähäisintä, ja ylimpänä se, jonka vaihtelu on suurinta. Näin vaihtelun kumuloitumisesta aiheutuva visuaalinen harha on yleensä vähäisintä. Tosin tämäkään ei ole täysin ongelmaton esitystapa. Paneelit A ja C ovat esimerkkejä tästä periaatteesta. Niissä kuitenkin näyttää, että punaisessa osassa oli nouseva trendi vuosien 1986 ja 1987 välillä. Paneeleista B ja D kuitenkin huomaa nopeasti, että mitään muutosta ei ollut tapahtunut.

Vaikka summaviivakuvioon liittyy ongelmia, ei sen käyttöä ole syytä lopettaa. On kuitenkin tiedostettava sen ongelmat ja kokeilemalla on hyvä selvittää, onko mahdollinen visuaalinen harha liian suuri. Jos siltä tuntuu, niin silloin tätä kuviotyyppiä ei kannata käyttää. Sille nimittäin löytyy myös hyviä vaihtoehtoja.

Vesa Kuusela


Päivitetty 25.11.2004