Julkaistu: 15.9.2004
Paljastuksia
Yksi onnistuneen kuvioesityksen piirteistä on, että se paljastaa tietojen salaisimmatkin piirteet. Varsinkin silloin, kun nämä piirteet ovat ilmiöitä, joita tapaamme kutsua rakenteiksi tai säännönmukaisuuksiksi. Ohessa on esimerkki, josta tulee nopeasti esille tilastokuvion tehokkuus säännönmukaisuuksien esittäjänä taulukkoon verrattuna.
Malta aluksi katsoa vain paneelissa 1 olevia taulukoita. Kaikissa neljässä taulukossa on kaksi muuttujaa: X ja Y. Mieti, minkälainen ilmiö saattaisi olla kunkin taulukon takana. Harva kykenee löytämään taulukoista mitään erikoista, kenties viimeistä taulukkoa lukuun ottamatta. Taulukoista on hyvin vaikeata - joissain tapauksissa lähes mahdotonta - nähdä tietoihin liittyvää hahmoa eli säännönmukaisuutta. Olen usein sanonut, että taulukkojen näyttäminen esitelmän yhteydessä on verrattavissa työpaikkakiusaamiseen, koska niitä on niin vaikea ymmärtää lyhyessä ajassa.
Paneeli 1
Paneelissa 2 ovat paneelin 1 taulukot esitettynä parvikuvioina. Parvikuvioista paljastuu silmäyksellä tietojen luonne. Ensimmäisen taulukon luvut muodostavat ellipsin muotoisen parven, kuten kuvio-paneelista A voi todeta. Tottunut silmä tunnistaa välittömästi parven muodon ja osaa siitä päätellä, että muuttujien X ja Y välillä on riippuvuutta. Tottumatonkin huomaa, että suuriin Y:n arvoihin liittyvät suuremmat X:n arvot kuin pienempiin Y:n arvoihin. Tilastotieteen opinnoista olisi se ilo, että osaisi kutsua riippuvuutta oikealla nimellä ('korrelaatio'), mutta ilman alan opintojakin kuviosta oivaltaa ilmiön luonteen, vaikka ei osaisi sitä nimetäkään.
Paneeli 2
Kuvio on ylivertainen säännönmukaisuuden esittämisessä. Ehkä vakuuttavimmin tämän huomaa vertaamalla toista taulukkoa ja kuviota B. Taulukosta tuskin kukaan pystyy hahmottamaan, että pisteet ovat paraabelin kaarella. Kuviosta katsottuna taas asia on itsestään selvä. Kenties tieto siitä, että kyseessä on nimenomaan paraabeli, vaatisi matematiikan opintoja tuekseen, mutta ilman koulutustakin huomaa, että pisteitä sitoo toisiinsa matemaattinen sääntö, joka ei ole suoraviivainen eikä ympyrä. Sen pystyy toteamaan jokainen riippumatta siitä, montako vuotta koulua on tullut käytyä.
Muuan alan guruista totesikin, että kuviossa on väite ja sen todistus samassa yhteydessä. Tällä hän tarkoitti sitä, että kuviossa yhdistyvät säännönmukaisuuden paljastuminen ja sen osoittaminen. Kuvion näkemisen jälkeen asia on itsestään selvä. Muilla tavoin esitettynä saman asian todistaminen olisi ollut huomattavan monimutkaista. Olenkin usein mietiskellyt, voiko "säännönmukaisuudella" olla muuta kuin visuaalinen olemus.
Kuviossa C on kolmannen taulukon pisteet ja siitä huomaa heti, että pisteet asettuvat suoralle viivalle, paitsi yksi piste, joka on suoran ulkopuolella. Näinkään yksinkertaisen säännönmukaisuuden, suoran viivan, havaitseminen ei onnistu taulukosta. Kuviosta taas viivan näkee niin, että siitä ei ole epävarmuutta. Ihmisen havainnointikyky onkin hyvä löytämään säännönmukaisuuksia. Ihminen on lisäksi hyvä erottamaan poikkeavuuksia säännönmukaisuudesta. Viivan ulkopuolella olevan pisteen ei tarvitsisi olla paljoakaan viivan ulkopuolella, kun sen jo huomaisi.
Yllä oleva esimerkki on peräisin F.J. Anscomben artikkelista "Graphs in Statistical Analysis" (The American Statistician, 1973, 17-21). Se, mikä tekee esimerkistä erityisen mielenkiintoisen on, että jokaisessa neljässä tapauksessa X:n ja Y:n keskiarvot ovat samat. Samoin kaikissa neljässä tapauksessa on tarkalleen sama korrelaatiokerroin (0,82) ja tarkalleen sama regressiosuora (Y=3+0,5*X). Kuvioiden vertailu kuitenkin paljastaa, että kussakin tapauksessa on kyse varsin erilaisesta ilmiöstä.
Vesa Kuusela
Päivitetty 15.9.2004