Julkaistu: 13.12.2001

Kumulatiivinen juttu

Viime kolumnissa oli esillä jatkuva-arvoisen muuttujan jakauman esittäminen perusmuodossaan eli histogrammilla. Perusmuodossakin on kuitenkin vaihtoehtoja. Keskeisin vaihtoehto on käyttää suhteellista jakaumaa absoluuttisen jakauman sijasta: absoluuttisessa jakaumassa esitetään kuhunkin luokkaan kuuluvien tapausten absoluuttinen määrä eli frekvenssi ja suhteellisessa jakaumassa taas kuhunkin luokkaan kuuluvien tapausten prosentuaalinen määrä. Oheisessa kuviossa 1 on sama jakauma kuin viime kolumnissa ollut kuvio 3, mutta nyt suhteellisena jakaumana. Suhteellinen jakauma on ehkä hieman tavallisempi kuin absoluuttinen, koska silloin eri lähteistä saatuja jakaumia on helpompi vertailla.

Kuvio 1

kuva

Toinen selvästi erilainen esitystapa on niin sanottu kumulatiivinen jakauma: viime kolumnin samoin kuin kuvion 1 jakaumaa voisi kutsua vaikkapa 'tavalliseksi'. Jakauman voi kuitenkin esittää myös kumulatiivisena eli summautuvana. Kuviossa 2 on sama jakauma kuin kuviossa 1, mutta nyt kumulatiivisena. Tässä esitystavassa pylväs alkaa siitä, mihin edellinen päättyi ja koska kuviossa 2 kyseessä on suhteellinen jakauma, viimeinen pylväs oikealla ulottuu 100 prosenttiin.

Kuvio 2

kuva

Kumulatiivinen esitystapa ei kuitenkaan ole kovin tavallinen, vaan useammin vastaava kuvio esitetään askelkuviona kuten kuviossa 3 on tehty. Joskus tällainen kuvio tehdään niin, että pylväiden sijasta esillä on vain viivakuvio, joka muodostuu pylväiden päistä, eli askelviivakuvio. Askelkuvioissa yksittäisten luokkien frekvenssien suuruus jää pienelle huomiolle ja se korostaa kumuloituvaa frekvenssiä.

Kuvio 3

kuva

Kumulatiivinen jakauma on kaiken kaikkiaan suhteellisen harvinainen esitystapana. Siitä on kuitenkin muita esitystapoja helpompi löytää vastauksia kysymyksiin, jotka sisältävät sanan "vähintään" tai "enintään". Esimerkiksi kuinka suurella osalla on enintään arvo 11 kuviossa 3 (= 71 %). Kysymys voi olla myös toisin päin. Esimerkiksi, mitä arvoa pienempi arvo on puolella tapauksista (= jokin arvo luokan 6-8 sisällä).

Kuviossa 2 esitettyä kuviotyyppiä voidaan käyttää myös kahden tai kolmen jakauman vertailuun, kuten kuviossa 4 on tehty. Esitystapa ei aluksi vaikuta kovin havainnolliselta, mutta saa siitä kuitenkin suhteellisen hyvän käsityksen jakautumien luonteesta. Ja toisaalta, millä muulla tavalla kumulatiivisia jakautumia voisi vertailla?

Kuvio 4

kuva

Kuvio 4 on kuviotyyppiluokittelun mukaan pylväsryhmäkuvio ja sen rinnakkaismuoto on kumulatiivinen pylväskuvio. Myös tässä tilanteessa on olemassa kumulatiivisen jakauman esittämisessä käytettävä muunnos. Kuviossa 5 on hieman keinotekoinen esimerkki. Siinä ajatellaan, että yrityksen myynti muodostuu kolmesta tuotteesta (A, B ja C) ja kuviolla esitetään, kuinka koko vuoden myynti on jakautunut vuosineljänneksille ja mikä oli kunkin tuotteen myyntimäärä eri neljänniksillä.

Kuvio 5

kuva

Kumulatiivisen jakauman käytön esteenä on luultavasti, se että koko ajatusta ei oikein tunneta. Vain tilastotiedettä opiskelleet lienevät törmänneet siihen. Tällä esitystavalla on kuitenkin selvä käyttöalansa vastaamassa tietyn tyyppisiin kysymyksiin. Kysymykset joissa on sana "enintään" tai "vähintään" ovat suhteellisen vaikeita selvittää tavallisesta jakaumasta.


Päivitetty 13.12.2001

Lisätietoja:
sähköposti: tietoaika@tilastokeskus.fi