Julkaistu: 9.10.2003
Ennustejakaumille ei ole vaihtoehtoja
Todennäköisyysjakaumaa käytetään epävarmuuden kuvaajana, kun emme voi tietää täsmälleen hedelmällisyyden, kuolevuuden ja muuttoliikkeen tasoa tulevina vuosina, vastaa Juha Alho Pekka Parkiselle.
ENSIMMÄINEN VIRALLINEN Suomen väestöä koskeva ennuste julkaistiin vuonna 1934. Tekijä oli silloisen Tilastokeskuksen aktuaari Gunnar Modeen. Ennusteen mukaan väestö kasvaisi lähes 4 miljoonaan 1970-luvulla ja alkaisi sen jälkeen laskea. Todellisuudessa vuoden 1970 väkiluku oli 4,6 miljoonaa. Noin 35 vuoden kuluessa ennustevirheeksi kertyi -15 prosenttia. Virhe syntyi siitä, että kuolleiden määrä tuli yliarvioitua kuudellasadallatuhannella, syntyneiden määrä aliarvioitua kolmellasadallatuhannella ja nettomuutto yliarvioitua kolmellasadallatuhannella. Kokonaisvirhe olisi ollut vielä suurempi, jos syntyneiden määrä ei olisi tullut aliarvioitua.
Vuonna 1969 julkaistu Tilastokeskuksen ennuste vuodelle 2000 oli 5,2 miljoonaa. Tämä osui aivan kohdalleen. Kuitenkin seuraava, vuonna 1971 julkaistu ennuste oli 4,4 miljoonaa, joten sen virhe oli -15 prosenttia, sama kuin Modeeninkin. Syynä ennusteen korjaamiseen oli vuosien 1969-70 suuri muutto Ruotsiin sekä syntyvyyden nopea lasku. Kun paluumuutto alkoi eikä syntyvyyskään jatkanut laskuaan, ennusteita korjattiin vähitellen ylöspäin.
Kun väestöprosessit noudattavat pitemmän aikavälin trendejään, ennusteet voivat olla tarkkoja, mutta muutoksia ei osata ennakoida. YK:n ennusteiden tarkastelu osoittaa, että Suomessa tehdyt ennusteet eivät ole olleet poikkeuksellisen huonoja. Keskimääräinen virhe ennustettaessa koko väestön määrää 30 vuotta eteenpäin on ollut teollistuneissa maissa 6-8 prosenttia. Useista maista tehdyt selvitykset viittaavat siihen, että ennusteiden tarkkuus ei olisi ajan myötä parantunut.
Helsingin yliopiston tilastotieteen professori Leo Törnqvist esitti vuonna 1949 - ilmeisesti ensimmäisenä maailmassa - että ennusteiden epävarmuutta kuvattaisiin todennäköisyyslaskennan keinoin. Tilastokeskus oli tuolloin uranuurtaja julkaistessaan Törnqvistin laskelmat osana virallista ennustetta. Ajatuksena on, että kun emme voi tietää täsmälleen, mikä on hedelmällisyyden, kuolevuuden ja muuttoliikkeen taso tulevina vuosina, käytämme todennäköisyysjakaumaa. Sen keskikohta vastaa todennäköisenä pitämäämme arvoa, ja hajonta heijastaa käsitystemme epävarmuutta: mitä suurempaa epävarmuus on, sitä suurempi hajontakin on. Hajonta kasvaa ennustevuosien myötä.
Ennustejakaumia käytettäessä ei ole kysymys siitä, että oletettaisiin väestönkehityksen olevan jossain filosofisessa mielessä "satunnaista" ja ettei hedelmällisyydelle, kuolevuudella ja muuttoliikkeellä olisi taloudellisia, sosiaalisia tai biologisia determinantteja. Kyse on vain siitä, että koska emme näitä syytekijöitä tarkasti tunne, jäljelle jää epävarmuutta, joka voidaan kuvata todennäköisyysjakauman avulla.
Tällöin todennäköisyyden käsite tulkitaan subjektiivisesti. Usein, esimerkiksi otantatutkimusten yhteydessä, todennäköisyydet tulkitaan suhteellisina frekvensseinä. Tämän näkökulman soveltaminen historiallisiin väestöaikasarjoihin on hankalaa. Voidaan kuitenkin todistaa, että henkilöllä, jonka tulevaisuutta koskevat uskomukset ovat ristiriidattomia, on (eräin lisäoletuksin) todennäköisyysjakauma, joka kuvaa hänen tuntemaansa epävarmuutta.
Subjektiivisuus ei tarkoita, että todennäköisyydet olisivat mielivaltaisia. Omissa töissäni olen pyrkinyt siihen, että ennustejakauman hajonta kuvaisi odotettavaa ennustevirhettä, mikäli ennustaminen ei tulevaisuudessa ole sen helpompaa eikä sen vaikeampaa kuin se oli menneisyydessä. Kuriositeettina voidaan todeta, että jos Modeenilla olisi 1930-luvulla ollut käytettävissään nykyiset laskentavälineet, hän olisi tästä lähtökohdasta, ja tuolloin käytettävissä olleiden väestötietojen avulla, voinut ennakoida ennusteensa epävarmuuden suuruusluokan aivan oikein.
Käyttäjälle, joka uskoo tulevaisuuden olevan nyt helpommin ennakoitavissa kuin ennen, voidaan tuottaa kapeammat ennustevälit. Tämä voisi perustua esimerkiksi uskoon siitä, että hedelmällisyys ei voi enää vaihdella enempää kuin se on maksimissaan tehnyt viimeisen 30 vuoden kuluessa. Käyttäjälle, joka uskoo tulevaisuuden olevan vaikeammin ennakoitavissa, voidaan valmistaa tätä vastaavat ennustevälit. Tämä voisi perustua esimerkiksi siihen, että käyttäjä pitäisi Suomessa mahdollisena yhtä suuria tai suurempia hedelmällisyyden muutoksia kuin Italiassa ja Espanjassa, joissa hedelmällisyyden lasku vuosina 1970-1993 oli prosentuaalisesti yhtä suurta kuin Suomessa vuosina 1947-1973.
Alussa näimme, että ennustevirheet voivat kompensoida toisiaan. Kuten Törnqvist tiesi, todennäköisyyslaskennan avulla tämä mahdollisuus voidaan ottaa huomioon. Samalla todennäköisyyden käyttö pakottaa käsittelemään eri prosessien epävarmuutta yhtenäisellä tavalla. Perinteisesti ennusteiden epävarmuutta on kuvattu laskemalla keskiennusteen lisäksi ylä- ja alaennusteita, joiden on ollut tarkoitus kuvata realistisina pidettyjä vaihtoehtoisia kehityskulkuja. Koska vaihtoehtoiset laskelmat ovat kuitenkin perustuneet yhteismitattomiin oletuksiin ja koska niissä ei voida sallia virheiden kompensoitumista, niiden järkevä käyttö on ollut vaikeaa.
Päätöksentekijöiden tueksi on myös tarjottu ns. skenaarioita, joissa pyritään luonnehtimaan erilaisia syy-seuraus-ketjuja, jotka kuvaavat vaihtoehtoisia väestöpolkuja. Skenaariot ovatkin hyödyllinen lisä suunnittelijan työkalupakkiin, sillä ne kiinnittävät suoraan huomion prosesseihin, joilla kehitykseen voidaan mahdollisesti vaikuttaa. Koska tietomme väestön kehityksen syistä on valitettavan puutteellista, skenaarioiden toteutumisen todennäköisyyttä on vaikea arvioida ja siksi ne eivät korvaa ennustejakaumia.
Viimeisen kymmenen vuoden aikana ennustejakaumia on tehty Suomen lisäksi muun muassa Australian, Hollannin, Itävallan, Liettuan, Norjan ja Yhdysvaltojen väestölle. EU:n rahoittama UPE-projekti, jossa ovat mukana Hollannin väestöntutkimuslaitos, Oslon yliopisto, Tilastokeskus ja Joensuun yliopisto, tuottaa ennustejakaumat kaikille EU/EEA-maille vuoden 2004 kuluessa. Alustavia tuloksia sovelletaan jo Saksan, Englannin ja Hollannin eläke- ja terveydenhuoltojärjestelmiin. Suomessa ennustejakaumia on sovellettu näiden alojen lisäksi muun muassa eläkkeiden elinaikakorjauskertoimen tarkasteluun, jonka käyttöönotosta säädettiin lailla viime keväänä.
Helsingin Sanomat siteerasi pääkirjoituksessaan 13.9.1998 Suomen Pankin pääjohtajaa Matti Vanhalaa ja korosti ennusteiden merkitystä taloudellisen riskiarvioinnin välineinä. Uhkia ei pitäisi vähätellä eikä liioitella. Tässä tarkoituksessa käytettyinä ennustejakaumille ei ole vaihtoehtoja.
Kirjallisuutta:
National Research Council (2000) Beyond six billion. Forecasting the world's population. Washington D.C.: National Academy Press.
Niiniluoto, I. (1975): Todennäköisyyden lajeista, ss. 22-154 teoksessa Tuomela R. (toim.) Yhteiskuntatieteiden eksakti metodologia. Helsinki: Gaudeamus.
Päivitetty 9.10.2003
Lisätietoja:sähköposti: tietoaika@tilastokeskus.fi