Kuinka monta tuomiota annettiin asuntomurroista – määrät tietoon koneoppimisalgoritmilla
”A on anastanut asianomistajien B ja C omaisuutta tunkeutumalla heidän osoitteessa X sijaitsevaan asuntoon avoimesta ikkunasta ja ottamalla sieltä iPad-tabletin. Anastettu omaisuus on palautettu asianomistajalle.”
Rikos- ja pakkokeinotilaston perusteella tiedetään, että vuosina 2017-2019 liiketiloihin murtautumisesta epäiltiin keskimäärin noin 1 500 henkilöä vuodessa. Myymälävarkauksista puolestaan epäiltiin vuosittain noin 34 000 henkilöä. Sama henkilö saattaa toki olla epäiltynä useammasta rikoksesta.
Tilastokeskus on hyödyntänyt syyttäjän teonkuvaustekstejä käräjäoikeuksissa vuonna 2019 käsitellyistä rikosasioista. Näiden perusteella liikemurtoja oli 1 150, taskuvarkauksia noin 1 100 ja myymälävarkauksia 13 800.
Suomenkielisten kuvaustekstien avulla koulutettiin koneoppimisalgoritmi luokittelemaan varkausrikokset (varkaus, törkeä varkaus ja näpistys sekä niiden yritykset RL 28:1-3) kansainvälisen rikosluokituksen (ICCS) mukaisiin murto- ja varkausrikoksia koskeviin luokkiin. Koneoppimismenetelmästä kerrotaan lisää tämän artikkelin lopussa.
”A ja B ovat yhdessä ja yksissä tuumin luvattomasti ottaneet käyttöönsä C henkilöauton. Auto on löytynyt vaurioituneena.”
Lisäksi mukaan otettiin luvattomat käytöt (RL 28:7-9) sekä moottoriajoneuvon käyttövarkaudet (RL 28:9a-9c). Näiden rikostyyppien luokitteluun ei käytetty koneoppimista, vaan tekstihakua, jolla pääteltiin, oliko kyseessä esimerkiksi moottorikulkuneuvon luvaton käyttö vai muun omaisuuden luvaton käyttö.
Runsaat 23 000 syytetekstiä, vajaat 9 000 päärikosta
Käräjäoikeuksissa käsiteltiin vuonna 2019 yhteensä 23 700 syyksiluettua varkauteen, luvattomaan käyttöön tai moottoriajoneuvon käyttövarkauteen liittyvää syytettä. Tarkastelun ulkopuolelle rajattiin ruotsinkieliset teonkuvaukset, jolloin lopullinen aineisto oli 23 400 syytettä. Vain 8 800 tapauksessa kyseessä oli tuomion päärikos. (Taulukko 1)
Erilaisia murtorikoksia oli yhteensä vajaat 2 200. ICCS-luokituksessa aidatulle piha-alueelle tunkeutumista tai ns. häkkivarastomurtoa ei lasketa varsinaiseksi murtorikokseksi, vaan ne ovat varkauksia.
Syyksiluettuja rikoksia yhteensä | Tuomion päärikos | |
---|---|---|
Yhteensä | 23 380 | 8 790 |
0501 Murto | 2 170 | 810 |
05011 Murto liiketilaan | 1 150 | 430 |
05012 Murto yksityiseen asuintilaan | 920 | 340 |
050121 Murto vakinaiseen yksityisasuntoon | 750 | 310 |
050122 Murto ei-vakinaiseen yksityisasuntoon | 160 | 30 |
05013 Murto julkiseen tilaan | 70 | 20 |
05019 Muu murto | 30 | 10 |
0502 Varkaus | 21 220 | 7 980 |
05021 Moottoriajoneuvon tai sen osien varkaus | 1 350 | 410 |
050211 Moottoroidun maakulkuneuvon varkaus | 980 | 270 |
050212 Moottoroidun maakulkuneuvon luvaton käyttöönotto | 180 | 70 |
050213 Moottoroidun maakulkuneuvon osien varkaus | 60 | 20 |
050219 Muu moottoroidun kulkuneuvon tai sen osien varkaus | 130 | 50 |
05022 Yksityisen omaisuuden varkaus | 3 610 | 1 120 |
050221 Yksityisen omaisuuden varkaus henkilöltä | 1 080 | 290 |
050222 Yksityisen omaisuuden varkaus ajoneuvosta | 690 | 140 |
050229 Muu yksityisen omaisuuden varkaus | 1 850 | 690 |
05023 Liikeyrityksen omaisuuden varkaus | 16 110 | 6 390 |
050231 Myymälävarkaus | 13 810 | 5 630 |
050239 Muu liikeyrityksen omaisuuden varkaus | 2 300 | 760 |
05024 Julkisen omaisuuden varkaus | 60 | 30 |
05026 Palveluvarkaus | 20 | 20 |
05029 Muu varkaus | 70 | 20 |
Murroista runsaat puolet tehtiin liiketiloihin. Yksityisasuntoihin tehtyjä murtoja oli noin 900 ja niistä neljä viidestä tehtiin vakituisesti asuttuihin asuntoihin. Julkisiin tiloihin eli terveysasemille, kouluihin tms. tehtyjä murtoja käsiteltiin vajaassa 70 syytteessä.
Varkaussyytteitä oli runsaat 21 200, ja niistä kaksi kolmesta koski myymälävarkauksia. Taskuvarkauksia eli yksityisomaisuuden varkauksia henkilöltä käsiteltiin noin 1 100. Ajoneuvosta varastettua yksityisomaisuutta koskevia syytteitä oli vajaat 700. Näistä monissa oli varastettu polttoainetta autosta.
Palveluiden eli esimerkiksi sähkön tai veden varastamista koskevia syytteitä oli parikymmentä.
”A on anastanut tuntemattomaksi jääneen omistajan Jopo-polkupyörän, joka on löydetty hänen hallustaan”
Polkupyörävarkauksia (tai niiden osien varkauksia) käsiteltiin vajaassa 700 syytteessä (kuvio 1). Jopo-varkauksia käsiteltiin noin sadassa syytetekstissä. Polkupyörävarkauteen syyllistyneillä oli taustalla myös muita varkausrikoksia sekä esimerkiksi huumausainerikollisuutta.
Noin kolmasosassa eli 5 000 myymälävarkaustapauksessa oli varastettu alkoholia. Vajaassa 300 myymälävarkaustapauksessa oli maininta, että tuomittu oli varustautunut jonkinlaisella foliovuoratulla kassilla hälyttimien hämäämiseksi. Runsaassa 50 tapauksessa oli puolestaan maininta, että tuomittu oli varustautunut magneetilla hälyttimen poistamiseksi.
Alkoholia varastettiin myymälöistä niiden aukioloaikoina, mutta myös murtorikosten yhteydessä.
”A on yhdessä toisen henkilön kanssa anastanut Y-kadulla sijaitsevasta kioskista B Oy:n irtainta omaisuutta. Vastaajat ovat ottaneet kadulta mukaansa liikennemerkin ja kantaneet sen yhdessä kioskin eteen. Tämän jälkeen vastaajat ovat päättäneet rikkoa liikennemerkillä kioskin ikkunan ja anastaa sieltä alkoholia. Toinen henkilö on rikkonut ikkunan, mennyt ikkunasta sisään kioskiin ja anastanut sieltä ainakin kuusi alkoholijuomaa. Tämän jälkeen vastaajat ovat jatkaneet yhdessä matkaa X suuntaan, jonka läheiselle kalliolle he ovat menneet nauttimaan anastamiaan oluita ja josta poliisi on heidät ottanut kiinni. Vastaajat ovat menettelyllään aiheuttaneet asianomistajalle taloudellista vahinkoa.”
Polttoainevarkauksista oli kyse miltei 2 000 tapauksessa. Osassa polttoainevarkauksia oli ensin otettu ajoneuvo luvatta käyttöön tai varastettu se ja sen jälkeen tyhjennetty polttoaine tankista. Myös huoltoasemalla tankkaaminen ja maksamatta jättäminen olivat yleisiä.
” A, B, C ja D ovat yhdessä anastaneet E omaisuutta ottamalla ensin luvattomasti käyttöönsä osoitteessa Y pysäköitynä olleen E:n omistaman henkilöauton tunkeutumalla ajoneuvoon ikkunalasin rikkomalla ja rikkomalla virtalukon ajoneuvon käynnistämiseksi. Tekijät ovat kuljettaneet ajoneuvon Z sillan alle, jossa he ovat anastaneet ajoneuvosta polttoaineen. Anastettu omaisuus on jäänyt kateisiin ja teosta on aiheutunut murtovahinkoja. A on ollut teon tehdessään alle 18-vuotias.”
Kyseinen rikos on ICCS-luokituksella yksityisomaisuuden varkaus ajoneuvosta. Tässä tapauksessa syyte on tullut osalle tekijöistä myös moottoriajoneuvon käyttövarkaudesta.
Työkaluja ja rakennustarvikkeita varastetaan työmailta, yrityksien ajoneuvoista sekä yksityishenkilöiden varastoista. Kupariputkia ja muita kuparitarvikkeita mainittiin vajaassa sadassa tapauksessa.
Omaisuuslajien määrät ovat vain suuntaa antavia, sillä ne on haettu sanahakuina tekstistä käyttämällä yleisiä hakusanoja. Yhdellä rikoksella on voitu viedä useampia esineitä.
Murtokeikat nuorten hommia
Yleisin ikä tuomituilla oli 19 vuotta (taulukko 2). Sen ikäisiä tuomittuja oli yhteensä 1 100, joista miehiä 800. Seuraavaksi eniten oli 27-vuotiaita. Heitä oli runsaat 900, joista 800 miehiä.
15–17 | 18–20 | 21–24 | 25–29 | 30–39 | 40+ | Yhteensä | |
---|---|---|---|---|---|---|---|
Yhteensä | 760 | 2 860 | 2 880 | 4 260 | 7 370 | 5 250 | 23 380 |
0501 Murto | 110 | 390 | 320 | 380 | 550 | 410 | 2 170 |
05011 Murto liiketilaan | 80 | 190 | 180 | 160 | 320 | 220 | 1 150 |
05012 Murto yksityiseen asuintilaan | 30 | 180 | 130 | 210 | 210 | 160 | 920 |
05013 Murto julkiseen tilaan, 05019 Muu murto | 10 | 20 | 10 | 10 | 30 | 30 | 100 |
0502 Varkaus | 650 | 2 470 | 2 560 | 3 880 | 6 820 | 4 840 | 21 220 |
05021 Moottoriajoneuvon tai sen osien varkaus | 80 | 220 | 170 | 200 | 500 | 180 | 1 350 |
05022 Yksityisen omaisuuden varkaus | 140 | 590 | 480 | 680 | 1 090 | 630 | 3 610 |
050221 Yksityisen omaisuuden varkaus henkilöltä | 60 | 130 | 130 | 190 | 310 | 270 | 1 080 |
050222 Yksityisen omaisuuden varkaus ajoneuvosta | 30 | 240 | 90 | 90 | 170 | 70 | 690 |
050229 Muu yksityisen omaisuuden varkaus | 60 | 220 | 270 | 400 | 600 | 300 | 1 850 |
05023 Liikeyrityksen omaisuuden varkaus | 430 | 1 640 | 1 900 | 2 980 | 5 170 | 3 990 | 16 110 |
050231 Myymälävarkaus | 380 | 1 190 | 1 520 | 2 650 | 4 550 | 3 530 | 13 810 |
050239 Muu liikeyrityksen omaisuuden varkaus | 50 | 460 | 370 | 330 | 620 | 460 | 2 300 |
05024 Julkisen omaisuuden, 05026 Palveluiden, 05029 Muun omaisuuden varkaus | 0 | 10 | 20 | 20 | 60 | 40 | 150 |
Lähde: Tilastokeskus, Syytetyt, tuomitut ja rangaistukset -tilasto
Nuorista 15–20-vuotiaista tuomituista noin 14 prosenttia oli syyllistynyt murtorikokseen. Sen sijaan yli 40-vuotiaista tuomituista alle 8 prosenttia oli syyllistynyt murtorikokseen.
Alle 21-vuotiailla myymälävarkauksien osuus tuomioissa on alle 45 prosenttia, mutta yli 40-vuotiailla niiden osuus on lähes 70 prosenttia.
Murtorikoksista tuomituista 88 prosenttia oli miehiä. Varkauksista tuomituista 76 prosenttia oli miehiä. Tuomituista naisista kolme neljästä tuomittiin myymälävarkaudesta ja 10 prosenttia yksityisen omaisuuden varkaudesta. Miehistä myymälävarkaudesta tuomittiin 60 prosenttia ja yksityisomaisuuden varkaudesta 17 prosenttia.
Murrosta vankeutta, myymälävarkaudesta sakkoja
Varkausrikos, luvaton käyttö tai moottorikulkuneuvon käyttövarkaus oli tuomion päärikos kaikkiaan 8 800 tapauksessa. Näistä tuomioista 80 prosenttia oli sakkotuomioita.
Yksityiseen asuntoon tehdystä murrosta selvisi sakoilla runsaat 10 prosenttia tuomituista (kuvio 2). Tämä saattaa johtua siitä, että ICCS-luokituksessa murroksi lasketaan myös harhauttamalla asuntoon ”tunkeutuminen”.
Sakkotuomioiden suuri osuus selittyy sillä, että lähes 60 prosenttia tuomioista tuli näpistyksestä, josta voidaan tuomita vain sakkoon.
Tuomioon vaikuttaa myös henkilön muu rikoshistoria. Vuonna 2019 noin 7 000 henkilöllä oli syyksiluettuja varkausrikoksia. Nämä runsaat 7 000 henkilöä olivat tuomiotietojen mukaan syyllistyneet yhteensä lähes 53 500 rikokseen. Eli harva oli syyllistynyt ainoataan yhteen tekoon. Yleisimmin oli syyllistytty useisiin varkausrikoksiin, mutta erilaisia huumausainerikoksia oli myös noin 5 000. Huumeiden käyttöä on mahdollisesti rahoitettu varkausrikoksilla.
Varkausrikoksien tarkempi luokittelu auttaa ymmärtämään tuomioiden vaihtelua: suurenkin rahasumman varastaminen henkilöltä mielletään yleensä vähemmän törkeäksi kuin asuttuun asuntoon murtautuminen. Tämä nähdään myös kuviosta 2. Toki taustalla vaikuttaa myös henkilön muu rikollisuus.
Eri ikäiset tekevät myös erityyppisiä varkausrikoksia. Nuorilla murtorikosten osuus on suurempi kuin vanhemmilla tekijöillä.
Alkoholivarkaudet ovat tunnettu ilmiö, mutta niiden määrä on silti yllättävän suuri. Toinen yllättävä varkauskohde on polttoaine. Toki nämä voivat olla sellaisia varkaustyyppejä, jotka on helpompi selvittää ja joista jää helpommin kiinni.
Näe metsä puilta – kuinka teksti luokiteltiin
Syyttäjän teonkuvausteksti on lyhyt kuvaus siitä, mitä rikoksessa on syyttäjän mukaan tapahtunut. Kyseessä ei ole varsinainen tuomioteksti. Kuvauksien pituus vaihteli yhdestä lauseesta useisiin kymmeniin. Vuoden 2019 teonkuvausteksteistä poimittiin suomenkieliset kuvaukset varkausrikoksista: varkaus, törkeä varkaus ja näpistys sekä niiden yritykset (RL 28:1-3).
Aineistoon tuli yhteensä noin 23 600 teonkuvaustekstiä. Näistä valittiin rikostyyppien osuuksilla painottaen satunnaisesti runsaan 2 000 kuvauksen otos, joka luokiteltiin käsin kansainvälisen rikosluokituksen (ICCS) mukaisiin varkaus- ja murtoluokkiin (ICCS 0501 ja 0502 alakohtineen).
Esimerkiksi julkisiin tiloihin kohdistuneita murtoja (ICCS 050130) tai palveluiden varkauksia (050260) oli aineistossa vain muutamia. Näiden rikostyyppien määrää kasvatettiin tekemällä tekstihakuja, joiden avulla aineistosta poimittiin lisää luokiteltavia kuvauksia. Näin muodostettu 2 100 havainnon otos jaettiin opetus- ja testiaineistoiksi 75/25 suhteella.
Koneoppimismalli tehtiin R-ohjelmistolla, ja suomenkieliset tekstit purettiin sanojen perusmuotoihin eli jokainen kuvausteksti purettiin yksittäisiksi sanoiksi ja sanoista otettiin perusmuoto eli lemma. Lisäksi tekstistä poistettiin välimerkit, numerot, pronominit ja konjunktiot, joita ei tässä analyysissa koettu tarpeelliseksi.
Lopulliseksi koneoppimisalgoritmiksi valikoitui satunnaismetsä (Random Forest). Mallin parametrit haettiin ristiinvalidoinnilla ja vinoutunut otos huomioitiin painottamalla harvinaisempia luokkia. Koko mallin tarkkuus (accuracy) oli 78,9 % mitä voi pitää luonnollisen kielen luokittelussa varsin hyvänä. Joidenkin luokkien kohdalla päästiin testiaineistossa yli 90 prosentin sensitiivisyys ja spesifisyysarvoihin.
Sensitiivisyys kuvaa mallin kykyä tunnistaa ”positiiviset” eli luokkaan kuuluvat arvot ja spesifisyys kykyä tunnistaa luokkaan kuulumattomat eli ”negatiiviset” arvot. Tällaisia hyvin tunnistettuja luokkia olivat esimerkiksi myymälävarkaus (ICCS 050231) ja yksityisen omaisuuden varkaus henkilöltä (ICCS 050221).
Toisaalta joidenkin harvinaisempien luokkien, kuten julkisen omaisuuden varkauden (ICCS 050240), kohdalla sensitiivisyys oli vain 15 prosenttia. Sen sijaan spesifisyys oli 99 prosenttia. Testiaineistossa oli seitsemän tähän luokkaan kuuluvaa havaintoa, ja näistä malli ennusti vain yhden kuuluvaksi kyseiseen luokkaan. Toisaalta malli ennusti tähän luokkaan kaksi havaintoa, jotka eivät todellisuudessa siihen kuuluneet.
Luokittelu tehtiin myös lineaarisella tukivektorimallilla (Support Vector Machine). Tukivektorimalli pärjäsi hieman satunnaismetsää huonommin ja sen tarkkuus oli 74 prosenttia. Mallin ennustekyky oli huonompi etenkin harvinaisempien luokkien kohdalla.
Valmiiksi luokiteltua aineistoa kasvattamalla päästäisiin todennäköisesti parempaan lopputulokseen, mutta aineiston luokittelu ”käsin” vie myös aikaa. Onko oheinen kuvaus yritys- vai yksityisomaisuuden varkaus:
”A ja B ovat yhdessä anastaneet yritys C:n, (yksityishenkilöiden) D:n, E: ja F:n omaisuutta X sijaitsevista C:n tiloista ja pakettiautosta syytekohdassa 1 kuvatun teon yhteydessä. A ja B ovat anastaneet C:n omistamia autonavaimia, työkaluja, elektroniikkaa ja alkoholijuomia, D: omistamia vaatteita ja kassin, E:n omistamia vaatteita, makuupussin, alkoholijuomia ja kassin sekä E: omistamia kalastusvälineitä, vaatteita, elektroniikkaa, retkeilyvarusteita, auton varaosia ja autonavaimet.”
Teot on pyritty luokittelemaan törkeyden mukaan tai sen mukaan, mitä siinä on ensimmäisenä kuvattu. Tässä on kuvattu yritysomaisuuden varkautta.
Tilastotuotantoon?
Vaikka malli ei pääse täydelliseen tarkkuuteen, on sen tuoma lisätieto hyödyllistä tilastoinnin kannalta. Yli 20 000 syytetekstin joukkoon mahtuu monenlaista eri tekoa, ja näihin on nyt saatu hieman enemmän jaottelua pelkän rikoslain kohdan lisäksi.
Koneoppimismenetelmän voisi ottaa lähitulevaisuudessa mukaan myös normaaliin tilastotuotantoon tuomaan tarkempaa tietoa rikosnimikekohtaisen luokittelun oheen. Tarkempaa tietoa voisi tuottaa esimerkiksi pahoinpitelyn tekotavasta tai -paikasta, tai vaikka ympäristörikoksista. Sitä varten prosessia pitää kuitenkin vielä kehittää.
Kirjoittajat työskentelevät yliaktuaareina Tilastokeskuksen Tieto- ja tilastopalvelut osastolla. Kimmo Haapakangas vastaa Rikos- ja pakkokeinotilastosta, Salla Tuominiemi Syytetyt, tuomitut ja rangaistukset -tilastosta.
Avainsanat:
Miksi tätä sisältöä ei näytetä?
Tämä sisältö ei näy, jos olet estänyt evästeiden käytön. Jos haluat nähdä sisällön, tarkista evästeasetuksesi.