Anonyymi
Et ole kirjautunut
Keskustelu
Muokkaukset
Luo tunnus
Kirjaudu sisään
ApoWiki
Haku
Muokataan osiota sivusta
Bayesin teoreema
ApoWikistä
Nimiavaruudet
Sivu
Keskustelu
Lisää
Lisää
Sivun toiminnot
Lue
Muokkaa
Historia
Varoitus:
Et ole kirjautunut sisään. IP-osoitteesi näkyy julkisesti kaikille, jos muokkaat. Jos
kirjaudut sisään
tai
luot tunnuksen
, muokkauksesi yhdistetään käyttäjänimeesi ja saat paremman käyttökokemuksen.
Mainosroskan tarkastus.
Älä
täytä tätä!
==Teoreeman esittely== Tarkoitus on esimerkkien avulla tutustuttaa lukija tarkasteltavien kysymysten luonteeseen. Jos perusajatus on jo tuttu, tämän osion voi hyvin ohittaa. ===Esimerkki teoreemaan johtavasta järkeilystä=== Pertti pitää kekseistä, varsinkin kookoskekseistä. Eräänä päivänä hän on ostanut itselleen kaksi keksipakettia, ykköspaketissa on 40 kookoskeksiä, kakkospaketissa taas keksilajitelma, jossa on 10 kaurakeksiä, 10 kanelikeksiä, 10 suklaakeksiä ja 10 kookoskeksiä. Pertti avaa paketit ja keskittyy töihinsä, nappaa sitten puolihuolimattomasti keksin avoimesta paketista ja aikoo syödä sen saman tien, mutta tulee sitten ajatelleeksi, ettei ollenkaan tiedä, kummasta paketista keksi on peräisin. Koska älylliset pähkinät kiehtovat keksiä suljetussa kourassaan pitelevää Perttiä, hän rupeaa miettimään vaihtoehtoja asian selvittämiseksi: * Jos keksi on kaura-, kaneli- tai suklaakeksi, sen on pakko olla peräisin kakkospaketista, koska sellaisia ei ole ykköspaketissa. * Jos keksi onkin kookoskeksi, se voi olla peräisin kummasta paketista tahansa. Pertti avaa kouransa ja toteaa keksin kookoskeksiksi. Siispä hän ei nyt tiedä, kummasta paketista se on peräisin. Asian voisi tietysti selvittää laskemalla jommankumman paketin keksit, nythän toisessa on 39, toisessa 40. Laiskana miehenä Pertti haluaa mieluummin laskea 39 keksiä kuin 40, niinpä hän päättää laskevansa sen paketin keksit, josta kädessä oleva kookoskeksi todennäköisemmin on peräisin. Voiko käytettävissä olevasta informaatiosta päätellä jotain tästä todennäköisyydestä? Selvää siis on, että molemmat paketit ovat nyt mahdollisia vaihtoehtoja, mutta siitä ei ilmeisesti seuraa, että ne olisivat yhtä todennäköisiä. Jos ne nimittäin sitä olisivat, niin lajitelmapaketin muilla kuin kookoskekseillä ei olisi ollut mitään vaikutusta tilanteeseen liittyviin todennäköisyyksiin. Entä jos toisessa paketissa olisi ollut pelkkiä kookoskeksejä ja toisessa vain yksi kookoskeksi 39 muunlaisen keksin seassa? Ilmeisestikään todennäköisyys tämän keksin satunnaiselle sormiin osumiselle ei ole sama kuin kookoskeksipaketin tarkemmin yksilöimättömän keksin saamistodennäköisyys. Ei siis ole kovinkaan vaikeaa päätellä, että ykköspaketti on todennäköisempi: koska keksi poimittiin satunnaisesti ja kaikilla kekseillä oli alun perin oletettavasti yhtä suuri käteenosumistodennäköisyys<ref>Näin siksi, että tilannekuvauksesta ei voi muutakaan päätellä; tätä kutsutaan "riittämättömien syiden periaatteeksi": todennäköisyysjakaumaa pidetään tasaisena eli kaikkia vaihtoehtoja yhtä todennäköisinä, ellei muutakaan pystytä osoittamaan.</ref>, niin jommastakummasta täydestä paketista valittu keksi on 0,5:n todennäköisyydellä ykköspaketin kookoskeksi<ref>Suotuisia tapauksia on 40 kaikkiaan 80:sta.</ref> mutta vain 0,125:n todennäköisyydellä kakkospaketin kookoskeksi<ref>Suotuisia tapauksia on 10 kaikkiaan 80:sta.</ref> (ja olisi ollut 0,375:n todennäköisyydellä kakkospaketin jokin muu kuin kookoskeksi<ref>Suotuisia tapauksia: (loput) 30 kaikkiaan 80:sta.</ref>). Vaikka Pertillä nyt siis onkin hyvä syy laskea pikemminkin ykkös- kuin kakkospaketin keksit, koko ajatus keksien laskemisesta rupeaa tässä vaiheessa kuitenkin tuntumaan turhan työläältä. Hän päättääkin, ettei laske keksejä, jos vain voi selvittää itselleen, kuinka todennäköistä tässä tilanteessa täsmällisesti ottaen on, että keksi on peräisin ykköspaketista. # Koska ykköspaketista saadun kookoskeksin alkuperäistodennäköisyys siis on 0,5 (umpimähkäinen valinta kahdesta paketista, minkä jälkeen ykköspaketista nousee välttämättä juuri kookoskeksi) ja kakkospaketista saadun vastaavasti tasan neljäsosa siitä (taaskin umpimähkäinen paketinvalinta, minkä jälkeen 0,25:n todennäköisyys kookoskeksin saamiselle), vaikuttaa siltä, että ykköspaketin todennäköisyys on 0,5 / (0,5 + 0,125)<ref>Kookospaketin keksien (40) osuus kaikista suotuisista kekseistä (40 + 10)</ref> = 0,5 / 0,625 = 0,8. # Ajatusvauhtiin päästyään Pertti ei malta lopettaa tähän. Entäs, jos paketteja olisikin ollut kolme eikä kaksi? Jos hän olisikin ostanut kaksi kookoskeksipakettia ja yhden lajitelman, satunnainen kookoskeksi olisi saatu jommastakummasta ''kookoskeksipaketista'' todennäköisyydellä 2/3 / (2/3 + 1/3 * 1/4)<ref>Kookoskeksipakettien osuus kaikista paketeista (2/3) jaettuna kookoskeksien osuudella kaikista kekseistä, joka saadaan laskemalla yhteen kussakin pakkauksessa olevien kookoskeksien osuudet suhteessa kaikkiin pakkauksessa oleviin kekseihin: (1/3 * 1 + 1/3 * 1 + 1/3 * 1/4 = 2/3 + 1/3 * 1/4)</ref> = 2/3 / (8/12 + 1/12) = 2/3 / 9/12 = 2/3 / 3/4 = 8/9 = 0,888... # Jos taas kookoskeksipaketteja olisikin ollut vain yksi ja lajitelmapaketteja kaksi, kookoskeksipaketin todennäköisyydeksi olisi jäänyt 1/3 / (1/3 + 2/3 * 1/4)<ref>Kookoskeksipakettien osuus kaikista paketeista (1/3) jaettuna kookoskeksien osuudella kaikista kekseistä, joka saadaan laskemalla yhteen kussakin pakkauksessa olevien kookoskeksien osuudet suhteessa kaikkiin pakkauksessa oleviin kekseihin: (1/3 * 1 + 1/3 * 1/4 + 1/3 * 1/4 = 1/3 + 2/3 * 1/4)</ref> = 1/3 / (2/6 + 1/6) = 1/3 / 3/6 = 1/3 / 1/2 = 2/3 = 0,666... # Koska töiden jatkaminen ei jostain syystä Perttiä juuri nyt hirveästi kiinnosta, hän päättää miettiä asiaa vielä siltäkin kannalta, mitä vaikutusta todennäköisyyksiin olisi lajitelmapaketin koostumuksen muuttamisella: Jos puolet lajitelmapaketin kekseistä olisi ollut kookoskeksejä, niin kahden paketin tapauksessa kookoskeksipaketin todennäköisyys olisi ollut 1/2 / (1/2 + 1/2 * 1/2)<ref>Kookospaketin keksien (40) osuus kaikista suotuisista kekseistä (40 + 20)</ref> = 1/2 / (2/4 + 1/4) = 1/2 / 3/4 = 4 / 6 = 2/3 = 0,666... # Tilanteessa, jossa kookoskeksejä olisi ollut lajitelmasta vain joka kahdeksas, lukemat olisivat sen sijaan olleet 1/2 / (1/2 + 1/2 * 1/8)<ref>Kookospaketin keksien (40) osuus kaikista suotuisista kekseistä (40 + 5)</ref> = 1/2 / (8/16 + 1/16) = 1/2 / 9/16 = 16/18 = 8/9 = 0,888... #:Kookoskeksipaketin todennäköisyys oli siis sitä ''suurempi'', mitä ''suuremman'' osan ne muodostivat ''kaikista paketeista'', mutta sitä ''pienempi'', mitä ''suuremman'' osan kookoskeksit muodostivat ''lajitelmapaketin'' sisällöstä. # Entäs sitten se tapaus, jossa pöydällä ei olisikaan kookoskeksipaketteja vaan ainoastaan erilaisia lajitelmapaketteja, vaikkapa sellainen, jossa kookoskeksejä oli puolet, ja sellainen, jossa niitä oli vain joka neljäs? Ensinmainitun paketin todennäköisyys saadun kookoskeksin alkuperänä olisi nyt 1/2 * 1/2 / (1/2 * 1/2 + 1/2 * 1/4)<ref>Ensimmäisessä paketissa olleiden kookoskeksien osuus kaikista kekseistä (1/2 * 1/2) jaettuna kookoskeksien osuudella kaikista kekseistä, joka saadaan laskemalla yhteen molemmissa pakkauksissa olevien kookoskeksien osuudet suhteessa kaikkiin pakkauksessa oleviin kekseihin: (1/2 * 1/2 + 1/2 * 1/4)</ref> = 1/4 / (2/8 + 1/8) = 1/4 / 3/8 = 8/12 = 2/3 = 0,666... Nyt Pertti kokee ahaa-elämyksen: näitä todennäköisyyksiä ei oikeastaan tarvitsekaan laskea erikseen järkeilemällä, vaan voi oikaista: tietynlaisen keksipaketin todennäköisyys saadun kookoskeksin alkuperäksi on ilmeisesti suoraan verrannollinen tällaisten pakettien suhteelliseen osuuteen kaikista paketeista ja kookoskeksien suhteelliseen osuuteen kyseisenlaisen paketin kekseistä<ref>Todennäköisyys kasvaa sitä mukaa, kun toivottavien pakettien määrä, sekä kookoskeksien määrä toivottavissa paketeissa kasvavat.</ref> mutta kääntäen verrannollinen kookoskeksin saamisen kokonaistodennäköisyyteen<ref>Siis siihen, että saatiin kookoskeksi, mistä paketista se sitten olikaan peräisin. Toisin sanoen todennäköisyys pienenee sitä mukaa, kun "ei-toivotuissa" paketeissa olevien kookoskeksien osuus kaikista kookoskekseistä kasvaa.</ref>. Tämän ahaa-elämyksen tuloksen Pertti päättää kirjoittaa vastaisen varalta muistiin matemaattisena kaavana: :<math>P(ekapaketti|kookoskeksi) = \frac{P(kookoskeksi|ekapaketti) \cdot P(ekapaketti)}{P(kookoskeksi)}</math> <math>P(ekapaketti|kookoskeksi)</math>-merkinnän voi tässä lukea "todennäköisyys, että paketeista satunnaisesti poimittu kookoskeksi on peräisin ykköspaketista", <math>P(kookoskeksi|ekapaketti)</math> vastaavasti "todennäköisyys, että ykköspaketista saadaan satunnaisesti kookoskeksi", <math>P(ekapaketti)</math>: "todennäköisyys, että satunnaisesti napattu paketti on ykköspaketti", ja <math>P(kookoskeksi)</math> "todennäköisyys, että paketeista satunnaisesti poimittu keksi on kookoskeksi". Tämän kaavan käyttöönotto muuttaa aiempien esimerkkitapausten laskennan rutiinitehtäväksi ja tekee uusienkin muunnelmien ratkaisemisen yhtä suoraviivaiseksi. ===Teoreeman käyttö: esimerkkitapausten tarkastuslaskut=== Edellä päättelemällä saadut todennäköisyydet voi nyt laskea suoraan tähän kaavaan tehdyillä sijoituksilla. Seuraavassa numerointi vastaa edelläkäytettyä: # <math>P(ekapaketti|kookoskeksi) = \frac{\tfrac{40}{40} \cdot \tfrac{1}{2}}{\tfrac{50}{80}} = \frac{4}{5} = 0,8</math> # <math>P(ekapaketti|kookoskeksi) = \frac{\tfrac{40}{40} \cdot \tfrac{2}{3}}{\tfrac{90}{120}} = \frac{8}{9} = 0,888...</math> # <math>P(ekapaketti|kookoskeksi) = \frac{\tfrac{40}{40} \cdot \tfrac{1}{3}}{\tfrac{60}{120}} = \frac{2}{3} = 0,666...</math> # <math>P(ekapaketti|kookoskeksi) = \frac{\tfrac{40}{40} \cdot \tfrac{1}{2}}{\tfrac{60}{80}} = \frac{2}{3} = 0,666...</math> # <math>P(ekapaketti|kookoskeksi) = \frac{\tfrac{40}{40} \cdot \tfrac{1}{2}}{\tfrac{45}{80}} = \frac{8}{9} = 0,888...</math> # <math>P(ekapaketti|kookoskeksi) = \frac{\tfrac{20}{40} \cdot \tfrac{1}{2}}{\tfrac{30}{80}} = \frac{2}{3} = 0,666...</math> Kaikki esimerkit siis täsmäävät. ===Toinen esimerkki teoreeman käytöstä=== Otetaan tarkastelun lähtökohdaksi taaskin Pertin kaksi keksipurkillista: ykköspurkissa on tällä kertaa 10 suklaakeksin lisäksi 30 kookoskeksiä, kakkospurkissa taas molempia laatuja 20 kappaletta. Esimerkkitapahtumat etenevät niin, että Pertti kopeloi taaskin sattumanvaraisesti käteensä toisen purkeista, nostaa siitä yhden keksin niin umpimähkäisesti, ettei jälkeenpäin enää itsekään tiedä, kummasta purkista se oli peräisin, mutta havaitsee saaneensa taaskin kookoskeksin. Millä todennäköisyydellä se nyt on peräisin ykköspurkista? Varmasti se on peräisin siitä purkista, jossa on nyt jäljellä vain 39 keksiä, mutta Pertti ei nytkään käy laskemaan keksimääriä vaan arvioi tilannetta vain edelläannetun informaation perusteella. Intuitiivisesti on helppo nähdä, että koska kookoskeksejä on ykköspurkissa suhteellisesti(kin) enemmän kuin kakkospurkissa, ykköspurkki on tässä tapauksessa kakkospurkkia todennäköisempi.<ref>Tämä on sitä helpompi huomata, mitä enemmän purkkien sisällöt alun perin poikkesivat: esim. 39 kookos + 1 suklaa -purkki olisi selvästi todennäköisempi kuin 1 kookos + 39 suklaa -purkki.</ref> Bayesin teoreema täsmentää tämän summittaisen arvion antamalla tapahtuman tarkan todennäköisyyden: :<math>P(ekapurkki|kookoskeksi)\,</math> on todennäköisyys sille, että Pertti oli tarttunut ykköspurkkiin siinä tapauksessa, että hän on poiminut purkistaan kookoskeksin. Juuri tämän todennäköisyyden haluamme siis selvittää: :::<math>P(ekapurkki|kookoskeksi)\,= ?</math> :<math>P(kookoskeksi)\,</math> on lähtötilanteessa vallinnut todennäköisyys, että lopulta Pertti saa sattumalta käteensä kookoskeksin. Koska jokaisella keksillä on alun perin yhtä suuri todennäköisyys päätyä lopuksi Pertin käteen, kookoskeksin saamistodennäköisyys vastaa kookoskeksien suhteellista osuutta kaikista purkeissa olevista kekseistä. Kookoskeksejä on ykköspurkissa 30 ja kakkospurkissa 20, yhteensä siis 50. Koska kummassakin purkissa on alun perin 40 keksiä, keksejä on kaikkiaan 80. Näin saadaan :::<math>P(kookoskeksi) = \frac{50}{80}=0,625</math> :<math>P(ekapurkki)\,</math> on todennäköisyys, että Pertti tarttuu sattumanvaraisesti nimenomaan ykköspurkkiin. Kahdesta purkkivaihtoehdosta kumpikin on alun perin yhtä todennäköinen, joten tämä todennäköisyys on 0,5. ::: <math>P(ekapurkki)=\frac{1}{2}=0,5</math> :<math>P(kookoskeksi|ekapurkki)\,</math> on todennäköisyys, että Pertti ykköspurkkiin tartuttuaan poimii siitä juuri kookoskeksin. Koska ykköspurkin kaikkiaan 40 keksistä tasan 30 on kookoskeksejä, saadaan todennäköisyydeksi :::<math>P(kookoskeksi|ekapurkki)=\frac{30}{40}=0,75</math> Kaiken tämän informaation avulla voimme nyt laskea todennäköisyyden sille, että Pertin valitsema kookoskeksi on peräisin juuri ykköspurkista: :<math>P(ekapurkki|kookoskeksi) = \frac{P(kookoskeksi|ekapurkki) P(ekapurkki)}{P(kookoskeksi)} = \frac{0,75 \cdot 0,5}{0,625} = 0,6</math> Kysymys on siis siitä, että ykköspurkki on sitä todennäköisempi, mitä suurempi siinä on kookoskeksien osuus ja mitä todennäköisemmin se tuli sattumanvaraisesti valituksi, ja sitä epätodennäköisempi, mitä todennäköisemmin kookoskeksi saatiin "purkista riippumatta". Näiden seikkojen järkevyyden voi mielessään todeta vaikkapa seuraavilla ajatuskokeilla: # Jos ykköspurkin kookoskeksipitoisuutta olisi alun perin lisätty, kookoskeksiin päätyminen olisi entisestään lisännyt ykköspurkin jälkikäteistodennäköisyyttä kakkospurkkiin verrattuna. # Jos taas ykköspurkkiin olisikin lisätty suklaakeksejä, sen jälkikäteistodennäköisyys olisi nykyistä pienempi. # Jos tarjolla olisi ollut kolmaskin purkki, ykköspurkin jälkikäteistodennäköisyys olisi nykyistä pienempi. # Jos tarjolla olisi ollut vain ykköspurkki, sen "valinta" olisi nykyistä todennäköisempää (vrt. yksipuoluevaalit). # Jos kakkospurkissa olisi ollut suhteessa nykyistä enemmän kookoskeksejä, ykköspurkkivaihtoehdon jälkikäteistodennäköisyys olisi nykyistä pienempi (koska kakkospurkin todennäköisyys olisi nykyistä suurempi); tässä tapauksessa myös kookoskeksin saamisen kokonaistodennäköisyys olisi kasvanut. # Jos kakkospurkissa olisi ollut suhteessa nykyistä enemmän muita kuin kookoskekseja, ykköspurkkivaihtoehdon jälkikäteistodennäköisyys olisi nykyistä suurempi (koska kakkospurkin todennäköisyys olisi nykyistä pienempi); tällöin myös kookoskeksin saamisen kokonaistodennäköisyys olisi pienentynyt.
Yhteenveto:
Kaikki ApoWikiin tehtävät tuotokset katsotaan julkaistuksi GNU Free Documentation License 1.3 or later -lisenssin mukaisesti (katso lisätietoja sivulta
ApoWiki:Tekijänoikeudet
). Jos et halua, että tekstiäsi voidaan muokata ja uudelleenkäytetään vapaasti, älä tallenna sitä.
Lupaat myös, että kirjoitit tekstisi itse, tai kopioit sen jostain vapaasta lähteestä.
Älä käytä tekijänoikeuden alaisa materiaalia ilman lupaa!
Peruuta
Muokkausohjeet
(avautuu uuteen ikkunaan)
Valikko
Valikko
Etusivu
Kahvihuone
Ilmoitustaulu
Lukusuositukset
Tuoreet muutokset
Luokkahakemisto
Satunnainen sivu
Kiitokset
Linkit
Ohje
Wiki-työkalut
Wiki-työkalut
Toimintosivut
Sivutyökalut
Sivutyökalut
Käyttäjäsivun työkalut
Lisää
Tänne viittaavat sivut
Linkitettyjen sivujen muutokset
Sivun tiedot
Sivun lokit