Todennäköisyysrajojen vertailu

ApoWikistä
Versio hetkellä 13. maaliskuuta 2010 kello 16.43 – tehnyt Apollos (keskustelu | muokkaukset) (Vielä kehittelyä)

Suunnitteluteoreettisen tarkoituksellisuuspäättelyn keskeinen, vertaisarvioitu menetelmä on William Dembskin kehittämä, klassisen1 tilastotieteen lähestymistapaa soveltava suunnittelusignaalien tunnistus. Klassisissa tilastopäättelyissä kysymys on tyypillisesti nollahypoteesin2 uskottavuuden testaamisesta punnitsemalla sitä, miten todennäköisiä tehdyt havainnot kyseisen hypoteesin pohjalta olisivat: jos havaintotulos on hypoteesin valossa riittävän todennäköinen, hypoteesi jää päättelyssä voimaan; muussa tapauksessa se on hylättävä.3

Käytännössä tämä lähestymistapa perustuu siihen, että mahdolliset tutkimustulokset luokitellaan sen mukaan, miten todennäköisinä niitä voidaan kulloinkin testattavan hypoteesin valossa pitää. Hypoteesit ovat tyypillisesti todennäköisyysjakaumia, ja kukin todennäköisyysjakauma yleensä antaa nollasta poikkeavan todennäköisyyden mille hyvänsä tutkimusasetelman puitteissa mahdolliselle havainnolle. Siksi klassisen tilastopäättelyn toimivuus edellyttää, että hypoteesi voidaan hylätä, vaikka havaintotulos onkin sen valossa periaatteessa mahdollinen4. Muu johtaisi mielettömyyteen.5

Dembski siis on soveltanut tätä lähestymistapaa tunnettujen6 tarkoituksettomien syiden selitysvoiman ja siten niihin vetoavien syntyhypoteesien uskottavuuden mittaamiseen. Klassisen tilastotieteen keskeisen kehittäjän Ronald Fisherin tavoin hänkin on määrittänyt mahdollisten havaintotulosten joukosta tutkittavan hypoteesin hylkäysalueen (engl. rejection region) eli sellaisen rajan, jota epätodennäköisempiä tuloksia ei voi pitää hypoteesin uskottavuuden kannalta hyväksyttävinä. Kaikki hylkäysaluemääritykset edellyttävät jonkin todennäköisyysalarajan määräämistä tutkittavista hypoteeseista johdettaville havaintoaineistotodennäköisyyksille.

Oheisesta taulukosta näemme sekä klassisen tilastotieteen omaksumat että Dembskin suunnittelupäättelyä varten määrittämät yleispätevän hylkäysalueen rajat7. Mitä pienempi todennäköisyys määrätään, sitä tiukemmin hypoteeseista pidetään kiinni8. Vertailun ja havainnollisuuden vuoksi tässä taulukossa on mukana monia muitakin kiinnostaviksi katsottuja todennäköisyyksiä ja todennäköisyysrajoja kuin klassisen tilastotieteen mukaiset ja Dembskin yleispäteväksi9 esittämä.


Todennäköisyys10 Todennäköisyyden 2-kantaisen logaritmin vastaluku eli informaatioarvo11 bitteinä12 Tapahtuman aihepiiri Tapahtuman kuvaus Tapahtuman merkitys13
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-1 10-10.14
0,166'666'666'7 2,6 Nopanheitto15 Kuutonen yhdellä heitolla
0,05

(alitettava tn-raja)

4,3 Klassinen tilastotiede Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi melkein merkitsevinä.16 On syytä epäillä, että oletettu selitys (todennäköisyysjakauma) on väärä. Sitä ei ole osoitettu vääräksi, mutta sen selitysvoima on kyseenalainen.
0,027'777'777'8 5,2 Nopanheitto Kaksi noppaa, yksi heitto, kaksi kuutosta
0,01

(alitettava tn-raja)

6,6 Klassinen tilastotiede Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi merkitsevinä.16 On syytä pitää oletettua selitystä virheellisenä ja pyrkiä etsimään sen tilalle jotakin uskottavampaa.
0,004'629'629'6 7,8 Nopanheitto Kolme noppaa, yksi heitto, kolme kuutosta
0,001

(alitettava tn-raja)

9,97 Klassinen tilastotiede Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi erittäin merkitsevinä.16 Oletettu selitys on ilman muuta hylättävä. Ellei uskottavampaa selitystä ole tarjolla, on rehellisyyden nimissä myönnettävä, ettei tutkimuskohteelle tunneta toimivaa selitystä. Sellaista tietenkin sitäkin aktiivisemmin haetaan.
0,000'976'562'5 10 (tasan) Lantinheitto 10 lanttia, yksi yritys, tulos 10 kruunaa
0,000'771'604'9 10,3 Nopanheitto Neljä noppaa, yksi heitto, neljä kuutosta
0,000'128'600'8 12,9 Nopanheitto Viisi noppaa, yksi heitto, viisi kuutosta
0,000'021'433'5 15,5 Nopanheitto Kuusi noppaa, yksi heitto, kuusi kuutosta
0,000'003'572'2 18,1 Nopanheitto Seitsemän noppaa, yksi heitto, seitsemän kuutosta
0,000'001'539'1 19,3 Pokeri Hyvin sekoitettu pakka, yksi yritys, sokkona valitut 5 korttia muodostavat kuningasvärisarjan17.
0,000'000'595'4 20,7 Nopanheitto Kahdeksan noppaa, yksi heitto, kahdeksan kuutosta
0,000'000'099'2 23,3 Nopanheitto Yhdeksän noppaa, yksi heitto, yhdeksän kuutosta
0,000'000'065'0 23,9 Lottoarvonta18 Sama voittorivi kahdella peräkkäisellä kierroksella19
0,000'000'016'5 25,8 Nopanheitto 10 noppaa, yksi yritys, 10 kuutosta
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-11 10-20.
4,227 · 10-15 47,7 Lottoarvonta Sama voittorivi kolmella peräkkäisellä kierroksella
3,517 · 10-20 64,6 Nopanheitto 25 noppaa, yksi heitto, 25 kuutosta
10-20

(tn-raja)

66,4 Evoluutiobiologia 1 CCC Biokemisti Michael Behen mukaan tämä on probabilistinen vaativuusaste, jonka ohjaamaton mutaatio-luonnonvalintamekanismi voi vielä ylittää melko usein, jos lajin populaatiokoko ja mutaatiotaajuus ovat riittävän suuria.
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-21 10-30.
5,862 · 10-21 67,2 Nopanheitto 26 noppaa, yksi heitto, 26 kuutosta
2,748 · 10-22 71,6 Lottoarvonta Sama voittorivi neljällä peräkkäisellä kierroksella
1,787 · 10-29 95,5 Lottoarvonta Sama voittorivi viidellä peräkkäisellä kierroksella
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-31 10-40.
7,889 · 10-31 100 (tasan) Lantinheitto 100 lanttia, yksi yritys, tulos 100 kruunaa
1,162 · 10-36 119,4 Lottoarvonta Sama voittorivi kuudella peräkkäisellä kierroksella
2,062 · 10-40 131,8 Nopanheitto 51 noppaa, yksi heitto, 51 kuutosta
10-40

(tn-raja)

132,9 Evoluutiobiologia 2 CCC Biokemisti Michael Behen mukaan tämä on probabilistinen vaativuusaste, jota ohjaamaton mutaatio-luonnonvalintamekanismi todennäköisesti ei ole kyennyt ylittämään teoreettisen tarkastelun sen enempää kuin käytännön havaintojenkaan mukaan kertaakaan elämän historian aikana.
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-41 10-50.
3,437 · 10-41 134,4 Nopanheitto 52 noppaa, yksi heitto, 52 kuutosta
7,553 · 10-44 143,2 Lottoarvonta Sama voittorivi seitsemällä peräkkäisellä kierroksella
1,579 · 10-50 165,4 Nopanheitto 64 noppaa, yksi heitto, 64 kuutosta
10-50

(alitettava tn-raja)

166,1 Sovellettu probabilistiikka Matemaatikko Emile Borelin ehdotus yleiseksi todennäköisyysrajaksi Borelin mukaan tätä epätodennäköisemmät ilmiöt ovat käytännössä mahdottomia.20
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-51 10-60.
4,910 · 10-51 167,1 Lottoarvonta Sama voittorivi kahdeksalla peräkkäisellä kierroksella
2,631 · 10-51 168,0 Nopanheitto 65 noppaa, yksi heitto, 65 kuutosta
3,193 · 10-58 191,0 (190,997) Lottoarvonta Sama voittorivi yhdeksällä peräkkäisellä kierroksella
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-61 10-70.
2,076 · 10-65 214,9 Lottoarvonta Sama voittorivi 10 peräkkäisellä kierroksella
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-71 10-80.
1,349 · 10-72 238,7 Lottoarvonta Sama voittorivi 11 peräkkäisellä kierroksella
1,531 · 10-78 258,5 Nopanheitto 100 noppaa, yksi yritys, 100 kuutosta
8,774 · 10-80 262,6 Lottoarvonta Sama voittorivi 12 peräkkäisellä kierroksella
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-81 10-90.
5,704 · 10-87 286,5 Lottoarvonta Sama voittorivi 13 peräkkäisellä kierroksella
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-91 10-100.
3,709 · 10-94 310,4 Lottoarvonta Sama voittorivi 14 peräkkäisellä kierroksella
2,493 · 10-100 330,9 Nopanheitto 128 noppaa, yksi heitto, 128 kuutosta
10-100 (tasan) 332,2 Matematiikan opetus Yksi mahdollisuus googolista "Googol" on otettu käyttöön havainnollistamaan "käsittämättömän suuren luvun" ideaa (erotuksena äärettömästä). Niinpä näin epätodennäköisen tapahtuman voi katsoa havainnollistavan "käytännössä mahdottoman" ideaa (erotuksena eksaktista nollatodennäköisyydestä, jota voi pitää äärettömän käänteislukuna).
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-101 10-110.
4,154 · 10-101 333,5 Nopanheitto 129 noppaa, yksi heitto, 129 kuutosta
2,411 · 10-101 334,2 Lottoarvonta Sama voittorivi 15 peräkkäisellä kierroksella
1,568 · 10-108 358,1 Lottoarvonta Sama voittorivi 16 peräkkäisellä kierroksella
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-111 10-120.
1,019 · 10-115 382,0 (381,994) Lottoarvonta Sama voittorivi 17 peräkkäisellä kierroksella
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-121 10-130.
6,627 · 10-123 405,9 Lottoarvonta Sama voittorivi 18 peräkkäisellä kierroksella
4,308 · 10-130 429,7 Lottoarvonta Sama voittorivi 19 peräkkäisellä kierroksella
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-131 10-140.
2,801 · 10-137 453,6 Lottoarvonta Sama voittorivi 20 peräkkäisellä kierroksella
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-141 10-150.
1,821 · 10-144 477,5 Lottoarvonta Sama voittorivi 21 peräkkäisellä kierroksella Tulos ei vielä yllä Dembskin universaaliin todennäköisyysrajaan.
4,803 · 10-146</ref> 482,7 Pokeri 25 hyvin sekoitettua pakkaa, sokkona valitaan kertaalleen 5 korttia pakastaan, saadaan kuningasvärisarja pakkaa kohti, yhteensä siis 25 kuningasvärisarjaa17. Tulos ei vielä yllä Dembskin universaaliin todennäköisyysrajaan.
Tästä alkavan jakson tapahtumien todennäköisyys sijoittuu välille
9,999... · 10-151 10-160.
6,559 · 10-151 498,9 Nopanheitto 193 noppaa, yksi heitto, 193 kuutosta Tulos ei vielä yllä Dembskin universaaliin todennäköisyysrajaan.

(alitettava tn-raja)

(saavutettava tai ylitettävä informaatioraja)

Dembskin tarkoituksellisuuspäättely Yleinen todennäköisyysraja (engl. universal probability bound) Dembskin mukaan tätä epätodennäköisemmät määrittyneet (engl. specified, suomennettu m. "täsmennetyt") ilmiöt ovat käytännössä mahdottomia.

Tämä tarkoittaa klassisen tilastotieteellisen päättelyn logiikan mukaan sitä, että käytetty selitysmalli, tässä tapauksessa oletus ohjaamattomasta, tarkoituksettomasta syntyhistoriasta, on hylättävä. Tällöin siis ilmiö on pääteltävä tarkoituksellisesti aiheutetuksi.

1,184 · 10-151 501,4 Lottoarvonta Sama voittorivi 22 peräkkäisellä kierroksella Dembskin yleinen todennäköisyysraja alittuu (eli vastaava informaatioraja ylittyy) lottoarvontojen osalta; ilmiö on määrittynyt (saman voittorivin ensimmäinen esiintymä antaa määrityksen muille).
On pääteltävä, että tällainen lottoarvonnan voittorivin toistuminen viikosta toiseen ei voi olla sattumanvaraista.21
1,093 · 10-151 501,5 Nopanheitto 194 noppaa, yksi heitto, 194 kuutosta Dembskin universaali todennäköisyysraja alittuu (eli vastaava informaatioraja ylittyy) nopanheiton osalta; ilmiö on määrittynyt.
On pääteltävä, ettei tällaista nopanheittotulosta voi syntyä sattumalta.21
7,392 · 10-152 502,0 Pokeri 26 hyvin sekoitettua pakkaa, sokkona valitaan kertaalleen 5 korttia pakastaan, saadaan kuningasvärisarja pakkaa kohti, yhteensä siis 26 kuningasvärisarjaa17. Dembskin universaali todennäköisyysraja alittuu (eli vastaava informaatioraja ylittyy) pokerikäsien osalta; ilmiö on määrittynyt.
On pääteltävä, ettei tällaista kortinvetotulosta voi saada sattumalta.21

22


Viitteet

  1. ^ "fisheriläisen"
  2. ^ "Nollahypoteesi" vastaa suunnilleen ilmausta: "se, mitä yleensä on tapana olettaa" tai "mahdollisimman mitäänsanomaton oletus". Jos esimerkiksi testataan noppakuution heittotuloksia, nollahypoteesina on se, että kaikki arvot ykkösestä kuutoseen esiintyvät samalla todennäköisyydellä, ja puoluekannatusta mitattaessa voidaan nollahypoteesina olettaa, ettei puoluekannatuksissa ole tapahtunut mitään muutoksia sitten edellisen mittauksen.
  3. ^ Tämä muistuttaa Karl Popperin tieteenfilosofista ajatusta siitä, että tieteellisiä hypoteeseja ja teorioita voidaan osoittaa havainnoilla ainoastaan vääriksi muttei koskaan lopullisesti oikeiksi. Nollahypoteeseista siis pidetään kiinni niin kauan kuin niin katsotaan voitavan järkevästi tehdä – muttei kauemmin.
    Klassisen tilastopäättelyn tulokset ovat sikäli epäsymmetrisiä, että vaikka päättelyssä nollahypoteesi jäisikin voimaan, niin tämä ei tarkoita sitä, että se olisi osoitettu todeksi. Todellisuus vain ei poikkea siitä niin paljon, että poikkeama olisi voitu mitata ja osoittaa. Niinpä esim. puoluekannatuksissa kaiken todennäköisyyden mukaan tapahtuu päivittäinkin pikkuhuojuntaa, mutta gallupeissa näkyvät vain tarpeeksi huomattavat muutokset. Samoin tuskin mikään noppa on täysin symmetrinen (ja sen muoto tarkkaan ottaen joka heitolla hieman muuttuukin), mutta hyvin pienet poikkeamat vaihtoehtojen tasaisesta jakaumasta eivät ole mikään ongelma.
  4. ^ eli sen todennäköisyys on suurempi kuin 0 eli aidosti positiivinen
  5. ^ Esimerkiksi gallup-tulos, jonka mukaan 1000 haastatellusta A-puoluetta kannatti 60 % ja B-puoluetta 5 %, tilanteessa, jossa kummankin puolueen väestön keskuudessa nauttima todellinen kannatus on yhtä suuri, on kyllä täysin mahdollinen, joskin kovin epätodennäköinen. Myös tulos, jonka mukaan kaikki vastaajat olisivat kannattaneet samaa puoluetta, olisi mahdollinen selittää oletuksella, että lähes kaikki kannattavatkin sellaista puoluetta, jota otokseen valituista ei tukenut kukaan: "otokseen nyt on vain sattunut osumaan pelkästään tämän puolueen kannattajia, vaikka niiden keskuudessa, joilta ei kysytty, kannatuslukemat saattavatkin olla millaiset hyvänsä, vaikkapa juuri päinvastaisetkin". Kyselytutkimustulosten järkevä yleistäminen koko väestön kantoja kuvaileviksi ei voikaan perustua siihen, mikä on kyselyn tulosten estämättä periaatteessa mahdollista, vaan mikä niiden valossa on todennäköisintä. Muuten otantatutkimukset jäisivätkin merkityksettömiksi; käytäntö on kuitenkin osoittanut ne esim. vaalitulosten ennakoijina varsin tarkoiksi.
  6. ^ tai vain oletettujen, mutta joka tapauksessa probabilistisiin päätelmiin riittävällä tarkkuudella kuvattujen eli yksilöityjen
  7. ^ Suunnittelupäättelyssä tarkoituksettomiin syihin rajoittuvat selitykset ovat oletusarvona eli nollahypoteesin asemassa.
  8. ^ eli sitä epätodennäköisemmiksi käyvät väärät positiiviset tulokset eli nollahypoteesin hylkäys tilanteessa, jossa se tosiasiassa olikin (ainakin suurin piirtein) voimassa – väärät negatiiviset tulokset tulevat tällöin vastaavasti yhä mahdollisemmiksi
  9. ^ Julkisuudessa varsin vähälle huomiolle näkyy jääneen, että Dembski on samalta teoreettiselta pohjalta esittänyt myös erityistilanteisiin soveltuvien rajojen yleisen määrittämistavan. Ks. tästä The Design Inference, s. 199-203.
  10. ^ likiarvo lähimpään desimaaliin pyöristettynä, ellei toisin todeta
  11. ^ Dembskin käyttämä informaatiokäsite samaistuu tähän arvoon. On muitakin informaatiokäsitteitä, joilla on oma merkityksensä ja käyttötapansa.
  12. ^ lähimpään desimaaliin pyöristettynä, ellei toisin todeta
  13. ^ Klassisen tilastotieteen osalta nämä kuvaukset ovat suuntaa-antavia: tutkijoilla on käytettävissään muutakin tietoa kuin tehtyjen havaintojen tilastolliset todennäköisyydet, joten johtopäätöksiin vaikuttavat muutkin tekijät kuin tilastollinen päättely. – Osaltaan tutkimustulosten tulkintaan ja raportointiin vaikuttaa käytännössä myös kulloisenkin tutkijan vapaaseen harkintaan pohjautuva oma arviointi, joka puolestaan on sidoksissa hänen perususkomuksiinsa.
  14. ^ Koska taulukossa todennäköisyydet on esitetty suuremmasta pienempään, myös osavälirajat on esitetty siten, että alkuraja (siis suurempi arvo) on ensimmäisenä ja loppuraja (pienempi arvo) jälkimmäisenä.
  15. ^ Kaikissa tämän taulukon nopanheittoesimerkeissä on käytetty tavallisia kuutionoppia.
  16. > 16,0 16,1 16,2 Dembski on todennut nämä rajat mielivaltaisiksi ja ehdottanut tilalle omaa teoreettisesti perusteltua hypoteesinhylkäysaluerajojen määritystapaansa; ks. The Design Inference, s. 201.
  17. > 17,0 17,1 17,2 Kuningasvärisarja (l. "kuningasvärisuora", engl. royal flush) on paras pokerikäsi; sen muodostavat ässä, kuvakortit ja kymppi, jotka ovat kaikki samaa maata.
  18. ^ 7 oikein 39 mahdollisesta (3.2.2008 voimaan astuneiden sääntöjen mukaan), rehellinen arvonta
  19. ^ Koska joku rivi arvotaan joka kierroksella ja edellisen kierroksen tulos saa olla millainen hyvänsä, seuranta aloitetaan tässä vasta toisesta kierroksesta.
  20. ^ Dembski katsoo tältä osin täydentäneensä Borelin aloittaman työn (The Design Inference, s. 213, alaviite 18).
  21. > 21,0 21,1 21,2 Koska tällainen ilmiö ei selity ohjaamattomalla sattumalla, mahdollisiksi selityksiksi jää vain tarkoituksellisen aiheuttamisen (l. "älyllisen suunnittelun") mukaisia vaihtoehtoja: joko
    • satunnaistamismenettely ei olekaan ollut rehellistä (joko
      • koko tulosta koskeva väite on täysin perätön tai
      • tulos on arvonta- tms. väitteistä huolimatta tosiasiassa suoraan valittu tai sitten
      • tulos on satunnaiseksi väitetyn mutta tosiasiassa olennaisesti deterministiseksi "rukatun" prosessin aiheuttama;
    esim. monet huijaukset ja "taikatemput" perustuvat tällaisiin järjestelyihin) tai
    • tulosta on jotenkin ohjattu ihmisten pystymättä vaikuttamaan asiaan. – Yliluonnolliset ihmeet ja inhimillisesti katsoen äärimmäisen epätodennäköiset mutta silti toteutuneet ennustukset sijoittuvat tähän kategoriaan; tällaisia tapauksia on kaikkiaan raportoitu (eri puolilta maailmaa ja eri kulttuurien piiristä) lukuisia (joskin naturalistit perususkomustensa nojalla suoralta kädeltä väittävät niitä kaikkia joko keksityiksi tai jotenkin luonnollisesti selittyviksi). Raamattukin kertoo tällaisista tapahtumista: esim. 1Sam. 6:1-18 ja 2Aik. 18:18-34.
  22. ^ Tarkastuslaskuja varten tässä vielä eräiden taulukoitujen todennäköisyyksien tarkemmat likiarvot:
    Lottoarvonta
    2 peräkkäiskierrosta: 0,000'000'065'015'544'892
    3 peräkkäiskierrosta: 4,227'021'077'565 * 10-15
    4 peräkkäiskierrosta: 2,748'220'786'266 * 10-22
    5 peräkkäiskierrosta: 1,786'770'719'018 * 10-29
    Nopanheitto:
    10 kuutosta yhdellä yrittämällä: 1,653'817'168'792 * 10-8
    100 kuutosta yhdellä yrittämällä: 1,530'646'707'487 * 10-78
    193 kuutosta yhdellä yrittämällä: 6,558'562'718'010 * 10-151
    194 kuutosta yhdellä yrittämällä: 1,093'093'786'335 * 10-151
    Sadan lantin heitto: 7,888'609'052'210 * 10-31
    Kuningasvärisarja: 0,000'001'539'077'169'329