Todennäköisyysrajojen vertailu

Suunnitteluteoreettisen tarkoituksellisuuspäättelyn keskeinen, vertaisarvioitu menetelmä on William Dembskin kehittämä, klassisen¹ tilastotieteen lähestymistapaa soveltava suunnittelusignaalien tunnistus. Fisheriläisissä tilastopäättelyissä kysymys on tyypillisesti nollahypoteesin² uskottavuuden testaamisesta punnitsemalla sitä, miten todennäköisiä tehdyt havainnot kyseisen hypoteesin pohjalta olisivat: jos havaintotulos on hypoteesin valossa riittävän todennäköinen, hypoteesi jää päättelyssä voimaan; muussa tapauksessa se on hylättävä.³

Käytännössä tämä lähestymistapa perustuu siihen, että mahdolliset tutkimustulokset luokitellaan sen mukaan, miten todennäköisinä niitä voidaan kulloinkin testattavan hypoteesin valossa pitää. Hypoteesit ovat tyypillisesti todennäköisyysjakaumia, ja kukin todennäköisyysjakauma yleensä antaa nollasta poikkeavan todennäköisyyden mille hyvänsä tutkimusasetelman puitteissa mahdolliselle havainnolle. Siksi klassisen tilastopäättelyn toimivuus edellyttää, että hypoteesi voidaan hylätä, vaikka havaintotulos onkin sen valossa periaatteessa mahdollinen⁴. Muu johtaisi mielettömyyteen.⁵

Dembski siis on soveltanut tätä lähestymistapaa tunnettujen tarkoituksettomien syiden selitysvoiman ja siten niihin vetoavien syntyhypoteesien uskottavuuden mittaamiseen. Fisherin tavoin hänkin on määrittänyt mahdollisten havaintotulosten joukosta tutkittavan hypoteesin hylkäysalueen eli sellaisen rajan, jota epätodennäköisempiä tuloksia ei voi pitää hypoteesin uskottavuuden kannalta hyväksyttävinä. Kaikki hylkäysaluemääritykset edellyttävätkin jonkin todennäköisyysalarajan määräämistä tutkittaville hypoteeseille. Oheisesta taulukosta näemme sekä klassisen tilastotieteen omaksumat että Dembskin suunnittelupäättelyä varten määrittämät yleispätevän hylkäysalueen rajat⁶. Mitä pienempi todennäköisyys määrätään, sitä tiukemmin hypoteeseista pidetään kiinni⁷. Vertailun ja havainnollisuuden vuoksi tässä taulukossa on mukana monia muitakin kiinnostaviksi katsottuja todennäköisyyksiä ja todennäköisyysrajoja kuin klassisen tilastotieteen mukaiset ja Dembskin yleispäteväksi⁸ esittämä.

Todennäköisyys⁹	Todennäköisyyden 2-kantaisen logaritmin vastaluku eli informaatioarvo¹⁰ bitteinä¹¹	Tapahtuman aihepiiri	Tapahtuman kuvaus	Tapahtuman merkitys¹²
0,166'666'666'7	2,6	Nopanheitto¹³	Kuutonen yhdellä heitolla
0,05 (alitettava tn-raja)	4,3	Klassinen tilastotiede	Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi melkein merkitsevinä.¹⁴	On syytä epäillä, että oletettu selitys (todennäköisyysjakauma) on väärä. Sitä ei ole osoitettu vääräksi, mutta sen selitysvoima on kyseenalainen.
0,027'777'777'8	5,2	Nopanheitto	Kaksi noppaa, yksi heitto, kaksi kuutosta
0,01 (alitettava tn-raja)	6,6	Klassinen tilastotiede	Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi merkitsevinä.¹⁴	On syytä pitää oletettua selitystä virheellisenä ja pyrkiä etsimään sen tilalle jotakin uskottavampaa.
0,004'629'629'6	7,8	Nopanheitto	Kolme noppaa, yksi heitto, kolme kuutosta
0,001 (alitettava tn-raja)	9,97	Klassinen tilastotiede	Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi erittäin merkitsevinä.¹⁴	Oletettu selitys on ilman muuta hylättävä. Ellei uskottavampaa selitystä ole tarjolla, on rehellisyyden nimissä myönnettävä, ettei tutkimuskohteelle tunneta toimivaa selitystä. Sellaista tietenkin sitäkin aktiivisemmin haetaan.
0,000'771'604'9	10,3	Nopanheitto	Neljä noppaa, yksi heitto, neljä kuutosta
0,000'976'562'5	10 (tasan)	Lantinheitto	10 lanttia, yksi yritys, tulos 10 kruunaa
0,000'001'539'1	19,3	Pokeri	Hyvin sekoitettu pakka, yksi yritys, sokkona valitut 5 korttia muodostavat kuningasvärisarjan.	Kuningasvärisarja (l. "kuningasvärisuora", engl. royal flush) on paras pokerikäsi; sen muodostavat ässä, kuvakortit ja kymppi, jotka ovat kaikki samaa maata.
0,000'000'065'0	23,9	Lottoarvonta¹⁵	Sama voittorivi kahdella peräkkäisellä kierroksella¹⁶
0,000'000'016'5	25,8	Nopanheitto	10 (kuutio)noppaa, yksi yritys, 10 kuutosta
4,227 * 10^-15	47,7	Lottoarvonta	Sama voittorivi kolmella peräkkäisellä kierroksella
10^-20 (tn-raja)	66,4	Evoluutiobiologia	1 CCC	Biokemisti Michael Behen mukaan tämä on probabilistinen vaativuusaste, jonka ohjaamaton mutaatio-luonnonvalintamekanismi voi vielä ylittää melko usein jos lajin populaatiokoko ja mutaatiotaajuus ovat riittävän suuria.
2,748 *10^-22	71,6	Lottoarvonta	Sama voittorivi neljällä peräkkäisellä kierroksella
1,787 * 10^-29	95,5	Lottoarvonta	Sama voittorivi viidellä peräkkäisellä kierroksella
7,889 * 10^-31	100 (tasan)	Lantinheitto	100 lanttia, yksi yritys, tulos 100 kruunaa
1,162 * 10^-36	119,4	Lottoarvonta	Sama voittorivi kuudella peräkkäisellä kierroksella
10^-40 (tn-raja)	132,9	Evoluutiobiologia	2 CCC	Biokemisti Michael Behen mukaan tämä on probabilistinen vaativuusaste, jota ohjaamaton mutaatio-luonnonvalintamekanismi todennäköisesti ei ole kyennyt ylittämään teoreettisen tarkastelun sen enempää kuin käytännön havaintojenkaan mukaan kertaakaan elämän historian aikana.
7,553 * 10^-44	143,2	Lottoarvonta	Sama voittorivi seitsemällä peräkkäisellä kierroksella
10^-50 (alitettava tn-raja)	166,1	Sovellettu probabilistiikka	Matemaatikko Emile Borelin ehdotus yleiseksi todennäköisyysrajaksi	Borelin mukaan tätä epätodennäköisemmät ilmiöt ovat käytännössä mahdottomia.¹⁷
4,910 * 10^-51	167,1	Lottoarvonta	Sama voittorivi kahdeksalla peräkkäisellä kierroksella
3,193 * 10^-58	191,0 (190,997)	Lottoarvonta	Sama voittorivi yhdeksällä peräkkäisellä kierroksella
2,076 * 10^-65	214,9	Lottoarvonta	Sama voittorivi 10 peräkkäisellä kierroksella
1,349 * 10^-72	238,7	Lottoarvonta	Sama voittorivi 11 peräkkäisellä kierroksella
1,531 * 10^-78	258,5	Nopanheitto	100 (kuutio)noppaa, yksi yritys, 100 kuutosta
8,774 * 10^-80	262,6	Lottoarvonta	Sama voittorivi 12 peräkkäisellä kierroksella
5,704 * 10^-87	286,5	Lottoarvonta	Sama voittorivi 13 peräkkäisellä kierroksella
3,709 * 10^-94	310,4	Lottoarvonta	Sama voittorivi 14 peräkkäisellä kierroksella
10^-100 (tasan)	332,2	Matematiikan opetus	Yksi mahdollisuus googolista	"Googol" on otettu käyttöön havainnollistamaan "käsittämättömän suuren luvun" ideaa (erotuksena äärettömästä). Niinpä näin epätodennäköisen tapahtuman voi katsoa havainnollistavan "käytännössä mahdottoman" ideaa (erotuksena eksaktista nollatodennäköisyydestä, jota voi pitää äärettömän käänteislukuna).
2,411 * 10^-101	334,2	Lottoarvonta	Sama voittorivi 15 peräkkäisellä kierroksella
1,568 * 10^-108	358,1	Lottoarvonta	Sama voittorivi 16 peräkkäisellä kierroksella
1,019 * 10^-115	382,0 (381,994)	Lottoarvonta	Sama voittorivi 17 peräkkäisellä kierroksella
6,627 * 10^-123	405,9	Lottoarvonta	Sama voittorivi 18 peräkkäisellä kierroksella
4,308 * 10^-130	429,7	Lottoarvonta	Sama voittorivi 19 peräkkäisellä kierroksella
2,801 * 10^-137	453,6	Lottoarvonta	Sama voittorivi 20 peräkkäisellä kierroksella
1,821 * 10^-144	477,5	Lottoarvonta	Sama voittorivi 21 peräkkäisellä kierroksella
6,559 * 10^-151	498,9	Nopanheitto	193 noppaa, yksi heitto, 193 kuutosta
½ * 10^-150 (alitettava tn-raja)	500 (saavutettava tai ylitettävä informaatioraja)	Dembskin tarkoituksellisuuspäättely	Yleinen todennäköisyysraja (engl. universal probability bound)	Dembskin mukaan tätä epätodennäköisemmät määrittyneet (engl. specified, suomennettu m. "täsmennetyt") ilmiöt ovat käytännössä mahdottomia. Tämä tarkoittaa klassisen tilastotieteellisen päättelyn logiikan mukaan sitä, että käytetty selitysmalli, tässä tapauksessa oletus ohjaamattomasta, tarkoituksettomasta syntyhistoriasta, on hylättävä. Tällöin siis ilmiö on pääteltävä tarkoituksellisesti aiheutetuksi.
1,184 * 10^-151	501,4	Lottoarvonta	Sama voittorivi 22 peräkkäisellä kierroksella	Koska yleinen todennäköisyysraja alittuu (eli vastaava informaatioraja ylittyy) ja ilmiö on määrittynyt (saman voittorivin ensimmäinen esiintymä antaa määrityksen muille), on pääteltävä, että tällainen lottoarvontojen voittorivien yhtäläisenä pysynyt sarja ei olisi voinut syntyä sattumalta. Ohjaamaton sattumanvaraisuus ei siis käy tällaisen ilmiön selitykseksi, vaan joko arvonta ei olekaan ollut rehellistä tai tulosta on jotenkin ohjattu arvonnan järjestäjän pystymättä vaikuttamaan asiaan.
1,093 * 10^-151	501,5	Nopanheitto	194 noppaa, yksi heitto, 194 kuutosta

¹⁸

Viitteet

^ fisheriläisen
^ "Nollahypoteesi" vastaa suunnilleen ilmausta: "se, mitä yleensä on tapana olettaa" tai "mahdollisimman mitäänsanomaton oletus". Jos esimerkiksi testataan noppakuution heittotuloksia, nollahypoteesina on se, että kaikki arvot ykkösestä kuutoseen esiintyvät samalla todennäköisyydellä, ja puoluekannatusta mitattaessa voidaan nollahypoteesina olettaa, ettei puoluekannatuksissa ole tapahtunut mitään muutoksia sitten edellisen mittauksen.
^ Tämä vastaa Karl Popperin tieteenfilosofista ajatusta siitä, että tieteellisiä hypoteeseja ja teorioita voidaan osoittaa havainnoilla ainoastaan vääriksi muttei koskaan lopullisesti oikeiksi. Nollahypoteesista siis pidetään kiinni niin kauan kuin niin katsotaan voitavan järkevästi tehdä – muttei kauemmin.
^ eli sen todennäköisyys on suurempi kuin 0 eli aidosti positiivinen
^ Esimerkiksi gallup-tulos, jonka mukaan 1000 haastatellusta A-puoluetta kannatti 60 % ja B-puoluetta 5 %, tilanteessa, jossa kummankin puolueen väestön keskuudessa nauttima todellinen kannatus on yhtä suuri, on kyllä täysin mahdollinen, joskin kovin epätodennäköinen. Myös tulos, jonka mukaan kaikki vastaajat olisivat kannattaneet samaa puoluetta, olisi mahdollinen selittää oletuksella, että lähes kaikki kannattavatkin sellaista puoluetta, jota otokseen valituista ei tukenut kukaan: "otokseen nyt on vain sattunut osumaan pelkästään tämän puolueen kannattajia, vaikka niiden keskuudessa, joilta ei kysytty, kannatuslukemat saattavatkin olla millaiset hyvänsä, vaikkapa juuri päinvastaisetkin". Kyselytutkimustulosten järkevä yleistäminen koko väestön kantoja kuvaileviksi ei voikaan perustua siihen, mikä on kyselyn tulosten estämättä periaatteessa mahdollista, vaan mikä niiden valossa on todennäköisintä. Muuten otantatutkimukset jäisivätkin merkityksettömiksi; käytäntö on kuitenkin osoittanut ne esim. vaalitulosten ennakoijina varsin tarkoiksi.
^ Suunnittelupäättelyssä tarkoituksettomiin syihin rajoittuvat selitykset ovat oletusarvona eli nollahypoteesin asemassa.
^ eli sitä epätodennäköisemmiksi käyvät väärät positiiviset tulokset eli nollahypoteesin hylkäys tilanteessa, jossa se tosiasiassa olikin voimassa – väärät negatiiviset tulokset tulevat tällöin vastaavasti yhä mahdollisemmiksi
^ Julkisuudessa varsin vähälle huomiolle näkyy jääneen, että Dembski on samalta teoreettiselta pohjalta esittänyt myös erityistilanteisiin soveltuvien rajojen yleisen määrittämistavan. Ks. tästä The Design Inference, s. 199-203.
^ likiarvo lähimpään desimaaliin pyöristettynä, ellei toisin todeta
^ Dembskin käyttämä informaatiokäsite samaistuu tähän arvoon. On muitakin informaatiokäsitteitä, joilla on oma merkityksensä ja käyttötapansa.
^ lähimpään desimaaliin pyöristettynä, ellei toisin todeta
^ Klassisen tilastotieteen osalta nämä kuvaukset ovat suuntaa-antavia: tutkijoilla on käytettävissään muutakin tietoa kuin tehtyjen havaintojen tilastolliset todennäköisyydet, joten johtopäätöksiin vaikuttavat muutkin tekijät kuin tilastollinen päättely. – Osaltaan tutkimustulosten tulkintaan ja raportointiin vaikuttaa käytännössä myös kulloisenkin tutkijan vapaaseen harkintaan pohjautuva oma arviointi, joka puolestaan on sidoksissa hänen perususkomuksiinsa.
^ Kaikissa tämän taulukon nopanheittoesimerkeissä on käytetty tavallisia kuutionoppia.
^> ^14,0 ^14,1 ^14,2 Dembski on todennut nämä rajat mielivaltaisiksi ja ehdottanut tilalle omaa teoreettisesti perusteltua hypoteesinhylkäysaluerajojen määritystapaansa; ks. The Design Inference, s. 201.
^ 7 oikein 39 mahdollisesta (3.2.2008 voimaan astuneiden sääntöjen mukaan), rehellinen arvonta
^ Koska joku rivi arvotaan joka kierroksella ja edellisen kierroksen tulos saa olla millainen hyvänsä, seuranta aloitetaan tässä vasta toisesta kierroksesta.
^ Dembski katsoo tältä osin täydentäneensä Borelin aloittaman työn (The Design Inference, s. 213, alaviite 18).
^ Tarkastuslaskuja varten tässä vielä eräiden taulukoitujen todennäköisyyksien tarkemmat likiarvot:
Lottoarvonta

2 peräkkäiskierrosta: 0,000'000'065'015'544'892

3 peräkkäiskierrosta: 4,227'021'077'565 * 10^-15

4 peräkkäiskierrosta: 2,748'220'786'266 * 10^-22

5 peräkkäiskierrosta: 1,786'770'719'018 * 10^-29

Nopanheitto:

10 kuutosta yhdellä yrittämällä: 1,653'817'168'792 * 10^-8

100 kuutosta yhdellä yrittämällä: 1,530'646'707'487 * 10^-78

193 kuutosta yhdellä yrittämällä: 6,558'562'718'010 * 10^-151

194 kuutosta yhdellä yrittämällä: 1,093'093'786'335 * 10^-151

Sadan lantin heitto: 7,888'609'052'210 * 10^-31

Kuningasvärisarja: 0,000'001'539'077'169'329

[1] sheriläisen

[2] "Nollahypoteesi" vastaa suunnilleen ilmausta: "se, mitä yleensä on tapana olettaa" tai "mahdollisimman mitäänsanomaton oletus". Jos esimerkiksi testataan noppakuution heittotuloksia, nollahypoteesina on se, että kaikki arvot ykkösestä kuutoseen esiintyvät samalla todennäköisyydellä, ja puoluekannatusta mitattaessa voidaan nollahypoteesina olettaa, ettei puoluekannatuksissa ole tapahtunut mitään muutoksia sitten edellisen mittauksen.

[3] Tämä vastaa Karl Popperin tieteenfilosofista ajatusta siitä, että tieteellisiä hypoteeseja ja teorioita voidaan osoittaa havainnoilla ainoastaan vääriksi muttei koskaan lopullisesti oikeiksi. Nollahypoteesista siis pidetään kiinni niin kauan kuin niin katsotaan voitavan järkevästi tehdä – muttei kauemmin.

[4] sen todennäköisyys on suurempi kuin 0 eli aidosti positiivinen

[5] Esimerkiksi gallup-tulos, jonka mukaan 1000 haastatellusta A-puoluetta kannatti 60 % ja B-puoluetta 5 %, tilanteessa, jossa kummankin puolueen väestön keskuudessa nauttima todellinen kannatus on yhtä suuri, on kyllä täysin mahdollinen, joskin kovin epätodennäköinen. Myös tulos, jonka mukaan kaikki vastaajat olisivat kannattaneet samaa puoluetta, olisi mahdollinen selittää oletuksella, että lähes kaikki kannattavatkin sellaista puoluetta, jota otokseen valituista ei tukenut kukaan: "otokseen nyt on vain sattunut osumaan pelkästään tämän puolueen kannattajia, vaikka niiden keskuudessa, joilta ei kysytty, kannatuslukemat saattavatkin olla millaiset hyvänsä, vaikkapa juuri päinvastaisetkin". Kyselytutkimustulosten järkevä yleistäminen koko väestön kantoja kuvaileviksi ei voikaan perustua siihen, mikä on kyselyn tulosten estämättä periaatteessa mahdollista, vaan mikä niiden valossa on todennäköisintä. Muuten otantatutkimukset jäisivätkin merkityksettömiksi; käytäntö on kuitenkin osoittanut ne esim. vaalitulosten ennakoijina varsin tarkoiksi.

[6] Suunnittelupäättelyssä tarkoituksettomiin syihin rajoittuvat selitykset ovat oletusarvona eli nollahypoteesin asemassa.

[7] sitä epätodennäköisemmiksi käyvät väärät positiiviset tulokset eli nollahypoteesin hylkäys tilanteessa, jossa se tosiasiassa olikin voimassa – väärät negatiiviset tulokset tulevat tällöin vastaavasti yhä mahdollisemmiksi

[8] Julkisuudessa varsin vähälle huomiolle näkyy jääneen, että Dembski on samalta teoreettiselta pohjalta esittänyt myös erityistilanteisiin soveltuvien rajojen yleisen määrittämistavan. Ks. tästä The Design Inference, s. 199-203.

[9] rvo lähimpään desimaaliin pyöristettynä, ellei toisin todeta

[10] Dembskin käyttämä informaatiokäsite samaistuu tähän arvoon. On muitakin informaatiokäsitteitä, joilla on oma merkityksensä ja käyttötapansa.

[11] ähimpään desimaaliin pyöristettynä, ellei toisin todeta

[12] Klassisen tilastotieteen osalta nämä kuvaukset ovat suuntaa-antavia: tutkijoilla on käytettävissään muutakin tietoa kuin tehtyjen havaintojen tilastolliset todennäköisyydet, joten johtopäätöksiin vaikuttavat muutkin tekijät kuin tilastollinen päättely. – Osaltaan tutkimustulosten tulkintaan ja raportointiin vaikuttaa käytännössä myös kulloisenkin tutkijan vapaaseen harkintaan pohjautuva oma arviointi, joka puolestaan on sidoksissa hänen perususkomuksiinsa.

[13] Kaikissa tämän taulukon nopanheittoesimerkeissä on käytetty tavallisia kuutionoppia.

[Dpc-14] > ^14,0 ^14,1 ^14,2 Dembski on todennut nämä rajat mielivaltaisiksi ja ehdottanut tilalle omaa teoreettisesti perusteltua hypoteesinhylkäysaluerajojen määritystapaansa; ks. The Design Inference, s. 201.

[15] 7 oikein 39 mahdollisesta (3.2.2008 voimaan astuneiden sääntöjen mukaan), rehellinen arvonta

[16] Koska joku rivi arvotaan joka kierroksella ja edellisen kierroksen tulos saa olla millainen hyvänsä, seuranta aloitetaan tässä vasta toisesta kierroksesta.

[17] Dembski katsoo tältä osin täydentäneensä Borelin aloittaman työn (The Design Inference, s. 213, alaviite 18).

[18] Tarkastuslaskuja varten tässä vielä eräiden taulukoitujen todennäköisyyksien tarkemmat likiarvot:
Lottoarvonta

2 peräkkäiskierrosta: 0,000'000'065'015'544'892

3 peräkkäiskierrosta: 4,227'021'077'565 * 10^-15

4 peräkkäiskierrosta: 2,748'220'786'266 * 10^-22

5 peräkkäiskierrosta: 1,786'770'719'018 * 10^-29

Nopanheitto:

10 kuutosta yhdellä yrittämällä: 1,653'817'168'792 * 10^-8

100 kuutosta yhdellä yrittämällä: 1,530'646'707'487 * 10^-78

193 kuutosta yhdellä yrittämällä: 6,558'562'718'010 * 10^-151

194 kuutosta yhdellä yrittämällä: 1,093'093'786'335 * 10^-151

Sadan lantin heitto: 7,888'609'052'210 * 10^-31

Kuningasvärisarja: 0,000'001'539'077'169'329

Anonyymi

Haku

Todennäköisyysrajojen vertailu

Nimiavaruudet

Lisää

Sivun toiminnot

Viitteet

Valikko

Valikko

Wiki-työkalut

Wiki-työkalut

Anonyymi

Haku

Todennäköisyysrajojen vertailu

Viitteet

Valikko

Wiki-työkalut

Sivutyökalut

Luokat