Todennäköisyysrajojen vertailu

ApoWikistä
Versio hetkellä 11. maaliskuuta 2010 kello 00.39 – tehnyt Darter (keskustelu | muokkaukset) (vaihtoehtoinen malline pois tarpeettomana)

Suunnitteluteoreettisen tarkoituksellisuuspäättelyn keskeinen, vertaisarvioitu menetelmä on William Dembskin kehittämä, klassisen1 tilastotieteen lähestymistapaa soveltava suunnittelusignaalien tunnistus. Fisheriläisissä tilastopäättelyissä kysymys on tyypillisesti nollahypoteesin2 uskottavuuden testaamisesta punnitsemalla sitä, miten todennäköisiä tehdyt havainnot kyseisen hypoteesin pohjalta olisivat: jos havaintotulos on hypoteesin valossa riittävän todennäköinen, hypoteesi jää päättelyssä voimaan; muussa tapauksessa se on hylättävä.3

Käytännössä tämä lähestymistapa perustuu siihen, että mahdolliset tutkimustulokset luokitellaan sen mukaan, miten todennäköisinä niitä voidaan kulloinkin testattavan hypoteesin valossa pitää. Hypoteesit ovat tyypillisesti todennäköisyysjakaumia, ja kukin todennäköisyysjakauma yleensä antaa nollasta poikkeavan todennäköisyyden mille hyvänsä tutkimusasetelman puitteissa mahdolliselle havainnolle. Siksi klassisen tilastopäättelyn toimivuus edellyttää, että hypoteesi voidaan hylätä, vaikka havaintotulos onkin sen valossa periaatteessa mahdollinen4. Muu johtaisi mielettömyyteen.5

Dembski siis on soveltanut tätä lähestymistapaa tunnettujen tarkoituksettomien syiden selitysvoiman ja siten niihin vetoavien syntyhypoteesien uskottavuuden mittaamiseen. Fisherin tavoin hänkin on määrittänyt mahdollisten havaintotulosten joukosta tutkittavan hypoteesin hylkäysalueen eli sellaisen rajan, jota epätodennäköisempiä tuloksia ei voi pitää hypoteesin uskottavuuden kannalta hyväksyttävinä. Kaikki hylkäysaluemääritykset edellyttävätkin jonkin todennäköisyysalarajan määräämistä tutkittaville hypoteeseille. Oheisesta taulukosta näemme sekä klassisen tilastotieteen omaksumat että Dembskin suunnittelupäättelyä varten määrittämät yleispätevän hylkäysalueen rajat6. Mitä pienempi todennäköisyys määrätään, sitä tiukemmin hypoteeseista pidetään kiinni7. Vertailun ja havainnollisuuden vuoksi tässä taulukossa on mukana monia muitakin kiinnostaviksi katsottuja todennäköisyyksiä ja todennäköisyysrajoja kuin klassisen tilastotieteen mukaiset ja Dembskin yleispäteväksi8 esittämä.


Todennäköisyys9 Todennäköisyyden 2-kantaisen logaritmin vastaluku eli informaatioarvo10 bitteinä11 Tapahtuman aihepiiri Tapahtuman kuvaus Tapahtuman merkitys12
0,166'666'666'7 2,6 Nopanheitto13 Kuutonen yhdellä heitolla
0,05 (alitettava tn-raja) 4,3 Klassinen tilastotiede Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi melkein merkitsevinä.14 On syytä epäillä, että oletettu selitys (todennäköisyysjakauma) on väärä. Sitä ei ole osoitettu vääräksi, mutta sen selitysvoima on kyseenalainen.
0,027'777'777'8 5,2 Nopanheitto Kaksi noppaa, yksi heitto, kaksi kuutosta
0,01 (alitettava tn-raja) 6,6 Klassinen tilastotiede Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi merkitsevinä.14 On syytä pitää oletettua selitystä virheellisenä ja pyrkiä etsimään sen tilalle jotakin uskottavampaa.
0,004'629'629'6 7,8 Nopanheitto Kolme noppaa, yksi heitto, kolme kuutosta
0,001 (alitettava tn-raja) 9,97 Klassinen tilastotiede Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi erittäin merkitsevinä.14 Oletettu selitys on ilman muuta hylättävä. Ellei uskottavampaa selitystä ole tarjolla, on rehellisyyden nimissä myönnettävä, ettei tutkimuskohteelle tunneta toimivaa selitystä. Sellaista tietenkin sitäkin aktiivisemmin haetaan.
0,000'771'604'9 10,3 Nopanheitto Neljä noppaa, yksi heitto, neljä kuutosta
0,000'976'562'5 10 (tasan) Lantinheitto 10 lanttia, yksi yritys, tulos 10 kruunaa
0,000'001'539'1 19,3 Pokeri Hyvin sekoitettu pakka, yksi yritys, sokkona valitut 5 korttia muodostavat kuningasvärisarjan. Kuningasvärisarja (l. "kuningasvärisuora", engl. royal flush) on paras pokerikäsi; sen muodostavat ässä, kuvakortit ja kymppi, jotka ovat kaikki samaa maata.
0,000'000'065'0 23,9 Lottoarvonta15 Sama voittorivi kahdella peräkkäisellä kierroksella16
0,000'000'016'5 25,8 Nopanheitto 10 (kuutio)noppaa, yksi yritys, 10 kuutosta
4,227 * 10-15 47,7 Lottoarvonta Sama voittorivi kolmella peräkkäisellä kierroksella
10-20 (tn-raja) 66,4 Evoluutiobiologia 1 CCC Biokemisti Michael Behen mukaan tämä on probabilistinen vaativuusaste, jonka ohjaamaton mutaatio-luonnonvalintamekanismi voi vielä ylittää melko usein jos lajin populaatiokoko ja mutaatiotaajuus ovat riittävän suuria.
2,748 *10-22 71,6 Lottoarvonta Sama voittorivi neljällä peräkkäisellä kierroksella
1,787 * 10-29 95,5 Lottoarvonta Sama voittorivi viidellä peräkkäisellä kierroksella
7,889 * 10-31 100 (tasan) Lantinheitto 100 lanttia, yksi yritys, tulos 100 kruunaa
1,162 * 10-36 119,4 Lottoarvonta Sama voittorivi kuudella peräkkäisellä kierroksella
10-40 (tn-raja) 132,9 Evoluutiobiologia 2 CCC Biokemisti Michael Behen mukaan tämä on probabilistinen vaativuusaste, jota ohjaamaton mutaatio-luonnonvalintamekanismi todennäköisesti ei ole kyennyt ylittämään teoreettisen tarkastelun sen enempää kuin käytännön havaintojenkaan mukaan kertaakaan elämän historian aikana.
7,553 * 10-44 143,2 Lottoarvonta Sama voittorivi seitsemällä peräkkäisellä kierroksella
10-50 (alitettava tn-raja) 166,1 Sovellettu probabilistiikka Matemaatikko Emile Borelin ehdotus yleiseksi todennäköisyysrajaksi Borelin mukaan tätä epätodennäköisemmät ilmiöt ovat käytännössä mahdottomia.17
4,910 * 10-51 167,1 Lottoarvonta Sama voittorivi kahdeksalla peräkkäisellä kierroksella
3,193 * 10-58 191,0 (190,997) Lottoarvonta Sama voittorivi yhdeksällä peräkkäisellä kierroksella
2,076 * 10-65 214,9 Lottoarvonta Sama voittorivi 10 peräkkäisellä kierroksella
1,349 * 10-72 238,7 Lottoarvonta Sama voittorivi 11 peräkkäisellä kierroksella
1,531 * 10-78 258,5 Nopanheitto 100 (kuutio)noppaa, yksi yritys, 100 kuutosta
8,774 * 10-80 262,6 Lottoarvonta Sama voittorivi 12 peräkkäisellä kierroksella
5,704 * 10-87 286,5 Lottoarvonta Sama voittorivi 13 peräkkäisellä kierroksella
3,709 * 10-94 310,4 Lottoarvonta Sama voittorivi 14 peräkkäisellä kierroksella
10-100 (tasan) 332,2 Matematiikan opetus Yksi mahdollisuus googolista "Googol" on otettu käyttöön havainnollistamaan "käsittämättömän suuren luvun" ideaa (erotuksena äärettömästä). Niinpä näin epätodennäköisen tapahtuman voi katsoa havainnollistavan "käytännössä mahdottoman" ideaa (erotuksena eksaktista nollatodennäköisyydestä, jota voi pitää äärettömän käänteislukuna).
2,411 * 10-101 334,2 Lottoarvonta Sama voittorivi 15 peräkkäisellä kierroksella
1,568 * 10-108 358,1 Lottoarvonta Sama voittorivi 16 peräkkäisellä kierroksella
1,019 * 10-115 382,0 (381,994) Lottoarvonta Sama voittorivi 17 peräkkäisellä kierroksella
6,627 * 10-123 405,9 Lottoarvonta Sama voittorivi 18 peräkkäisellä kierroksella
4,308 * 10-130 429,7 Lottoarvonta Sama voittorivi 19 peräkkäisellä kierroksella
2,801 * 10-137 453,6 Lottoarvonta Sama voittorivi 20 peräkkäisellä kierroksella
1,821 * 10-144 477,5 Lottoarvonta Sama voittorivi 21 peräkkäisellä kierroksella
6,559 * 10-151 498,9 Nopanheitto 193 noppaa, yksi heitto, 193 kuutosta
½ * 10-150 (alitettava tn-raja) 500 (saavutettava tai ylitettävä informaatioraja) Dembskin tarkoituksellisuuspäättely Yleinen todennäköisyysraja (engl. universal probability bound) Dembskin mukaan tätä epätodennäköisemmät määrittyneet (engl. specified, suomennettu m. "täsmennetyt") ilmiöt ovat käytännössä mahdottomia. Tämä tarkoittaa klassisen tilastotieteellisen päättelyn logiikan mukaan sitä, että käytetty selitysmalli, tässä tapauksessa oletus ohjaamattomasta, tarkoituksettomasta syntyhistoriasta, on hylättävä. Tällöin siis ilmiö on pääteltävä tarkoituksellisesti aiheutetuksi.
1,184 * 10-151 501,4 Lottoarvonta Sama voittorivi 22 peräkkäisellä kierroksella Koska yleinen todennäköisyysraja alittuu (eli vastaava informaatioraja ylittyy) ja ilmiö on määrittynyt (saman voittorivin ensimmäinen esiintymä antaa määrityksen muille), on pääteltävä, että tällainen lottoarvontojen voittorivien yhtäläisenä pysynyt sarja ei olisi voinut syntyä sattumalta.

Ohjaamaton sattumanvaraisuus ei siis käy tällaisen ilmiön selitykseksi, vaan joko arvonta ei olekaan ollut rehellistä tai tulosta on jotenkin ohjattu arvonnan järjestäjän pystymättä vaikuttamaan asiaan.

1,093 * 10-151 501,5 Nopanheitto 194 noppaa, yksi heitto, 194 kuutosta

18


Viitteet

  1. ^ fisheriläisen
  2. ^ "Nollahypoteesi" vastaa suunnilleen ilmausta: "se, mitä yleensä on tapana olettaa" tai "mahdollisimman mitäänsanomaton oletus". Jos esimerkiksi testataan noppakuution heittotuloksia, nollahypoteesina on se, että kaikki arvot ykkösestä kuutoseen esiintyvät samalla todennäköisyydellä, ja puoluekannatusta mitattaessa voidaan nollahypoteesina olettaa, ettei puoluekannatuksissa ole tapahtunut mitään muutoksia sitten edellisen mittauksen.
  3. ^ Tämä vastaa Karl Popperin tieteenfilosofista ajatusta siitä, että tieteellisiä hypoteeseja ja teorioita voidaan osoittaa havainnoilla ainoastaan vääriksi muttei koskaan lopullisesti oikeiksi. Nollahypoteesista siis pidetään kiinni niin kauan kuin niin katsotaan voitavan järkevästi tehdä – muttei kauemmin.
  4. ^ eli sen todennäköisyys on suurempi kuin 0 eli aidosti positiivinen
  5. ^ Esimerkiksi gallup-tulos, jonka mukaan 1000 haastatellusta A-puoluetta kannatti 60 % ja B-puoluetta 5 %, tilanteessa, jossa kummankin puolueen väestön keskuudessa nauttima todellinen kannatus on yhtä suuri, on kyllä täysin mahdollinen, joskin kovin epätodennäköinen. Myös tulos, jonka mukaan kaikki vastaajat olisivat kannattaneet samaa puoluetta, olisi mahdollinen selittää oletuksella, että lähes kaikki kannattavatkin sellaista puoluetta, jota otokseen valituista ei tukenut kukaan: "otokseen nyt on vain sattunut osumaan pelkästään tämän puolueen kannattajia, vaikka niiden keskuudessa, joilta ei kysytty, kannatuslukemat saattavatkin olla millaiset hyvänsä, vaikkapa juuri päinvastaisetkin". Kyselytutkimustulosten järkevä yleistäminen koko väestön kantoja kuvaileviksi ei voikaan perustua siihen, mikä on kyselyn tulosten estämättä periaatteessa mahdollista, vaan mikä niiden valossa on todennäköisintä. Muuten otantatutkimukset jäisivätkin merkityksettömiksi; käytäntö on kuitenkin osoittanut ne esim. vaalitulosten ennakoijina varsin tarkoiksi.
  6. ^ Suunnittelupäättelyssä tarkoituksettomiin syihin rajoittuvat selitykset ovat oletusarvona eli nollahypoteesin asemassa.
  7. ^ eli sitä epätodennäköisemmiksi käyvät väärät positiiviset tulokset eli nollahypoteesin hylkäys tilanteessa, jossa se tosiasiassa olikin voimassa – väärät negatiiviset tulokset tulevat tällöin vastaavasti yhä mahdollisemmiksi
  8. ^ Julkisuudessa varsin vähälle huomiolle näkyy jääneen, että Dembski on samalta teoreettiselta pohjalta esittänyt myös erityistilanteisiin soveltuvien rajojen yleisen määrittämistavan. Ks. tästä The Design Inference, s. 199-203.
  9. ^ likiarvo lähimpään desimaaliin pyöristettynä, ellei toisin todeta
  10. ^ Dembskin käyttämä informaatiokäsite samaistuu tähän arvoon. On muitakin informaatiokäsitteitä, joilla on oma merkityksensä ja käyttötapansa.
  11. ^ lähimpään desimaaliin pyöristettynä, ellei toisin todeta
  12. ^ Klassisen tilastotieteen osalta nämä kuvaukset ovat suuntaa-antavia: tutkijoilla on käytettävissään muutakin tietoa kuin tehtyjen havaintojen tilastolliset todennäköisyydet, joten johtopäätöksiin vaikuttavat muutkin tekijät kuin tilastollinen päättely. – Osaltaan tutkimustulosten tulkintaan ja raportointiin vaikuttaa käytännössä myös kulloisenkin tutkijan vapaaseen harkintaan pohjautuva oma arviointi, joka puolestaan on sidoksissa hänen perususkomuksiinsa.
  13. ^ Kaikissa tämän taulukon nopanheittoesimerkeissä on käytetty tavallisia kuutionoppia.
  14. > 14,0 14,1 14,2 Dembski on todennut nämä rajat mielivaltaisiksi ja ehdottanut tilalle omaa teoreettisesti perusteltua hypoteesinhylkäysaluerajojen määritystapaansa; ks. The Design Inference, s. 201.
  15. ^ 7 oikein 39 mahdollisesta (3.2.2008 voimaan astuneiden sääntöjen mukaan), rehellinen arvonta
  16. ^ Koska joku rivi arvotaan joka kierroksella ja edellisen kierroksen tulos saa olla millainen hyvänsä, seuranta aloitetaan tässä vasta toisesta kierroksesta.
  17. ^ Dembski katsoo tältä osin täydentäneensä Borelin aloittaman työn (The Design Inference, s. 213, alaviite 18).
  18. ^ Tarkastuslaskuja varten tässä vielä eräiden taulukoitujen todennäköisyyksien tarkemmat likiarvot:
    Lottoarvonta
    2 peräkkäiskierrosta: 0,000'000'065'015'544'892
    3 peräkkäiskierrosta: 4,227'021'077'565 * 10-15
    4 peräkkäiskierrosta: 2,748'220'786'266 * 10-22
    5 peräkkäiskierrosta: 1,786'770'719'018 * 10-29
    Nopanheitto:
    10 kuutosta yhdellä yrittämällä: 1,653'817'168'792 * 10-8
    100 kuutosta yhdellä yrittämällä: 1,530'646'707'487 * 10-78
    193 kuutosta yhdellä yrittämällä: 6,558'562'718'010 * 10-151
    194 kuutosta yhdellä yrittämällä: 1,093'093'786'335 * 10-151
    Sadan lantin heitto: 7,888'609'052'210 * 10-31
    Kuningasvärisarja: 0,000'001'539'077'169'329