Ero sivun ”Todennäköisyysrajojen vertailu” versioiden välillä
(no, päätin sitten rakennella sille pitkälle vertailutaulukolle oman artikkelin; alkuun laitoin yleistä selittelyä Fisherin klassisen tilastotieteen "filosofiasta") |
p (vaihtoehtoinen malline pois tarpeettomana) |
||
Rivi 340: | Rivi 340: | ||
==Viitteet== | ==Viitteet== | ||
{{Viitteet | {{Viitteet|sarakkeet}} | ||
| | |||
}} | |||
{{Tarkoituksellisuuspäättely}} | {{Tarkoituksellisuuspäättely}} | ||
[[Luokka:Suunnitteluteoria]] | [[Luokka:Suunnitteluteoria]] |
Versio 10. maaliskuuta 2010 kello 21.39
Suunnitteluteoreettisen tarkoituksellisuuspäättelyn keskeinen, vertaisarvioitu menetelmä on William Dembskin kehittämä, klassisen1 tilastotieteen lähestymistapaa soveltava suunnittelusignaalien tunnistus. Fisheriläisissä tilastopäättelyissä kysymys on tyypillisesti nollahypoteesin2 uskottavuuden testaamisesta punnitsemalla sitä, miten todennäköisiä tehdyt havainnot kyseisen hypoteesin pohjalta olisivat: jos havaintotulos on hypoteesin valossa riittävän todennäköinen, hypoteesi jää päättelyssä voimaan; muussa tapauksessa se on hylättävä.3
Käytännössä tämä lähestymistapa perustuu siihen, että mahdolliset tutkimustulokset luokitellaan sen mukaan, miten todennäköisinä niitä voidaan kulloinkin testattavan hypoteesin valossa pitää. Hypoteesit ovat tyypillisesti todennäköisyysjakaumia, ja kukin todennäköisyysjakauma yleensä antaa nollasta poikkeavan todennäköisyyden mille hyvänsä tutkimusasetelman puitteissa mahdolliselle havainnolle. Siksi klassisen tilastopäättelyn toimivuus edellyttää, että hypoteesi voidaan hylätä, vaikka havaintotulos onkin sen valossa periaatteessa mahdollinen4. Muu johtaisi mielettömyyteen.5
Dembski siis on soveltanut tätä lähestymistapaa tunnettujen tarkoituksettomien syiden selitysvoiman ja siten niihin vetoavien syntyhypoteesien uskottavuuden mittaamiseen. Fisherin tavoin hänkin on määrittänyt mahdollisten havaintotulosten joukosta tutkittavan hypoteesin hylkäysalueen eli sellaisen rajan, jota epätodennäköisempiä tuloksia ei voi pitää hypoteesin uskottavuuden kannalta hyväksyttävinä. Kaikki hylkäysaluemääritykset edellyttävätkin jonkin todennäköisyysalarajan määräämistä tutkittaville hypoteeseille. Oheisesta taulukosta näemme sekä klassisen tilastotieteen omaksumat että Dembskin suunnittelupäättelyä varten määrittämät yleispätevän hylkäysalueen rajat6. Mitä pienempi todennäköisyys määrätään, sitä tiukemmin hypoteeseista pidetään kiinni7. Vertailun ja havainnollisuuden vuoksi tässä taulukossa on mukana monia muitakin kiinnostaviksi katsottuja todennäköisyyksiä ja todennäköisyysrajoja kuin klassisen tilastotieteen mukaiset ja Dembskin yleispäteväksi8 esittämä.
Todennäköisyys9 | Todennäköisyyden 2-kantaisen logaritmin vastaluku eli informaatioarvo10 bitteinä11 | Tapahtuman aihepiiri | Tapahtuman kuvaus | Tapahtuman merkitys12 |
---|---|---|---|---|
0,166'666'666'7 | 2,6 | Nopanheitto13 | Kuutonen yhdellä heitolla | |
0,05 (alitettava tn-raja) | 4,3 | Klassinen tilastotiede | Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi melkein merkitsevinä.14 | On syytä epäillä, että oletettu selitys (todennäköisyysjakauma) on väärä. Sitä ei ole osoitettu vääräksi, mutta sen selitysvoima on kyseenalainen. |
0,027'777'777'8 | 5,2 | Nopanheitto | Kaksi noppaa, yksi heitto, kaksi kuutosta | |
0,01 (alitettava tn-raja) | 6,6 | Klassinen tilastotiede | Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi merkitsevinä.14 | On syytä pitää oletettua selitystä virheellisenä ja pyrkiä etsimään sen tilalle jotakin uskottavampaa. |
0,004'629'629'6 | 7,8 | Nopanheitto | Kolme noppaa, yksi heitto, kolme kuutosta | |
0,001 (alitettava tn-raja) | 9,97 | Klassinen tilastotiede | Tätä epätodennäköisempiä tapahtumia pidetään klassisessa tilastotieteessä nollahypoteesin hylkäämiseksi erittäin merkitsevinä.14 | Oletettu selitys on ilman muuta hylättävä. Ellei uskottavampaa selitystä ole tarjolla, on rehellisyyden nimissä myönnettävä, ettei tutkimuskohteelle tunneta toimivaa selitystä. Sellaista tietenkin sitäkin aktiivisemmin haetaan. |
0,000'771'604'9 | 10,3 | Nopanheitto | Neljä noppaa, yksi heitto, neljä kuutosta | |
0,000'976'562'5 | 10 (tasan) | Lantinheitto | 10 lanttia, yksi yritys, tulos 10 kruunaa | |
0,000'001'539'1 | 19,3 | Pokeri | Hyvin sekoitettu pakka, yksi yritys, sokkona valitut 5 korttia muodostavat kuningasvärisarjan. | Kuningasvärisarja (l. "kuningasvärisuora", engl. royal flush) on paras pokerikäsi; sen muodostavat ässä, kuvakortit ja kymppi, jotka ovat kaikki samaa maata. |
0,000'000'065'0 | 23,9 | Lottoarvonta15 | Sama voittorivi kahdella peräkkäisellä kierroksella16 | |
0,000'000'016'5 | 25,8 | Nopanheitto | 10 (kuutio)noppaa, yksi yritys, 10 kuutosta | |
4,227 * 10-15 | 47,7 | Lottoarvonta | Sama voittorivi kolmella peräkkäisellä kierroksella | |
10-20 (tn-raja) | 66,4 | Evoluutiobiologia | 1 CCC | Biokemisti Michael Behen mukaan tämä on probabilistinen vaativuusaste, jonka ohjaamaton mutaatio-luonnonvalintamekanismi voi vielä ylittää melko usein jos lajin populaatiokoko ja mutaatiotaajuus ovat riittävän suuria. |
2,748 *10-22 | 71,6 | Lottoarvonta | Sama voittorivi neljällä peräkkäisellä kierroksella | |
1,787 * 10-29 | 95,5 | Lottoarvonta | Sama voittorivi viidellä peräkkäisellä kierroksella | |
7,889 * 10-31 | 100 (tasan) | Lantinheitto | 100 lanttia, yksi yritys, tulos 100 kruunaa | |
1,162 * 10-36 | 119,4 | Lottoarvonta | Sama voittorivi kuudella peräkkäisellä kierroksella | |
10-40 (tn-raja) | 132,9 | Evoluutiobiologia | 2 CCC | Biokemisti Michael Behen mukaan tämä on probabilistinen vaativuusaste, jota ohjaamaton mutaatio-luonnonvalintamekanismi todennäköisesti ei ole kyennyt ylittämään teoreettisen tarkastelun sen enempää kuin käytännön havaintojenkaan mukaan kertaakaan elämän historian aikana. |
7,553 * 10-44 | 143,2 | Lottoarvonta | Sama voittorivi seitsemällä peräkkäisellä kierroksella | |
10-50 (alitettava tn-raja) | 166,1 | Sovellettu probabilistiikka | Matemaatikko Emile Borelin ehdotus yleiseksi todennäköisyysrajaksi | Borelin mukaan tätä epätodennäköisemmät ilmiöt ovat käytännössä mahdottomia.17 |
4,910 * 10-51 | 167,1 | Lottoarvonta | Sama voittorivi kahdeksalla peräkkäisellä kierroksella | |
3,193 * 10-58 | 191,0 (190,997) | Lottoarvonta | Sama voittorivi yhdeksällä peräkkäisellä kierroksella | |
2,076 * 10-65 | 214,9 | Lottoarvonta | Sama voittorivi 10 peräkkäisellä kierroksella | |
1,349 * 10-72 | 238,7 | Lottoarvonta | Sama voittorivi 11 peräkkäisellä kierroksella | |
1,531 * 10-78 | 258,5 | Nopanheitto | 100 (kuutio)noppaa, yksi yritys, 100 kuutosta | |
8,774 * 10-80 | 262,6 | Lottoarvonta | Sama voittorivi 12 peräkkäisellä kierroksella | |
5,704 * 10-87 | 286,5 | Lottoarvonta | Sama voittorivi 13 peräkkäisellä kierroksella | |
3,709 * 10-94 | 310,4 | Lottoarvonta | Sama voittorivi 14 peräkkäisellä kierroksella | |
10-100 (tasan) | 332,2 | Matematiikan opetus | Yksi mahdollisuus googolista | "Googol" on otettu käyttöön havainnollistamaan "käsittämättömän suuren luvun" ideaa (erotuksena äärettömästä). Niinpä näin epätodennäköisen tapahtuman voi katsoa havainnollistavan "käytännössä mahdottoman" ideaa (erotuksena eksaktista nollatodennäköisyydestä, jota voi pitää äärettömän käänteislukuna). |
2,411 * 10-101 | 334,2 | Lottoarvonta | Sama voittorivi 15 peräkkäisellä kierroksella | |
1,568 * 10-108 | 358,1 | Lottoarvonta | Sama voittorivi 16 peräkkäisellä kierroksella | |
1,019 * 10-115 | 382,0 (381,994) | Lottoarvonta | Sama voittorivi 17 peräkkäisellä kierroksella | |
6,627 * 10-123 | 405,9 | Lottoarvonta | Sama voittorivi 18 peräkkäisellä kierroksella | |
4,308 * 10-130 | 429,7 | Lottoarvonta | Sama voittorivi 19 peräkkäisellä kierroksella | |
2,801 * 10-137 | 453,6 | Lottoarvonta | Sama voittorivi 20 peräkkäisellä kierroksella | |
1,821 * 10-144 | 477,5 | Lottoarvonta | Sama voittorivi 21 peräkkäisellä kierroksella | |
6,559 * 10-151 | 498,9 | Nopanheitto | 193 noppaa, yksi heitto, 193 kuutosta | |
½ * 10-150 (alitettava tn-raja) | 500 (saavutettava tai ylitettävä informaatioraja) | Dembskin tarkoituksellisuuspäättely | Yleinen todennäköisyysraja (engl. universal probability bound) | Dembskin mukaan tätä epätodennäköisemmät määrittyneet (engl. specified, suomennettu m. "täsmennetyt") ilmiöt ovat käytännössä mahdottomia. Tämä tarkoittaa klassisen tilastotieteellisen päättelyn logiikan mukaan sitä, että käytetty selitysmalli, tässä tapauksessa oletus ohjaamattomasta, tarkoituksettomasta syntyhistoriasta, on hylättävä. Tällöin siis ilmiö on pääteltävä tarkoituksellisesti aiheutetuksi. |
1,184 * 10-151 | 501,4 | Lottoarvonta | Sama voittorivi 22 peräkkäisellä kierroksella | Koska yleinen todennäköisyysraja alittuu (eli vastaava informaatioraja ylittyy) ja ilmiö on määrittynyt (saman voittorivin ensimmäinen esiintymä antaa määrityksen muille), on pääteltävä, että tällainen lottoarvontojen voittorivien yhtäläisenä pysynyt sarja ei olisi voinut syntyä sattumalta.
Ohjaamaton sattumanvaraisuus ei siis käy tällaisen ilmiön selitykseksi, vaan joko arvonta ei olekaan ollut rehellistä tai tulosta on jotenkin ohjattu arvonnan järjestäjän pystymättä vaikuttamaan asiaan. |
1,093 * 10-151 | 501,5 | Nopanheitto | 194 noppaa, yksi heitto, 194 kuutosta | |
Viitteet
- ^ fisheriläisen
- ^ "Nollahypoteesi" vastaa suunnilleen ilmausta: "se, mitä yleensä on tapana olettaa" tai "mahdollisimman mitäänsanomaton oletus". Jos esimerkiksi testataan noppakuution heittotuloksia, nollahypoteesina on se, että kaikki arvot ykkösestä kuutoseen esiintyvät samalla todennäköisyydellä, ja puoluekannatusta mitattaessa voidaan nollahypoteesina olettaa, ettei puoluekannatuksissa ole tapahtunut mitään muutoksia sitten edellisen mittauksen.
- ^ Tämä vastaa Karl Popperin tieteenfilosofista ajatusta siitä, että tieteellisiä hypoteeseja ja teorioita voidaan osoittaa havainnoilla ainoastaan vääriksi muttei koskaan lopullisesti oikeiksi. Nollahypoteesista siis pidetään kiinni niin kauan kuin niin katsotaan voitavan järkevästi tehdä – muttei kauemmin.
- ^ eli sen todennäköisyys on suurempi kuin 0 eli aidosti positiivinen
- ^ Esimerkiksi gallup-tulos, jonka mukaan 1000 haastatellusta A-puoluetta kannatti 60 % ja B-puoluetta 5 %, tilanteessa, jossa kummankin puolueen väestön keskuudessa nauttima todellinen kannatus on yhtä suuri, on kyllä täysin mahdollinen, joskin kovin epätodennäköinen. Myös tulos, jonka mukaan kaikki vastaajat olisivat kannattaneet samaa puoluetta, olisi mahdollinen selittää oletuksella, että lähes kaikki kannattavatkin sellaista puoluetta, jota otokseen valituista ei tukenut kukaan: "otokseen nyt on vain sattunut osumaan pelkästään tämän puolueen kannattajia, vaikka niiden keskuudessa, joilta ei kysytty, kannatuslukemat saattavatkin olla millaiset hyvänsä, vaikkapa juuri päinvastaisetkin". Kyselytutkimustulosten järkevä yleistäminen koko väestön kantoja kuvaileviksi ei voikaan perustua siihen, mikä on kyselyn tulosten estämättä periaatteessa mahdollista, vaan mikä niiden valossa on todennäköisintä. Muuten otantatutkimukset jäisivätkin merkityksettömiksi; käytäntö on kuitenkin osoittanut ne esim. vaalitulosten ennakoijina varsin tarkoiksi.
- ^ Suunnittelupäättelyssä tarkoituksettomiin syihin rajoittuvat selitykset ovat oletusarvona eli nollahypoteesin asemassa.
- ^ eli sitä epätodennäköisemmiksi käyvät väärät positiiviset tulokset eli nollahypoteesin hylkäys tilanteessa, jossa se tosiasiassa olikin voimassa – väärät negatiiviset tulokset tulevat tällöin vastaavasti yhä mahdollisemmiksi
- ^ Julkisuudessa varsin vähälle huomiolle näkyy jääneen, että Dembski on samalta teoreettiselta pohjalta esittänyt myös erityistilanteisiin soveltuvien rajojen yleisen määrittämistavan. Ks. tästä The Design Inference, s. 199-203.
- ^ likiarvo lähimpään desimaaliin pyöristettynä, ellei toisin todeta
- ^ Dembskin käyttämä informaatiokäsite samaistuu tähän arvoon. On muitakin informaatiokäsitteitä, joilla on oma merkityksensä ja käyttötapansa.
- ^ lähimpään desimaaliin pyöristettynä, ellei toisin todeta
- ^ Klassisen tilastotieteen osalta nämä kuvaukset ovat suuntaa-antavia: tutkijoilla on käytettävissään muutakin tietoa kuin tehtyjen havaintojen tilastolliset todennäköisyydet, joten johtopäätöksiin vaikuttavat muutkin tekijät kuin tilastollinen päättely. – Osaltaan tutkimustulosten tulkintaan ja raportointiin vaikuttaa käytännössä myös kulloisenkin tutkijan vapaaseen harkintaan pohjautuva oma arviointi, joka puolestaan on sidoksissa hänen perususkomuksiinsa.
- ^ Kaikissa tämän taulukon nopanheittoesimerkeissä on käytetty tavallisia kuutionoppia.
- > 14,0 14,1 14,2 Dembski on todennut nämä rajat mielivaltaisiksi ja ehdottanut tilalle omaa teoreettisesti perusteltua hypoteesinhylkäysaluerajojen määritystapaansa; ks. The Design Inference, s. 201.
- ^ 7 oikein 39 mahdollisesta (3.2.2008 voimaan astuneiden sääntöjen mukaan), rehellinen arvonta
- ^ Koska joku rivi arvotaan joka kierroksella ja edellisen kierroksen tulos saa olla millainen hyvänsä, seuranta aloitetaan tässä vasta toisesta kierroksesta.
- ^ Dembski katsoo tältä osin täydentäneensä Borelin aloittaman työn (The Design Inference, s. 213, alaviite 18).
- ^ Tarkastuslaskuja varten tässä vielä eräiden taulukoitujen todennäköisyyksien tarkemmat likiarvot:
- Lottoarvonta
- 2 peräkkäiskierrosta: 0,000'000'065'015'544'892
- 3 peräkkäiskierrosta: 4,227'021'077'565 * 10-15
- 4 peräkkäiskierrosta: 2,748'220'786'266 * 10-22
- 5 peräkkäiskierrosta: 1,786'770'719'018 * 10-29
- Nopanheitto:
- 10 kuutosta yhdellä yrittämällä: 1,653'817'168'792 * 10-8
- 100 kuutosta yhdellä yrittämällä: 1,530'646'707'487 * 10-78
- 193 kuutosta yhdellä yrittämällä: 6,558'562'718'010 * 10-151
- 194 kuutosta yhdellä yrittämällä: 1,093'093'786'335 * 10-151
- Sadan lantin heitto: 7,888'609'052'210 * 10-31
- Kuningasvärisarja: 0,000'001'539'077'169'329