Ero sivun ”Poimintaongelma (biokemia)” versioiden välillä

ApoWikistä
p (navigaatiomalline)
(→‎Viitteet: +sarakkeet)
 
(5 välissä olevaa versiota 2 käyttäjän tekeminä ei näytetä)
Rivi 1: Rivi 1:
Poimintaongelma (engl. ''sampling problem'') tarkastelee kuinka monella sekvenssiavaruuden peptidisekvenssillä on biologista aktiivisuutta. Kysymys on tärkeä kun halutaan arvioida kuinka todennäköisesti [[evoluutioteoria]]n mekanismit kykenevät selittämään eri proteiinien synnyn.
'''Poimintaongelma''' (engl. ''sampling problem'') liittyy kysymykseen, miten yleistä peptidisekvenssien biologinen aktiivisuus on. Kysymyksen voi muotoilla täsmällisemmin mutta jonkin verran vaikeatajuisemmin: mikä on tietynpituisten biologisesti aktiivisten peptidisekvenssien lukumäärän (eli niiden muodostaman sekvenssialiavaruuden koon) suhde kaikkien mahdollisten samanpituisten peptidisekvenssien lukumäärään (eli niiden muodostaman sekvenssiavaruuden kokoon)?
 
Tämä kysymyksenasettelu on tärkeä pyrittäessä arvioimaan  [[evoluutioteoria|evoluutioteoreettisten]] mekanismien selitysriittävyyttä<ref>Jollekin havainnolle ehdotetun tietyn syntytavan selitysriittävyys (engl. ''explanatory sufficiency'') liittyy kysymykseen siitä, miten todennäköisesti tämä selitystarjokas riittäisi (olemassaollessaan, esiintyessään, voimassaollessaan tai toteutuessaan) saamaan aikaan havaitun selitettävän ilmiön: mitä todennäköisemmin näin tapahtuu, sitä riittävämpi kyseinen syntyskenaario on.</ref> ja selitysuskottavuutta<ref>Ehdotetun selityksen selitysuskottavuus (engl. ''explanatory likelihood'') riippuu suoraan sekä sen selitysriittävyydestä (engl. ''explanatory sufficiency'') että sen (olemassaolon, esiintymisen, voimassaolon tai toteutumisen) omasta (selitettävän ilmiön esiintymisestä riippumattomasta) alkuperäistodennäköisyydestä (engl. ''prior probability'').<br />Eri selitystapojen keskinäinen paremmuusvertailu on palautettavissa niiden selitysuskottavuusvertailuun: selityksen paremmuus (ja vastaavasti huonommuus) liittyy olennaisesti sen uskottavuuteen – uskottavin selitys täyttää selittämistehtävän parhaiten, ja näin ollen sitä voi perustellusti pitää parhaana selityksenä. Toisaalta selityksiltä voi ylipäänsäkin vaatia jonkinlaista vähimmäisuskottavuutta: jos selitys on liian epäuskottava, siihen ei ole mielekästä pitäytyä edes parempien selitysten puutteessakaan, vaan tällöin on järkevämpää myöntää, ettei kyseiselle havaintoilmiölle toistaiseksi tunneta mitään nykytiedon valossa mahdollista selitystä.</ref> eri proteiinien väitettyinä aikaansaajina.


==Esimerkkejä==
==Esimerkkejä==
===β-laktamaasi===
===β-laktamaasi===
Penisiliiniä hajoittavan β-laktamaasi entsyymin pituus on 153 aminohappoa. Kaikki mahdollisia 153 aminohapon mittaisia sekvenssejä, joilla on sama entsymaattinen funktio, ei pystytä tarkasti laskemaan, mutta niiden määrä voidaan estimoida koodisekvenssien analysillä, joilloin on ko. määrälle on saatu arvioksi 10<sup>122</sup>. Yhteensä eri 153 aminohapon mittaisia sekvenssejä on (kun käytettävissä on 20 proteogeenistä aminohappoa) 20<sup>153</sup> ≈ 10<sup>199</sup>. Toisin sanoen ko. entsymaattisen funktion (E) löytäminen sattumanvaraisen sekvenssin S kautta on p(E|S) = 10<sup>122</sup>/10<sup>199</sup> = 10<sup>-77</sup>.  
 
Penisilliiniä hajottavan β-laktamaasientsyymin pituus on 153 aminohappoa. Kaikkia saman entsymaattisen funktion toteuttavia 153 aminohapon mittaisia sekvenssejä ei kylläkään pystytä tarkasti laskemaan, mutta koodisekvenssianalyysiin perustuva estimointi on antanut niiden lukumäärän (sekvenssialiavaruuden koon) suuruusluokka-arvioksi 10<sup>122</sup>. Käytettävissä olevista 20 proteogeenisestä aminohaposta muodostettavissa olevien, 153 aminohapon mittaisten eri sekvenssien lukumäärä (sekvenssiavaruuden koko) on kaikkiaan 20<sup>153</sup> ≈ 10<sup>199</sup>. Toisin sanoen todennäköisyys sille, että tästä sekvenssiavaruudesta sattumanvaraisesti poimittu sekvenssi ''S'' kuuluisi kyseiseen sekvenssialiavaruuteen eli että sillä olisi ko. entsymaattinen funktio ''E'', on yhtä kuin p(''E''|''S'') 10<sup>122</sup>/10<sup>199</sup> = 10<sup>-77</sup>.  
<ref name = "EvoKriitAna" >{{Kirjaviite  
<ref name = "EvoKriitAna" >{{Kirjaviite  
| Tekijä = Siegfried Scherer, Reinhard Junker
| Tekijä = Siegfried Scherer, Reinhard Junker
Rivi 27: Rivi 31:
</ref>
</ref>


{{ElamanKehitys}}


{{ElamanKehitys}}
==Viitteet==
==Viitteet==
{{viitteet}}
{{viitteet|sarakkeet}}
 
[[Luokka:Suunnitteluteoria]]

Nykyinen versio 26. huhtikuuta 2017 kello 12.00

Poimintaongelma (engl. sampling problem) liittyy kysymykseen, miten yleistä peptidisekvenssien biologinen aktiivisuus on. Kysymyksen voi muotoilla täsmällisemmin mutta jonkin verran vaikeatajuisemmin: mikä on tietynpituisten biologisesti aktiivisten peptidisekvenssien lukumäärän (eli niiden muodostaman sekvenssialiavaruuden koon) suhde kaikkien mahdollisten samanpituisten peptidisekvenssien lukumäärään (eli niiden muodostaman sekvenssiavaruuden kokoon)?

Tämä kysymyksenasettelu on tärkeä pyrittäessä arvioimaan evoluutioteoreettisten mekanismien selitysriittävyyttä1 ja selitysuskottavuutta2 eri proteiinien väitettyinä aikaansaajina.

Esimerkkejä[muokkaa]

β-laktamaasi[muokkaa]

Penisilliiniä hajottavan β-laktamaasientsyymin pituus on 153 aminohappoa. Kaikkia saman entsymaattisen funktion toteuttavia 153 aminohapon mittaisia sekvenssejä ei kylläkään pystytä tarkasti laskemaan, mutta koodisekvenssianalyysiin perustuva estimointi on antanut niiden lukumäärän (sekvenssialiavaruuden koon) suuruusluokka-arvioksi 10122. Käytettävissä olevista 20 proteogeenisestä aminohaposta muodostettavissa olevien, 153 aminohapon mittaisten eri sekvenssien lukumäärä (sekvenssiavaruuden koko) on kaikkiaan 20153 ≈ 10199. Toisin sanoen todennäköisyys sille, että tästä sekvenssiavaruudesta sattumanvaraisesti poimittu sekvenssi S kuuluisi kyseiseen sekvenssialiavaruuteen eli että sillä olisi ko. entsymaattinen funktio E, on yhtä kuin p(E|S) ≈ 10122/10199 = 10-77. 34



Viitteet[muokkaa]

  1. ^ Jollekin havainnolle ehdotetun tietyn syntytavan selitysriittävyys (engl. explanatory sufficiency) liittyy kysymykseen siitä, miten todennäköisesti tämä selitystarjokas riittäisi (olemassaollessaan, esiintyessään, voimassaollessaan tai toteutuessaan) saamaan aikaan havaitun selitettävän ilmiön: mitä todennäköisemmin näin tapahtuu, sitä riittävämpi kyseinen syntyskenaario on.
  2. ^ Ehdotetun selityksen selitysuskottavuus (engl. explanatory likelihood) riippuu suoraan sekä sen selitysriittävyydestä (engl. explanatory sufficiency) että sen (olemassaolon, esiintymisen, voimassaolon tai toteutumisen) omasta (selitettävän ilmiön esiintymisestä riippumattomasta) alkuperäistodennäköisyydestä (engl. prior probability).
    Eri selitystapojen keskinäinen paremmuusvertailu on palautettavissa niiden selitysuskottavuusvertailuun: selityksen paremmuus (ja vastaavasti huonommuus) liittyy olennaisesti sen uskottavuuteen – uskottavin selitys täyttää selittämistehtävän parhaiten, ja näin ollen sitä voi perustellusti pitää parhaana selityksenä. Toisaalta selityksiltä voi ylipäänsäkin vaatia jonkinlaista vähimmäisuskottavuutta: jos selitys on liian epäuskottava, siihen ei ole mielekästä pitäytyä edes parempien selitysten puutteessakaan, vaan tällöin on järkevämpää myöntää, ettei kyseiselle havaintoilmiölle toistaiseksi tunneta mitään nykytiedon valossa mahdollista selitystä.
  3. ^ Siegfried Scherer, Reinhard Junker:  Evoluutio – kriittinen analyysi (2. suomalainen painos), s. 329. Datakirjat, 2007. 978-951-98558-4-4.
  4. ^ "Estimating the Prevalence of Protein Sequences Adopting Functional Enzyme Folds" (2004). Journal of Molecular Biology 341 (5): 1295–1315. doi:10.1016/j.jmb.2004.06.058. ISSN 00222836.