Poimintaongelma (biokemia)

ApoWikistä
Versio hetkellä 13. lokakuuta 2013 kello 17.38 – tehnyt Apollos (keskustelu | muokkaukset) (alun terminologista remontointia ja hiontaa)

Poimintaongelma (engl. sampling problem) liittyy kysymykseen, miten yleistä peptidisekvenssien biologinen aktiivisuus on. Kysymyksen voi muotoilla täsmällisemmin mutta jonkin verran vaikeatajuisemmin: mikä on tietynpituisten biologisesti aktiivisten peptidisekvenssien lukumäärän (eli niiden muodostaman sekvenssialiavaruuden koon) suhde kaikkien mahdollisten samanpituisten peptidisekvenssien lukumäärään (eli niiden muodostaman sekvenssiavaruuden kokoon)?

Tämä kysymyksenasettelu on tärkeä pyrittäessä arvioimaan evoluutioteoreettisten mekanismien selitysriittävyyttä1 ja selitysuskottavuutta2 eri proteiinien väitettyinä aikaansaajina.

Esimerkkejä

β-laktamaasi

Penisiliiniä hajoittavan β-laktamaasi entsyymin pituus on 153 aminohappoa. Kaikki mahdollisia 153 aminohapon mittaisia sekvenssejä, joilla on sama entsymaattinen funktio, ei pystytä tarkasti laskemaan, mutta niiden määrä voidaan estimoida koodisekvenssien analysillä, joilloin on ko. määrälle on saatu arvioksi 10122. Yhteensä eri 153 aminohapon mittaisia sekvenssejä on (kun käytettävissä on 20 proteogeenistä aminohappoa) 20153 ≈ 10199. Toisin sanoen ko. entsymaattisen funktion (E) löytäminen sattumanvaraisen sekvenssin S kautta on p(E|S) = 10122/10199 = 10-77. 34



Viitteet

  1. ^ Jollekin havainnolle ehdotetun tietyn syntytavan selitysriittävyys (engl. explanatory sufficiency) liittyy kysymykseen siitä, miten todennäköisesti tämä selitystarjokas riittäisi (olemassaollessaan, esiintyessään, voimassaollessaan tai toteutuessaan) saamaan aikaan havaitun selitettävän ilmiön: mitä todennäköisemmin näin tapahtuu, sitä riittävämpi kyseinen syntyskenaario on.
  2. ^ Ehdotetun selityksen selitysuskottavuus (engl. explanatory likelihood) riippuu suoraan sekä sen selitysriittävyydestä (engl. explanatory sufficiency) että sen (olemassaolon, esiintymisen, voimassaolon tai toteutumisen) omasta (selitettävän ilmiön esiintymisestä riippumattomasta) alkuperäistodennäköisyydestä (engl. prior probability).
    Eri selitystapojen keskinäinen paremmuusvertailu on palautettavissa niiden selitysuskottavuusvertailuun: selityksen paremmuus (ja vastaavasti huonommuus) liittyy olennaisesti sen uskottavuuteen – uskottavin selitys täyttää selittämistehtävän parhaiten, ja näin ollen sitä voi perustellusti pitää parhaana selityksenä. Toisaalta selityksiltä voi ylipäänsäkin vaatia jonkinlaista vähimmäisuskottavuutta: jos selitys on liian epäuskottava, siihen ei ole mielekästä pitäytyä edes parempien selitysten puutteessakaan, vaan tällöin on järkevämpää myöntää, ettei kyseiselle havaintoilmiölle toistaiseksi tunneta mitään nykytiedon valossa mahdollista selitystä.
  3. ^ Siegfried Scherer, Reinhard Junker:  Evoluutio – kriittinen analyysi (2. suomalainen painos), s. 329. Datakirjat, 2007. 978-951-98558-4-4.
  4. ^ "Estimating the Prevalence of Protein Sequences Adopting Functional Enzyme Folds" (2004). Journal of Molecular Biology 341 (5): 1295–1315. doi:10.1016/j.jmb.2004.06.058. ISSN 00222836.