Poimintaongelma (biokemia)

Poimintaongelma (engl. sampling problem) liittyy kysymykseen, miten yleistä peptidisekvenssien biologinen aktiivisuus on. Kysymyksen voi muotoilla täsmällisemmin mutta jonkin verran vaikeatajuisemmin: mikä on tietynpituisten biologisesti aktiivisten peptidisekvenssien lukumäärän (eli niiden muodostaman sekvenssialiavaruuden koon) suhde kaikkien mahdollisten samanpituisten peptidisekvenssien lukumäärään (eli niiden muodostaman sekvenssiavaruuden kokoon)?

Tämä kysymyksenasettelu on tärkeä pyrittäessä arvioimaan evoluutioteoreettisten mekanismien selitysriittävyyttä1 ja selitysuskottavuutta2 eri proteiinien väitettyinä aikaansaajina.

Esimerkkejä

β-laktamaasi

Penisilliiniä hajottavan β-laktamaasientsyymin pituus on 153 aminohappoa. Kaikkia saman entsymaattisen funktion toteuttavia 153 aminohapon mittaisia sekvenssejä ei kylläkään pystytä tarkasti laskemaan, mutta koodisekvenssianalyysiin perustuva estimointi on antanut niiden lukumäärän (sekvenssialiavaruuden koon) suuruusluokka-arvioksi 10122. Käytettävissä olevista 20 proteogeenisestä aminohaposta muodostettavissa olevien, 153 aminohapon mittaisten eri sekvenssien lukumäärä (sekvenssiavaruuden koko) on kaikkiaan 20153 ≈ 10199. Toisin sanoen todennäköisyys sille, että tästä sekvenssiavaruudesta sattumanvaraisesti poimittu sekvenssi S kuuluisi kyseiseen sekvenssialiavaruuteen eli että sillä olisi ko. entsymaattinen funktio E, on yhtä kuin p(E|S) ≈ 10122/10199 = 10-77. 34



Viitteet

  1. ^ Jollekin havainnolle ehdotetun tietyn syntytavan selitysriittävyys (engl. explanatory sufficiency) liittyy kysymykseen siitä, miten todennäköisesti tämä selitystarjokas riittäisi (olemassaollessaan, esiintyessään, voimassaollessaan tai toteutuessaan) saamaan aikaan havaitun selitettävän ilmiön: mitä todennäköisemmin näin tapahtuu, sitä riittävämpi kyseinen syntyskenaario on.
  2. ^ Ehdotetun selityksen selitysuskottavuus (engl. explanatory likelihood) riippuu suoraan sekä sen selitysriittävyydestä (engl. explanatory sufficiency) että sen (olemassaolon, esiintymisen, voimassaolon tai toteutumisen) omasta (selitettävän ilmiön esiintymisestä riippumattomasta) alkuperäistodennäköisyydestä (engl. prior probability).
    Eri selitystapojen keskinäinen paremmuusvertailu on palautettavissa niiden selitysuskottavuusvertailuun: selityksen paremmuus (ja vastaavasti huonommuus) liittyy olennaisesti sen uskottavuuteen – uskottavin selitys täyttää selittämistehtävän parhaiten, ja näin ollen sitä voi perustellusti pitää parhaana selityksenä. Toisaalta selityksiltä voi ylipäänsäkin vaatia jonkinlaista vähimmäisuskottavuutta: jos selitys on liian epäuskottava, siihen ei ole mielekästä pitäytyä edes parempien selitysten puutteessakaan, vaan tällöin on järkevämpää myöntää, ettei kyseiselle havaintoilmiölle toistaiseksi tunneta mitään nykytiedon valossa mahdollista selitystä.
  3. ^ Siegfried Scherer, Reinhard Junker:  Evoluutio – kriittinen analyysi (2. suomalainen painos), s. 329. Datakirjat, 2007. 978-951-98558-4-4.
  4. ^ "Estimating the Prevalence of Protein Sequences Adopting Functional Enzyme Folds" (2004). Journal of Molecular Biology 341 (5): 1295–1315. doi:10.1016/j.jmb.2004.06.058. ISSN 00222836.