Information

Er det samlede antal mutationer på forskellige grene af gentræet uafhængige eller ej?

Er det samlede antal mutationer på forskellige grene af gentræet uafhængige eller ej?



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

Jeg læste Tajimas papir fra 1989 om hans test for neutralitet.

Tajima, Fumio. "Statistisk metode til at teste den neutrale mutationshypotese ved DNA-polymorfi." Genetics 123.3 (1989): 585-595.

Her er spørgsmålet: Antag, at vi har tre sekvenser mærket $C,D,E$, og deres genealogi følger ${{CD}E}$ (dvs. $C$ og $D$ smelter sammen først, før de smelter sammen med $E$). Lad $B$ være den seneste fælles forfader til $C$ og $D$.

Lad nu den tilfældige variabel $k_{ij}$ være antallet af nukleotidforskelle mellem sekvensen $i$ og sekvensen $j$, så viser Tajima, at $k_{BC}$ og $k_{BD}$ har et ikke-nul kovarians.

Men er mutationer i grenen $BC$ ikke uafhængige af mutationer i grenen $BD$? Jeg tænkte, at det samlede antal mutationer i mærket $BC$ og $BD$ er to uafhængige identisk fordelte variabler, så $k_{BC}$ og $k_{BD}$ er uafhængige, hvorfor de så har en ikke- nul kovarians?

============Opdatering==============

Nu har jeg nogle grundlæggende ideer, men har ikke udarbejdet det fulde svar.

Tajimas definition af $k_{ij}$ er hverken uafhængig af stikprøvestørrelsen eller for en fast sammensmeltningstid. (Se hans papir fra 1983: Tajima, Fumio. "Evolutionært forhold mellem DNA-sekvenser i endelige populationer." Genetics 105.2 (1983): 437-460.)

For eksempel, i en stikprøvestørrelse på 3, hvis du vælger 2 individer og betinger, at de to smelter sammen først, vil deres sammensmeltningstid følge: egin{align*} mathbb{P}(t=T)=p( T)=frac{3}{2N}e^{-frac{3}{2N}T} end{align*} Betinger nu på en fast sammensmeltningstid $t$, antallet af mutationer under de uendelige steder model i hver gren enten fra $B$ til $C$ eller fra $B$ til $D$ vil følge en poissonfordeling med parameteren $mu t$, hvor $mu$ er mutationsraten pr. sekvens pr. generation. Lad denne tilfældige giftvariabel være $xi_t$ i gren $BC$ og $eta_t$ i gren $BD$. Derefter egin{align*} k_{BC}=sum_{t=0}^{infty}xi_tp(t) k_{BD}=sum_{t=0}^{infty}eta_tp (t) end{align*} Hvis vi kun betragter delsummen af ​​ovenstående række, egin{align*} k_{BC}^{(n)}=sum_{t=0}^{n} xi_tp(t) k_{BD}^{(m)}=sum_{t=0}^{n}eta_tp(t) end{align*} derefter $k_{BC}^{(n) }$ og $k_{BD}^{(n)}$ har klart en kovarians på nul, fordi $xi_t$ og $eta_t$ er uafhængige giftvariabler, derfor egin{align*} mathbb{E}(k_ {BC}^{(n)}k_{BD}^{(n)})&=mathbb{E}(sum_{t=0}^{n}xi_tp(t)sum_{t=0 }^{n}eta_tp(t))=sum_{i=0}^{n}sum_{j=0}^np(i)p(j)mathbb{E}(xi_ieta_j) =sum_{i=0}^{n}sum_{j=0}^np(i)p(j)mathbb{E}xi_imathbb{E}eta_j &=mathbb{E }k_{BC}^{(n)}mathbb{E}k_{BD}^{(n)}, end{align*} så deres kovarians er nul.

Men som $n o+infty$, er det tvivlsomt, hvordan $k_{BC}^{(n)}k_{BD}^{(n)}$ konvergerer til $k_{BC}k_{BD}$. Det vil ikke konvergere ensartet til $k_{BC}k_{BD}$, fordi ellers kan vi først beregne forventningen og derefter tage grænsen, hvilket giver os en nul kovarians. Tajima viste os ikke eksplicit, hvordan han beregnede kovariansen ved at summere tre uendelige serier sammen (Linje 7, s. 448, 1983's papir). Jeg prøvede direkte at arbejde på den serie, men mislykkedes i den sidste sum. Hans resultat er korrekt, men jeg håber, at nogen kan give et hint om, hvorfor der er en iboende sammenhæng mellem disse tilsyneladende uafhængige tilfældige variable.

=======Opdatering: en simpel forklaring er blevet indsendt===============


Her er et enkelt svar på mit spørgsmål. Grunden til, at to antal totale mutationer akkumuleret i to divergerende grene ikke er uafhængige af hinanden, er fordi de oplever den samme mængde sammensmeltningstid.

Mens den stationære Poisson-mutationsprocesser er uafhængige af hinanden, så længe de forekommer i forskellige grene af en genealogi, vil de sandsynligvis producere et lignende antal mutationer, hvis to sådanne processer sker sammen i samme tid. Således er den ikke-nul del af kovariansen mellem $k_{BC}$ og $k_{BD}$ ikke fra mutationsprocesserne i sig selv, men fra den delte koalescenttid $T$.


Se videoen: What is Strain Coronavirus. Strain Coronavirus कय ह और यह कतन खतरनक ह u0026 Mutation कय ह? (August 2022).