stringtranslate.com

Proceso de ramificación

En teoría de la probabilidad , un proceso de ramificación es un tipo de objeto matemático conocido como proceso estocástico , que consiste en colecciones de variables aleatorias indexadas por algún conjunto, generalmente números reales naturales o no negativos. El propósito original de los procesos de ramificación era servir como modelo matemático de una población en la que cada individuo en la generación  produce algún número aleatorio de individuos en la generación  , de acuerdo, en el caso más simple, con una distribución de probabilidad fija que no varía de individuo a individuo. [1] Los procesos de ramificación se utilizan para modelar la reproducción; por ejemplo, los individuos podrían corresponder a bacterias, cada una de las cuales genera 0, 1 o 2 descendientes con cierta probabilidad en una sola unidad de tiempo. Los procesos de ramificación también se pueden utilizar para modelar otros sistemas con dinámicas similares, por ejemplo, la propagación de apellidos en la genealogía o la propagación de neutrones en un reactor nuclear .

Una cuestión central en la teoría de los procesos de ramificación es la probabilidad de extinción final , donde no existen individuos después de un número finito de generaciones. Usando la ecuación de Wald , se puede demostrar que comenzando con un individuo en la generación cero, el tamaño  esperado de la generación n es igual a  μ n donde μ es el número esperado de hijos de cada individuo. Si μ < 1, entonces el número esperado de individuos tiende rápidamente a cero, lo que implica extinción final con probabilidad 1 por la desigualdad de Markov . Alternativamente, si μ > 1, entonces la probabilidad de extinción final es menor que 1 (pero no necesariamente cero; considere un proceso donde cada individuo tiene 0 o 100 hijos con igual probabilidad. En ese caso, μ = 50, pero la probabilidad de extinción final es mayor que 0.5, ya que esa es la probabilidad de que el primer individuo tenga 0 hijos). Si μ  = 1, entonces la extinción final ocurre con probabilidad 1 a menos que cada individuo siempre tenga exactamente un hijo.

En ecología teórica , el parámetro μ de un proceso de ramificación se denomina tasa reproductiva básica .

Formulación matemática

La formulación más común de un proceso de ramificación es la del proceso Galton-Watson . Sea Z n el estado en el periodo n (a menudo interpretado como el tamaño de la generación  n ), y sea X n,i una variable aleatoria que denota el número de sucesores directos del miembro i en el periodo n , donde X n,i son variables aleatorias independientes e idénticamente distribuidas sobre todos los n  ∈{ 0, 1, 2, ...} e i  ∈ {1, ...,  Z n }. Entonces la ecuación de recurrencia es

con Z 0 = 1.

Alternativamente, el proceso de ramificación puede formularse como un paseo aleatorio . Sea S i el estado en el período i y sea X i una variable aleatoria que es iid en todo i . Entonces la ecuación de recurrencia es

con S 0 = 1. Para obtener algo de intuición para esta formulación, imagine un paseo donde el objetivo es visitar cada nodo, pero cada vez que se visita un nodo no visitado previamente, se revelan nodos adicionales que también deben visitarse. Sea S i el número de nodos revelados pero no visitados en el período i , y sea X i el número de nodos nuevos que se revelan cuando se visita el nodo i . Luego, en cada período, el número de nodos revelados pero no visitados es igual al número de dichos nodos en el período anterior, más los nodos nuevos que se revelan al visitar un nodo, menos el nodo que se visita. El proceso termina una vez que se han visitado todos los nodos revelados.

Procesos de ramificación en tiempo continuo

En el caso de los procesos de ramificación en tiempo discreto, el "tiempo de ramificación" se fija en 1 para todos los individuos. En el caso de los procesos de ramificación en tiempo continuo, cada individuo espera un tiempo aleatorio (que es una variable aleatoria continua) y luego divide según la distribución dada. El tiempo de espera para los diferentes individuos es independiente y es independiente del número de hijos. En general, el tiempo de espera es una variable exponencial con parámetro λ para todos los individuos, de modo que el proceso es markoviano.

Problema de extinción para un proceso de Galton-Watson

La probabilidad de extinción máxima viene dada por

Para cualquier caso no trivial (los casos triviales son aquellos en los que la probabilidad de no tener descendencia es cero para cada miembro de la población; en tales casos, la probabilidad de extinción final es 0), la probabilidad de extinción final es igual a uno si μ  ≤ 1 y estrictamente menor que uno si μ  > 1.

El proceso puede analizarse utilizando el método de la función generadora de probabilidad . Sean p 0p 1p 2 , ... las probabilidades de producir 0, 1, 2, ... descendencia por cada individuo en cada generación. Sea d m la probabilidad de extinción en la m ésima generación. Obviamente, d 0 = 0. Dado que las probabilidades de todos los caminos que conducen a 0 en la m ésima generación deben sumarse, la probabilidad de extinción no disminuye en las generaciones. Es decir,

Por lo tanto, d m converge a un límite d , y d es la probabilidad de extinción máxima. Si hay j descendientes en la primera generación, entonces, para extinguirse en la generación m, cada una de estas líneas debe extinguirse en m  − 1 generaciones. Como proceden de forma independiente, la probabilidad es ( d m −1 ) j . Por lo tanto,

El lado derecho de la ecuación es una función generadora de probabilidad. Sea h ( z ) la función generadora ordinaria para p i :

Utilizando la función generadora, la ecuación anterior se convierte en

Como d md , d se puede encontrar resolviendo

Esto también es equivalente a encontrar el punto o los puntos de intersección de las líneas y  =  z e y  =  h ( z ) para  z  ≥ 0. y = z es una línea recta. y  =  h ( z ) es una función creciente (ya que ) y convexa (ya que ). Hay como máximo dos puntos de intersección. Como (1,1) es siempre un punto de intersección para las dos funciones, solo existen tres casos:

Tres casos de y = h ( z ) se intersecan con y = z .

El caso 1 tiene otro punto de intersección en z < 1 (ver la curva roja en el gráfico).

El caso 2 tiene solo un punto de intersección en z = 1. (Vea la curva verde en el gráfico)

El caso 3 tiene otro punto de intersección en z > 1. (Vea la curva negra en el gráfico)

En el caso 1, la probabilidad de extinción final es estrictamente menor que uno. Para los casos 2 y 3, la probabilidad de extinción final es igual a uno.

Al observar que h′ (1) =  p 1  + 2 p 2  + 3 p 3  + ... =  μ es exactamente el número esperado de descendientes que un progenitor podría producir, se puede concluir que para un proceso de ramificación con función generadora h ( z ) para el número de descendientes de un progenitor dado, si el número medio de descendientes producidos por un solo progenitor es menor o igual a uno, entonces la probabilidad de extinción final es uno. Si el número medio de descendientes producidos por un solo progenitor es mayor que uno, entonces la probabilidad de extinción final es estrictamente menor que uno.

Procesos de ramificación dependientes del tamaño

Junto con la discusión de un modelo más general de procesos de ramificación conocido como procesos de ramificación dependientes de la edad por Grimmett [2] , en el que los individuos viven más de una generación, Krishna Athreya ha identificado tres distinciones entre los procesos de ramificación dependientes del tamaño que tienen aplicación general. Athreya identifica las tres clases de procesos de ramificación dependientes del tamaño como medidas de ramificación subcríticas, estables y supercríticas. Para Athreya, los parámetros centrales son cruciales para controlar si se debe evitar la ramificación inestable subcrítica y supercrítica [3] . Los procesos de ramificación dependientes del tamaño también se analizan bajo el tema del proceso de ramificación dependiente de los recursos [4].

Ejemplo de problema de extinción

Supongamos que un progenitor puede producir como máximo dos descendientes. La probabilidad de extinción en cada generación es:

con d 0  = 0. Para la probabilidad de extinción máxima, necesitamos encontrar d que satisface d  =  p 0  +  p 1 d +  p 2 d 2 .

Tomando como ejemplo las probabilidades de los números de descendientes producidos p 0  = 0,1, p 1  = 0,6 y p 2  = 0,3, la probabilidad de extinción para las primeras 20 generaciones es la siguiente:

En este ejemplo, podemos resolver algebraicamente que d  = 1/3, y este es el valor al que la probabilidad de extinción converge con el aumento de generaciones.

Simulación de procesos de ramificación

Los procesos de ramificación se pueden simular para una variedad de problemas. Un uso específico del proceso de ramificación simulado es en el campo de la biología evolutiva. [5] [6] Los árboles filogenéticos, por ejemplo, se pueden simular bajo varios modelos, [7] ayudando a desarrollar y validar métodos de estimación, así como a respaldar la prueba de hipótesis.

Procesos de ramificación de múltiples tipos

En los procesos de ramificación multitipo, los individuos no son idénticos, pero pueden clasificarse en n tipos. Después de cada paso de tiempo, un individuo del tipo i producirá individuos de diferentes tipos, y , un vector aleatorio que representa la cantidad de hijos en diferentes tipos, satisface una distribución de probabilidad en .

Por ejemplo, consideremos la población de células madre cancerosas (CSC) y células no madre cancerosas (CCM). Después de cada intervalo de tiempo, cada CSC tiene probabilidad de producir dos CSC (división simétrica), probabilidad de producir una CSC y una CCM (división asimétrica), probabilidad de producir una CSC (estancamiento) y probabilidad de no producir nada (muerte); cada CCM tiene probabilidad de producir dos CCM (división simétrica), probabilidad de producir una CCM (estancamiento) y probabilidad de no producir nada (muerte). [8]

Ley de los grandes números para procesos de ramificación multitipo

En los procesos de ramificación multitipo en los que las poblaciones de diferentes tipos crecen exponencialmente, las proporciones de los diferentes tipos convergen casi con seguridad a un vector constante en determinadas condiciones moderadas. Esta es la ley fuerte de los grandes números para los procesos de ramificación multitipo.

En los casos de tiempo continuo, las proporciones de la esperanza poblacional satisfacen un sistema de ecuaciones diferenciales ordinarias , que tiene un único punto fijo de atracción. Este punto fijo es simplemente el vector al que convergen las proporciones en la ley de los grandes números.

La monografía de Athreya y Ney [9] resume un conjunto común de condiciones bajo las cuales esta ley de los grandes números es válida. Posteriormente se introducen algunas mejoras mediante el descarte de condiciones diferentes. [10] [11]

Otros procesos de ramificación

Existen muchos otros procesos de ramificación, por ejemplo, los procesos de ramificación en entornos aleatorios, en los que la ley de reproducción se elige aleatoriamente en cada generación, o los procesos de ramificación, en los que el crecimiento de la población está controlado por influencias externas o procesos que interactúan entre sí. Los procesos de ramificación en los que las partículas tienen que trabajar (aportar recursos al entorno) para poder reproducirse y vivir en una estructura social cambiante que controla la distribución de los recursos, son los llamados procesos de ramificación dependientes de los recursos.

El límite de escala de los procesos de ramificación casi críticos se puede utilizar para obtener superprocesos .

Véase también

Referencias

  1. ^ Athreya, KB (2006). "Proceso de ramificación". Enciclopedia de Environmetrics . doi :10.1002/9780470057339.vab032. ISBN 978-0471899976.
  2. ^ GR Grimmett y DR Stirzaker, Probabilidad y procesos aleatorios, 2.ª ed., Clarendon Press, Oxford, 1992.
  3. ^ Krishna Athreya y Peter Jagers. Procesos de ramificación . Springer. 1973.
  4. ^ F. Thomas Bruss y M. Duerinckx (2015) "Procesos de ramificación dependientes de recursos y la envoltura de las sociedades", Annals of Applied Probability. 25: 324–372.
  5. ^ Hagen, O.; Hartmann, K.; Steel, M.; Stadler, T. (1 de mayo de 2015). "La especiación dependiente de la edad puede explicar la forma de las filogenias empíricas". Biología sistemática . 64 (3): 432–440. doi :10.1093/sysbio/syv001. ISSN  1063-5157. PMC 4395845 . PMID  25575504. 
  6. ^ Hagen, Oskar; Andermann, Tobias; Quental, Tiago B.; Antonelli, Alexandre; Silvestro, Daniele (mayo de 2018). "Estimación de la extinción dependiente de la edad: evidencia contrastante de fósiles y filogenias". Biología sistemática . 67 (3): 458–474. doi : 10.1093/sysbio/syx082 . PMC 5920349 . PMID  29069434. 
  7. ^ Hagen, Oskar; Stadler, Tanja (2018). "TreeSimGM: Simulación de árboles filogenéticos bajo modelos generales de Bellman-Harris con cambios específicos de linaje en la especiación y extinción en R". Métodos en ecología y evolución . 9 (3): 754–760. doi :10.1111/2041-210X.12917. ISSN  2041-210X. PMC 5993341 . PMID  29938014. 
  8. ^ Chen, Xiufang; Wang, Yue; Feng, Tianquan; Yi, Ming; Zhang, Xingan; Zhou, Da (2016). "El sobreimpulso y el equilibrio fenotípico en la caracterización de la dinámica del cáncer de la plasticidad fenotípica reversible". Revista de biología teórica . 390 : 40–49. arXiv : 1503.04558 . doi :10.1016/j.jtbi.2015.11.008. PMID  26626088. S2CID  15335040.
  9. ^ Athreya, Krishna B.; Ney, Peter E. (1972). Procesos de ramificación . Berlín: Springer-Verlag. págs. 199-206. ISBN 978-3-642-65371-1.
  10. ^ Janson, Svante (2003). "Teoremas de límite funcional para procesos de ramificación multitipo y urnas de Pólya generalizadas". Procesos estocásticos y sus aplicaciones . 110 (2): 177–245. doi : 10.1016/j.spa.2003.12.002 .
  11. ^ Jiang, Da-Quan; Wang, Yue; Zhou, Da (2017). "Equilibrio fenotípico como convergencia probabilística en dinámicas de poblaciones celulares multifenotípicas". PLOS ONE . ​​12 (2): e0170916. Bibcode :2017PLoSO..1270916J. doi : 10.1371/journal.pone.0170916 . PMC 5300154 . PMID  28182672.