En teoría de la probabilidad , un proceso de ramificación es un tipo de objeto matemático conocido como proceso estocástico , que consiste en colecciones de variables aleatorias indexadas por algún conjunto, generalmente números reales naturales o no negativos. El propósito original de los procesos de ramificación era servir como modelo matemático de una población en la que cada individuo en la generación produce algún número aleatorio de individuos en la generación , de acuerdo, en el caso más simple, con una distribución de probabilidad fija que no varía de individuo a individuo. [1] Los procesos de ramificación se utilizan para modelar la reproducción; por ejemplo, los individuos podrían corresponder a bacterias, cada una de las cuales genera 0, 1 o 2 descendientes con cierta probabilidad en una sola unidad de tiempo. Los procesos de ramificación también se pueden utilizar para modelar otros sistemas con dinámicas similares, por ejemplo, la propagación de apellidos en la genealogía o la propagación de neutrones en un reactor nuclear .
Una cuestión central en la teoría de los procesos de ramificación es la probabilidad de extinción final , donde no existen individuos después de un número finito de generaciones. Usando la ecuación de Wald , se puede demostrar que comenzando con un individuo en la generación cero, el tamaño esperado de la generación n es igual a μ n donde μ es el número esperado de hijos de cada individuo. Si μ < 1, entonces el número esperado de individuos tiende rápidamente a cero, lo que implica extinción final con probabilidad 1 por la desigualdad de Markov . Alternativamente, si μ > 1, entonces la probabilidad de extinción final es menor que 1 (pero no necesariamente cero; considere un proceso donde cada individuo tiene 0 o 100 hijos con igual probabilidad. En ese caso, μ = 50, pero la probabilidad de extinción final es mayor que 0.5, ya que esa es la probabilidad de que el primer individuo tenga 0 hijos). Si μ = 1, entonces la extinción final ocurre con probabilidad 1 a menos que cada individuo siempre tenga exactamente un hijo.
En ecología teórica , el parámetro μ de un proceso de ramificación se denomina tasa reproductiva básica .
La formulación más común de un proceso de ramificación es la del proceso Galton-Watson . Sea Z n el estado en el periodo n (a menudo interpretado como el tamaño de la generación n ), y sea X n,i una variable aleatoria que denota el número de sucesores directos del miembro i en el periodo n , donde X n,i son variables aleatorias independientes e idénticamente distribuidas sobre todos los n ∈{ 0, 1, 2, ...} e i ∈ {1, ..., Z n }. Entonces la ecuación de recurrencia es
con Z 0 = 1.
Alternativamente, el proceso de ramificación puede formularse como un paseo aleatorio . Sea S i el estado en el período i y sea X i una variable aleatoria que es iid en todo i . Entonces la ecuación de recurrencia es
con S 0 = 1. Para obtener algo de intuición para esta formulación, imagine una caminata donde el objetivo es visitar cada nodo, pero cada vez que se visita un nodo no visitado previamente, se revelan nodos adicionales que también deben visitarse. Sea S i el número de nodos revelados pero no visitados en el período i , y sea X i el número de nodos nuevos que se revelan cuando se visita el nodo i . Luego, en cada período, el número de nodos revelados pero no visitados es igual al número de dichos nodos en el período anterior, más los nodos nuevos que se revelan al visitar un nodo, menos el nodo que se visita. El proceso termina una vez que se han visitado todos los nodos revelados.
En el caso de los procesos de ramificación en tiempo discreto, el "tiempo de ramificación" se fija en 1 para todos los individuos. En el caso de los procesos de ramificación en tiempo continuo, cada individuo espera un tiempo aleatorio (que es una variable aleatoria continua) y luego divide según la distribución dada. El tiempo de espera para los diferentes individuos es independiente y es independiente del número de hijos. En general, el tiempo de espera es una variable exponencial con parámetro λ para todos los individuos, de modo que el proceso es markoviano.
La probabilidad de extinción máxima viene dada por
Para cualquier caso no trivial (los casos triviales son aquellos en los que la probabilidad de no tener descendencia es cero para cada miembro de la población; en tales casos, la probabilidad de extinción final es 0), la probabilidad de extinción final es igual a uno si μ ≤ 1 y estrictamente menor que uno si μ > 1.
El proceso puede analizarse utilizando el método de la función generadora de probabilidad . Sean p 0 , p 1 , p 2 , ... las probabilidades de producir 0, 1, 2, ... descendencia por cada individuo en cada generación. Sea d m la probabilidad de extinción en la m ésima generación. Obviamente, d 0 = 0. Dado que las probabilidades de todos los caminos que conducen a 0 en la m ésima generación deben sumarse, la probabilidad de extinción no disminuye en las generaciones. Es decir,
Por lo tanto, d m converge a un límite d , y d es la probabilidad de extinción máxima. Si hay j descendientes en la primera generación, entonces, para extinguirse en la generación m, cada una de estas líneas debe extinguirse en m − 1 generaciones. Como proceden de forma independiente, la probabilidad es ( d m −1 ) j . Por lo tanto,
El lado derecho de la ecuación es una función generadora de probabilidad. Sea h ( z ) la función generadora ordinaria para p i :
Utilizando la función generadora, la ecuación anterior se convierte en
Como d m → d , d se puede encontrar resolviendo
Esto también es equivalente a encontrar el punto o los puntos de intersección de las líneas y = z e y = h ( z ) para z ≥ 0. y = z es una línea recta. y = h ( z ) es una función creciente (ya que ) y convexa (ya que ). Hay como máximo dos puntos de intersección. Como (1,1) siempre es un punto de intersección para las dos funciones, solo existen tres casos:
El caso 1 tiene otro punto de intersección en z < 1 (ver la curva roja en el gráfico).
El caso 2 tiene solo un punto de intersección en z = 1. (Vea la curva verde en el gráfico)
El caso 3 tiene otro punto de intersección en z > 1. (Vea la curva negra en el gráfico)
En el caso 1, la probabilidad de extinción final es estrictamente menor que uno. Para los casos 2 y 3, la probabilidad de extinción final es igual a uno.
Al observar que h′ (1) = p 1 + 2 p 2 + 3 p 3 + ... = μ es exactamente el número esperado de descendientes que un progenitor podría producir, se puede concluir que para un proceso de ramificación con función generadora h ( z ) para el número de descendientes de un progenitor dado, si el número medio de descendientes producidos por un solo progenitor es menor o igual a uno, entonces la probabilidad de extinción final es uno. Si el número medio de descendientes producidos por un solo progenitor es mayor que uno, entonces la probabilidad de extinción final es estrictamente menor que uno.
Junto con la discusión de un modelo más general de procesos de ramificación conocido como procesos de ramificación dependientes de la edad por Grimmett [2] , en el que los individuos viven más de una generación, Krishna Athreya ha identificado tres distinciones entre los procesos de ramificación dependientes del tamaño que tienen aplicación general. Athreya identifica las tres clases de procesos de ramificación dependientes del tamaño como medidas de ramificación subcríticas, estables y supercríticas. Para Athreya, los parámetros centrales son cruciales para controlar si se debe evitar la ramificación inestable subcrítica y supercrítica [3] . Los procesos de ramificación dependientes del tamaño también se analizan bajo el tema del proceso de ramificación dependiente de los recursos [4].
Supongamos que un progenitor puede producir como máximo dos descendientes. La probabilidad de extinción en cada generación es:
con d 0 = 0. Para la probabilidad de extinción máxima, necesitamos encontrar d que satisface d = p 0 + p 1 d + p 2 d 2 .
Tomando como ejemplo las probabilidades de los números de descendientes producidos p 0 = 0,1, p 1 = 0,6 y p 2 = 0,3, la probabilidad de extinción para las primeras 20 generaciones es la siguiente:
En este ejemplo, podemos resolver algebraicamente que d = 1/3, y este es el valor al que la probabilidad de extinción converge con el aumento de generaciones.
Los procesos de ramificación se pueden simular para una variedad de problemas. Un uso específico del proceso de ramificación simulado es en el campo de la biología evolutiva. [5] [6] Los árboles filogenéticos, por ejemplo, se pueden simular bajo varios modelos, [7] ayudando a desarrollar y validar métodos de estimación, así como a respaldar la prueba de hipótesis.
En los procesos de ramificación multitipo, los individuos no son idénticos, pero pueden clasificarse en n tipos. Después de cada paso de tiempo, un individuo del tipo i producirá individuos de diferentes tipos, y , un vector aleatorio que representa la cantidad de hijos en diferentes tipos, satisface una distribución de probabilidad en .
Por ejemplo, consideremos la población de células madre cancerosas (CSC) y células no madre cancerosas (CCM). Después de cada intervalo de tiempo, cada CSC tiene probabilidad de producir dos CSC (división simétrica), probabilidad de producir una CSC y una CCM (división asimétrica), probabilidad de producir una CSC (estancamiento) y probabilidad de no producir nada (muerte); cada CCM tiene probabilidad de producir dos CCM (división simétrica), probabilidad de producir una CCM (estancamiento) y probabilidad de no producir nada (muerte). [8]
En los procesos de ramificación multitipo en los que las poblaciones de diferentes tipos crecen exponencialmente, las proporciones de los diferentes tipos convergen casi con seguridad a un vector constante en determinadas condiciones moderadas. Esta es la ley fuerte de los grandes números para los procesos de ramificación multitipo.
En los casos de tiempo continuo, las proporciones de la esperanza poblacional satisfacen un sistema de ecuaciones diferenciales ordinarias , que tiene un único punto fijo de atracción. Este punto fijo es simplemente el vector al que convergen las proporciones en la ley de los grandes números.
La monografía de Athreya y Ney [9] resume un conjunto común de condiciones bajo las cuales esta ley de los grandes números es válida. Posteriormente se introducen algunas mejoras mediante el descarte de condiciones diferentes. [10] [11]
Existen muchos otros procesos de ramificación, por ejemplo, los procesos de ramificación en entornos aleatorios, en los que la ley de reproducción se elige aleatoriamente en cada generación, o los procesos de ramificación, en los que el crecimiento de la población está controlado por influencias externas o procesos que interactúan entre sí. Los procesos de ramificación en los que las partículas tienen que trabajar (aportar recursos al entorno) para poder reproducirse y vivir en una estructura social cambiante que controla la distribución de los recursos, son los llamados procesos de ramificación dependientes de los recursos.
El límite de escala de los procesos de ramificación casi críticos se puede utilizar para obtener superprocesos .