La teoría de la renovación es la rama de la teoría de la probabilidad que generaliza el proceso de Poisson para tiempos de tenencia arbitrarios. En lugar de tiempos de espera distribuidos exponencialmente , un proceso de renovación puede tener tiempos de espera independientes e idénticamente distribuidos (IID) que tengan una media finita. Un proceso de renovación de recompensas tiene además una secuencia aleatoria de recompensas obtenidas en cada tiempo de retención, que son IID pero no necesitan ser independientes de los tiempos de retención.
Un proceso de renovación tiene propiedades asintóticas análogas a la ley fuerte de los grandes números y al teorema del límite central . La función de renovación (número esperado de llegadas) y la función de recompensa (valor de recompensa esperado) son de importancia clave en la teoría de la renovación. La función de renovación satisface una ecuación integral recursiva, la ecuación de renovación. La ecuación de renovación clave proporciona el valor límite de la convolución de con una función no negativa adecuada. La superposición de procesos de renovación puede estudiarse como un caso especial de los procesos de renovación de Markov .
Las aplicaciones incluyen calcular la mejor estrategia para reemplazar maquinaria desgastada en una fábrica y comparar los beneficios a largo plazo de diferentes pólizas de seguro. La paradoja de la inspección se relaciona con el hecho de que observar un intervalo de renovación en el tiempo t da un intervalo con un valor promedio mayor que el de un intervalo de renovación promedio.
El proceso de renovación es una generalización del proceso de Poisson . En esencia, el proceso de Poisson es un proceso de Markov de tiempo continuo en los números enteros positivos (generalmente comenzando en cero) que tiene tiempos de retención independientes distribuidos exponencialmente en cada número entero antes de avanzar al siguiente número entero . En un proceso de renovación, los tiempos de espera no necesitan tener una distribución exponencial; más bien, los tiempos de espera pueden tener cualquier distribución en los números positivos, siempre que los tiempos de espera sean independientes e idénticamente distribuidos ( IID ) y tengan una media finita.
Sea una secuencia de variables aleatorias independientes positivas distribuidas idénticamente con un valor esperado finito
Nos referimos a la variable aleatoria como el " ésimo tiempo de retención".
Definir para cada n > 0 :
cada uno se denomina " ésimo tiempo de salto" y los intervalos se denominan "intervalos de renovación".
Entonces está dada por una variable aleatoria
¿Dónde está la función indicadora ?
representa el número de saltos que se han producido en el tiempo t , y se denomina proceso de renovación.
Si se consideran eventos que ocurren en momentos aleatorios, se puede optar por pensar en los tiempos de espera como el tiempo aleatorio transcurrido entre dos eventos consecutivos. Por ejemplo, si el proceso de renovación modela el número de averías de diferentes máquinas, entonces el tiempo de espera representa el tiempo entre que una máquina se avería antes de que lo haga otra.
El proceso de Poisson es el proceso de renovación único con la propiedad de Markov , [1] ya que la distribución exponencial es la única variable aleatoria continua con la propiedad de falta de memoria.
Sea una secuencia de variables aleatorias IID ( recompensas ) que satisfagan
Entonces la variable aleatoria
Se llama proceso de renovación-recompensa . Tenga en cuenta que, a diferencia de , cada uno puede tomar valores negativos y positivos.
La variable aleatoria depende de dos secuencias: los tiempos de espera y las recompensas. Estas dos secuencias no tienen por qué ser independientes. En particular, puede ser una función de .
En el contexto de la interpretación anterior de los tiempos de espera como el tiempo entre fallos sucesivos de una máquina, las "recompensas" (que en este caso son negativas) pueden considerarse como los costes de reparación sucesivos incurridos como resultado de las sucesivas mal funcionamiento.
Una analogía alternativa es que tenemos un ganso mágico que pone huevos a intervalos (tiempos de retención) distribuidos como . A veces pone huevos de oro de peso aleatorio y, a veces, huevos tóxicos (también de peso aleatorio) que requieren una eliminación responsable (y costosa). Las "recompensas" son las pérdidas/ganancias financieras sucesivas (aleatorias) resultantes de huevos sucesivos ( i = 1,2,3,...) y registran la "recompensa" financiera total en el momento t .
Definimos la función de renovación como el valor esperado del número de saltos observados hasta cierto tiempo :
La función de renovación satisface
Definimos la función de recompensa :
La función de recompensa satisface
La función de renovación satisface
donde es la función de distribución acumulada de y es la función de densidad de probabilidad correspondiente.
Sea X un proceso de renovación con función de renovación y media de interrenovación . Sea una función que satisfaga:
El teorema clave de la renovación establece que, como : [3]
Considerando para cualquier caso especial el teorema de renovación: [4]
El resultado se puede demostrar mediante ecuaciones integrales o mediante un argumento de acoplamiento . [5] Aunque es un caso especial del teorema de renovación clave, se puede utilizar para deducir el teorema completo, considerando funciones escalonadas y luego aumentando secuencias de funciones escalonadas. [3]
Los procesos de renovación y los procesos de renovación-recompensa tienen propiedades análogas a la ley fuerte de los grandes números , que pueden derivarse del mismo teorema. Si es un proceso de renovación y es un proceso de renovación-recompensa entonces:
casi con seguridad.
Los procesos de renovación tienen además una propiedad análoga al teorema del límite central : [6]
Una característica curiosa de los procesos de renovación es que si esperamos un tiempo predeterminado t y luego observamos qué tan grande es el intervalo de renovación que contiene t , deberíamos esperar que sea típicamente mayor que un intervalo de renovación de tamaño promedio.
Matemáticamente, la paradoja de la inspección establece: para cualquier t > 0, el intervalo de renovación que contiene t es estocásticamente mayor que el primer intervalo de renovación. Es decir, para todo x > 0 y para todo t > 0:
donde F S es la función de distribución acumulada de los tiempos de retención del IID Si . Un claro ejemplo es la paradoja del tiempo de espera de los autobuses : para una distribución aleatoria dada de llegadas de autobuses, el pasajero promedio en una parada de autobús observa más retrasos que el operador promedio de los autobuses.
La resolución de la paradoja es que nuestra distribución muestreada en el momento t está sesgada por el tamaño (ver sesgo de muestreo ), en el sentido de que la probabilidad de que se elija un intervalo es proporcional a su tamaño. Sin embargo, un intervalo de renovación de tamaño promedio no está sesgado por el tamaño.
A menos que el proceso de renovación sea un proceso de Poisson, la superposición (suma) de dos procesos de renovación independientes no es un proceso de renovación. [7] Sin embargo, tales procesos pueden describirse dentro de una clase más amplia de procesos llamados procesos de renovación de Markov . [8] Sin embargo, la función de distribución acumulada del primer tiempo entre eventos en el proceso de superposición viene dada por [9]
donde R k ( t ) y α k > 0 son la CDF de los tiempos entre eventos y la tasa de llegada del proceso k . [10]
Eric, el empresario, tiene n máquinas, cada una con una vida operativa distribuida uniformemente entre cero y dos años. Eric puede dejar que cada máquina funcione hasta que falle y su reemplazo le costará 2600 €; alternativamente, puede sustituir una máquina en cualquier momento mientras aún esté en funcionamiento por un coste de 200 €.
¿Cuál es su política de reemplazo óptima?
{{cite journal}}
: CS1 maint: multiple names: authors list (link)