Distribución condicional en estadística
En estadística , una distribución truncada es una distribución condicional que resulta de restringir el dominio de alguna otra distribución de probabilidad . Las distribuciones truncadas surgen en la estadística práctica en casos en los que la capacidad de registrar, o incluso conocer, ocurrencias está limitada a valores que se encuentran por encima o por debajo de un umbral dado o dentro de un rango específico. Por ejemplo, si se examinan las fechas de nacimiento de los niños en una escuela, estas normalmente estarían sujetas a truncamiento en relación con las de todos los niños en el área, dado que la escuela acepta solo niños en un rango de edad determinado en una fecha específica. No habría información sobre cuántos niños en la localidad tenían fechas de nacimiento anteriores o posteriores a las fechas de corte de la escuela si solo se utilizara un enfoque directo a la escuela para obtener información.
Cuando el muestreo es tal que se retiene el conocimiento de los elementos que caen fuera del rango requerido, sin registrar los valores reales, esto se conoce como censura , a diferencia del truncamiento que se realiza aquí. [1]
Definición
El siguiente análisis se realiza en términos de una variable aleatoria que tiene una distribución continua, aunque las mismas ideas se aplican a las distribuciones discretas . De manera similar, el análisis supone que el truncamiento se realiza en un intervalo semiabierto y ∈ ( a,b ], pero se pueden manejar otras posibilidades de manera directa.
Supongamos que tenemos una variable aleatoria, que se distribuye de acuerdo con una función de densidad de probabilidad, , con una función de distribución acumulativa, ambas con un soporte infinito . Supongamos que deseamos conocer la densidad de probabilidad de la variable aleatoria después de restringir el soporte para que esté entre dos constantes de modo que el soporte, . Es decir, supongamos que deseamos saber cómo se distribuye dado .
donde para todos y en cualquier otro lugar. Es decir, donde es la función indicadora. Nótese que el denominador en la distribución truncada es constante con respecto a .
Nótese que en realidad es una densidad:
- .
No es necesario eliminar partes de la parte superior e inferior de las distribuciones truncadas. Una distribución truncada en la que solo se ha eliminado la parte inferior de la distribución es la siguiente:
donde para todos y en cualquier otro lugar, y es la función de distribución acumulativa .
Una distribución truncada en la que se ha eliminado la parte superior de la distribución es la siguiente:
donde para todos y en cualquier otro lugar, y es la función de distribución acumulativa .
Expectativa de variable aleatoria truncada
Supongamos que deseamos hallar el valor esperado de una variable aleatoria distribuida según la densidad y una distribución acumulativa de dado que la variable aleatoria, , es mayor que un valor conocido . La esperanza de una variable aleatoria truncada es, por tanto:
donde de nuevo es para todos y en todas partes.
Siendo y los límites inferior y superior respectivamente del soporte para la función de densidad original (que suponemos que es continua), las propiedades de , donde es una función continua con una derivada continua, incluyen:
- y
Siempre que existan los límites, es decir: , y donde representa o .
Ejemplos
La distribución normal truncada es un ejemplo importante. [2]
El modelo Tobit emplea distribuciones truncadas. Otros ejemplos incluyen la distribución binomial truncada en x=0 y la distribución de Poisson truncada en x=0.
Truncamiento aleatorio
Supongamos que tenemos la siguiente configuración: se selecciona al azar un valor de truncamiento, , de una densidad, , pero este valor no se observa. Luego, se selecciona al azar un valor, , de la distribución truncada, . Supongamos que observamos y deseamos actualizar nuestra creencia sobre la densidad de la observación dada.
Primero, por definición:
- , y
Tenga en cuenta que debe ser mayor que , por lo tanto, cuando integramos sobre , establecemos un límite inferior de . Las funciones y son la función de densidad incondicional y la función de distribución acumulativa incondicional, respectivamente.
Por la regla de Bayes ,
que se expande a
Dos distribuciones uniformes (ejemplo)
Supongamos que sabemos que t se distribuye uniformemente desde [0, T ] y que x | t se distribuye uniformemente en [0, t ]. Sean g ( t ) y f ( x | t ) las densidades que describen t y x respectivamente. Supongamos que observamos un valor de x y deseamos conocer la distribución de t dado ese valor de x .
Véase también
Referencias
- ^ Dodge, Y. (2003) Diccionario Oxford de términos estadísticos . OUP. ISBN 0-19-920613-9
- ^ Johnson, NL, Kotz, S., Balakrishnan, N. (1994) Distribuciones univariadas continuas, volumen 1 , Wiley. ISBN 0-471-58495-9 (Sección 10.1)