En estadística , una transformación de potencia es una familia de funciones que se aplican para crear una transformación monótona de datos utilizando funciones de potencia . Es una técnica de transformación de datos que se utiliza para estabilizar la varianza , hacer que los datos se asemejen más a una distribución normal , mejorar la validez de las medidas de asociación (como la correlación de Pearson entre variables) y para otros procedimientos de estabilización de datos.
Las transformadas de potencia se utilizan en múltiples campos, incluidos el análisis multirresolución y wavelet , [1] el análisis de datos estadísticos, la investigación médica, el modelado de procesos físicos, [2] el análisis de datos geoquímicos , [3] la epidemiología [4] y muchas otras áreas de investigación clínica, ambiental y social.
La transformación de potencia se define como una función continua del parámetro de potencia λ , que normalmente se da en forma de fragmentos que la hace continua en el punto de singularidad ( λ = 0). Para los vectores de datos ( y 1 ,..., y n ) en los que cada y i > 0, la transformación de potencia es
dónde
es la media geométrica de las observaciones y 1 , ..., y n . El caso para es el límite cuando se acerca a 0. Para ver esto, observe que - utilizando la serie de Taylor . Entonces , y todo excepto se vuelve insignificante para suficientemente pequeño.
La inclusión de la potencia ( λ − 1) de la media geométrica en el denominador simplifica la interpretación científica de cualquier ecuación que involucre , porque las unidades de medida no cambian a medida que cambia λ .
Box y Cox (1964) introdujeron la media geométrica en esta transformación incluyendo primero el jacobiano de la transformación de potencia reescalada.
con la probabilidad. Este jacobiano es el siguiente:
Esto permite escribir la verosimilitud normal en su valor máximo de la siguiente manera:
A partir de aquí, la absorción en la expresión para produce una expresión que establece que minimizar la suma de los cuadrados de los residuos de es equivalente a maximizar la suma del logaritmo normal de la verosimilitud de las desviaciones de y el logaritmo del jacobiano de la transformación.
El valor en Y = 1 para cualquier λ es 0, y la derivada con respecto a Y es 1 para cualquier λ . A veces, Y es una versión de alguna otra variable escalada para dar Y = 1 en algún tipo de valor promedio.
La transformación es una transformación de potencia , pero realizada de tal manera que sea continua con el parámetro λ en λ = 0. Ha demostrado ser popular en el análisis de regresión , incluida la econometría .
Box y Cox también propusieron una forma más general de la transformación que incorpora un parámetro de desplazamiento.
que se cumple si y i + α > 0 para todo i . Si τ( Y , λ, α) sigue una distribución normal truncada , entonces se dice que Y sigue una distribución de Box–Cox .
Bickel y Doksum eliminaron la necesidad de utilizar una distribución truncada al extender el rango de la transformación a todos los y , de la siguiente manera:
donde sgn(.) es la función de signo . Este cambio en la definición tiene poca importancia práctica siempre que sea menor que , lo que suele ser habitual. [5]
Bickel y Doksum también demostraron que las estimaciones de los parámetros son consistentes y asintóticamente normales en condiciones de regularidad apropiadas, aunque el límite inferior estándar de Cramér-Rao puede subestimar sustancialmente la varianza cuando los valores de los parámetros son pequeños en relación con la varianza del ruido. [5] Sin embargo, este problema de subestimar la varianza puede no ser un problema sustancial en muchas aplicaciones. [6] [7]
Las transformaciones Box-Cox de un parámetro se definen como
y las transformaciones Box-Cox de dos parámetros como
como se describe en el artículo original. [8] [9] Además, las primeras transformaciones son válidas para , y las segundas para . [8]
El parámetro se estima utilizando la función de verosimilitud del perfil y utilizando pruebas de bondad de ajuste. [10]
El intervalo de confianza para la transformación de Box-Cox se puede construir asintóticamente utilizando el teorema de Wilks sobre la función de verosimilitud del perfil para encontrar todos los valores posibles de que cumplen la siguiente restricción: [11]
El conjunto de datos hepáticos de BUPA [12] contiene datos sobre las enzimas hepáticas ALT y γGT . Supongamos que nos interesa utilizar log(γGT) para predecir la ALT. En el panel (a) de la figura aparece un gráfico de los datos. Parece haber una varianza no constante y una transformación de Box-Cox podría ayudar.
La verosimilitud logarítmica del parámetro de potencia aparece en el panel (b). La línea de referencia horizontal está a una distancia de χ 1 2 /2 del máximo y se puede utilizar para obtener un intervalo de confianza aproximado del 95 % para λ. Parece que un valor cercano a cero sería bueno, por lo que tomamos logaritmos.
Es posible que la transformación se pueda mejorar añadiendo un parámetro de desplazamiento a la transformación logarítmica. El panel (c) de la figura muestra la verosimilitud logarítmica. En este caso, el máximo de la verosimilitud es cercano a cero, lo que sugiere que no se necesita un parámetro de desplazamiento. El panel final muestra los datos transformados con una línea de regresión superpuesta.
Cabe señalar que, si bien las transformaciones de Box-Cox pueden mejorar considerablemente el ajuste del modelo, existen algunos problemas que no pueden solucionarse con la transformación. En el ejemplo actual, los datos tienen colas bastante pesadas, por lo que el supuesto de normalidad no es realista y un enfoque de regresión robusto conduce a un modelo más preciso.
Los economistas a menudo caracterizan las relaciones de producción mediante alguna variante de la transformación de Box-Cox. [13]
Consideremos una representación común de la producción Q como dependiente de los servicios proporcionados por un stock de capital K y por horas de trabajo N :
Resolviendo Q invirtiendo la transformación de Box-Cox encontramos
que se conoce como función de producción de elasticidad constante de sustitución (CES) .
La función de producción CES es una función homogénea de grado uno.
Cuando λ = 1, esto produce la función de producción lineal:
Cuando λ → 0 esto produce la famosa función de producción Cobb-Douglas :
Las páginas de recursos de SOCR contienen una serie de actividades interactivas prácticas [14] que demuestran la transformación de Box-Cox (potencia) mediante subprogramas y gráficos de Java. Estos ilustran directamente los efectos de esta transformación en gráficos Q-Q , gráficos de dispersión X-Y , gráficos de series temporales e histogramas .
La transformación de Yeo-Johnson [15] también permite valores cero y negativos de . puede ser cualquier número real, donde produce la transformación de identidad. La ley de transformación dice:
La transformación de Box-Tidwell es una técnica estadística que se utiliza para evaluar y corregir la no linealidad entre las variables predictoras y el logit en un modelo lineal generalizado, en particular en la regresión logística . Esta transformación es útil cuando la relación entre las variables independientes y el resultado no es lineal y no puede ser captada adecuadamente por el modelo estándar.
La transformación de Box-Tidwell fue desarrollada por George EP Box y John W. Tidwell en 1962 como una extensión de las transformaciones de Box-Cox , que se aplican a la variable dependiente. Sin embargo, a diferencia de la transformación de Box-Cox, la transformación de Box-Tidwell se aplica a las variables independientes en los modelos de regresión. Se utiliza a menudo cuando se viola el supuesto de linealidad entre los predictores y el resultado.
La idea general detrás de la transformación de Box-Tidwell es aplicar una transformación de potencia a cada variable independiente Xi en el modelo de regresión:
¿Dónde está el parámetro estimado a partir de los datos? Si la transformación de Box-Tidwell es significativamente diferente de 1, esto indica una relación no lineal entre Xi y el logit, y la transformación mejora el ajuste del modelo.
La prueba de Box-Tidwell se realiza generalmente ampliando el modelo de regresión con términos como y probando la significancia de los coeficientes. Si son significativos, esto sugiere que se debe aplicar una transformación para lograr una relación lineal entre el predictor y el logit.
La transformación es beneficiosa en modelos de regresión logística o de riesgos proporcionales en los que la no linealidad de los predictores continuos puede distorsionar la relación con la variable dependiente. Es una herramienta flexible que permite al investigador ajustar un modelo más apropiado a los datos sin tener que adivinar de antemano la forma funcional de la relación.
En la regresión logística , un supuesto clave es que las variables independientes continuas presentan una relación lineal con el logit de la variable dependiente. Las violaciones de este supuesto pueden conducir a estimaciones sesgadas y a un rendimiento reducido del modelo. La transformación de Box-Tidwell es un método utilizado para evaluar y corregir dichas violaciones al determinar si un predictor continuo requiere una transformación para lograr la linealidad con el logit.
La transformación de Box-Tidwell introduce un término de interacción entre cada variable continua Xi y su logaritmo natural :
Este término se incluye en el modelo de regresión logística para comprobar si la relación entre Xi y el logit es no lineal. Un coeficiente estadísticamente significativo para este término de interacción indica una violación del supuesto de linealidad, lo que sugiere la necesidad de una transformación del predictor. La transformación de Box-Tidwell proporciona una transformación de potencia adecuada para linealizar la relación, mejorando así la precisión y la validez del modelo. Por el contrario, los resultados no significativos respaldan el supuesto de linealidad.
Una limitación de la transformación de Box-Tidwell es que solo funciona con valores positivos de las variables independientes. Si los datos contienen valores negativos, la transformación no se puede aplicar directamente sin modificar las variables (por ejemplo, agregando una constante).