En estadística , la prueba de Breusch-Pagan , desarrollada en 1979 por Trevor Breusch y Adrian Pagan , [1] se utiliza para probar la heterocedasticidad en un modelo de regresión lineal . Fue sugerida independientemente con cierta extensión por R. Dennis Cook y Sanford Weisberg en 1983 ( prueba de Cook-Weisberg ). [2] Derivada del principio de la prueba del multiplicador de Lagrange , prueba si la varianza de los errores de una regresión depende de los valores de las variables independientes. En ese caso, hay heterocedasticidad.
Supongamos que estimamos el modelo de regresión
y obtener de este modelo ajustado un conjunto de valores para , los residuos. Los mínimos cuadrados ordinarios restringen estos de modo que su media sea 0 y, por lo tanto, dado el supuesto de que su varianza no depende de las variables independientes , se puede obtener una estimación de esta varianza a partir del promedio de los valores al cuadrado de los residuos. Si el supuesto no se cumple, un modelo simple podría ser que la varianza está relacionada linealmente con las variables independientes. Tal modelo se puede examinar haciendo una regresión de los residuos al cuadrado sobre las variables independientes, utilizando una ecuación de regresión auxiliar de la forma
Esta es la base de la prueba de Breusch-Pagan. Es una prueba de chi-cuadrado : el estadístico de prueba se distribuye nχ 2 con k grados de libertad. Si el estadístico de prueba tiene un valor p por debajo de un umbral apropiado (por ejemplo, p < 0,05), se rechaza la hipótesis nula de homocedasticidad y se supone que existe heterocedasticidad.
Si la prueba de Breusch-Pagan muestra que hay heterocedasticidad condicional, se podrían utilizar mínimos cuadrados ponderados (si se conoce la fuente de la heterocedasticidad) o utilizar errores estándar consistentes con la heterocedasticidad .
Según los supuestos clásicos, el método de mínimos cuadrados ordinarios es el mejor estimador lineal insesgado (BLUE), es decir, es insesgado y eficiente. Sigue siendo insesgado en condiciones de heterocedasticidad, pero se pierde eficiencia. Antes de decidirse por un método de estimación, se puede realizar la prueba de Breusch-Pagan para examinar la presencia de heterocedasticidad. La prueba de Breusch-Pagan se basa en modelos del tipo de las varianzas de las observaciones donde se explica la diferencia en las varianzas. La hipótesis nula es equivalente a las restricciones de parámetros:
El siguiente multiplicador de Lagrange (LM) produce la estadística de prueba para la prueba de Breusch-Pagan: [ cita requerida ]
Esta prueba se puede implementar mediante el siguiente procedimiento de tres pasos:
donde los términos z normalmente, pero no necesariamente, serán los mismos que las covariables originales x .
donde TSS es la suma de las desviaciones al cuadrado de la media de 1, y RSS es la suma de los residuos al cuadrado de la regresión auxiliar. La estadística de prueba se distribuye asintóticamente como bajo la hipótesis nula de homocedasticidad y se distribuye normalmente , como lo demostraron Breusch y Pagan en su artículo de 1979.
Una variante de esta prueba, robusta en el caso de un término de error no gaussiano , fue propuesta por Roger Koenker . [3] En esta variante, la variable dependiente en la regresión auxiliar es simplemente el residuo al cuadrado de la regresión del Paso 1, y la estadística de prueba es de la regresión auxiliar. Como señala Koenker (1981, página 111), si bien la estadística revisada tiene un tamaño asintótico correcto, su potencia "puede ser bastante pobre excepto en condiciones gaussianas idealizadas".
En R , esta prueba se realiza mediante la función ncvTest disponible en el paquete car , [4] la función bptest disponible en el paquete lmtest , [5] [6] la función plmtest disponible en el paquete plm , [7] o la función breusch_pagan disponible en el paquete skedastic . [8]
En Stata, se especifica la regresión completa y luego se ingresa el comando estat hettest
seguido de todas las variables independientes. [9] [10]
En SAS, Breusch–Pagan se puede obtener utilizando la opción Proc Model.
En Python , hay un método het_breuschpagan en statsmodels.stats.diagnostic (el paquete statsmodels) para la prueba de Breusch-Pagan. [11]
En gretl , el comando modtest --breusch-pagan
se puede aplicar después de una regresión OLS.