stringtranslate.com

Gráfico de regresión parcial

En estadística aplicada , un gráfico de regresión parcial intenta mostrar el efecto de agregar otra variable a un modelo que ya tiene una o más variables independientes. Los gráficos de regresión parcial también se conocen como gráficos de variables agregadas , gráficos de variables ajustadas y gráficos de coeficientes individuales .

Motivación

Al realizar una regresión lineal con una única variable independiente , un diagrama de dispersión de la variable de respuesta frente a la variable independiente proporciona una buena indicación de la naturaleza de la relación. Si hay más de una variable independiente, las cosas se vuelven más complicadas ya que las variables independientes pueden estar correlacionadas (positivamente o negativamente). Aunque todavía puede resultar útil generar diagramas de dispersión de la variable de respuesta frente a cada una de las variables independientes, esto no tiene en cuenta el efecto de las otras variables independientes en el modelo.

Cálculo

Los gráficos de regresión parcial están formados por:

  1. Calcular los residuos de la regresión de la variable de respuesta contra las variables independientes pero omitiendo X i
  2. Calcular los residuos de la regresión X i contra las variables independientes restantes
  3. Trazar los residuos de (1) contra los residuos de (2).

Velleman y Welsch [1] expresan esto matemáticamente como:

dónde

Y •[i] = residuos de la regresión de Y (la variable de respuesta) contra todas las variables independientes excepto Xi
X i•[i] = residuos de la regresión X i contra las variables independientes restantes.

Propiedades

Velleman y Welsch [1] enumeran las siguientes propiedades útiles para este gráfico:

  1. El ajuste lineal de mínimos cuadrados a esta gráfica tiene pendiente e intersección cero.
  2. Los residuos del ajuste lineal de mínimos cuadrados de este gráfico son idénticos a los residuos del ajuste de mínimos cuadrados del modelo original (Y frente a todas las variables independientes, incluida Xi).
  3. Las influencias de los valores de datos individuales en la estimación de un coeficiente son fáciles de ver en este gráfico.
  4. Es fácil ver muchos tipos de fallas del modelo o violaciones de los supuestos subyacentes (no linealidad, heterocedasticidad , patrones inusuales). .

Los gráficos de regresión parcial están relacionados con los gráficos de residuos parciales , pero son distintos de ellos . Los gráficos de regresión parcial se utilizan con mayor frecuencia para identificar puntos de datos con un alto apalancamiento y puntos de datos influyentes que podrían no tener un alto apalancamiento. Los gráficos de residuos parciales se utilizan más comúnmente para identificar la naturaleza de la relación entre Y y Xi (dado el efecto de las otras variables independientes en el modelo). Tenga en cuenta que, dado que la correlación simple entre los dos conjuntos de residuos trazados es igual a la correlación parcial entre la variable de respuesta y Xi , los gráficos de regresión parcial mostrarán la fuerza correcta de la relación lineal entre la variable de respuesta y Xi . Esto no es cierto para las parcelas residuales parciales. Por otro lado, para el gráfico de regresión parcial, el eje x no es Xi . Esto limita su utilidad para determinar la necesidad de una transformación (que es el propósito principal del gráfico residual parcial).

Ver también

Referencias

  1. ^ ab Paul Velleman; Roy Welsch (noviembre de 1981). "Computación eficiente de diagnósticos de regresión". El estadístico estadounidense . 35 (4). Asociación Estadounidense de Estadística: 234–242. doi :10.2307/2683296. JSTOR  2683296.

Otras lecturas

enlaces externos

Dominio publico Este artículo incorpora material de dominio público del Instituto Nacional de Estándares y Tecnología.