stringtranslate.com

Regresión de Deming

Regresión de Deming. Las líneas rojas muestran el error tanto en x como en y . Esto es diferente del método tradicional de mínimos cuadrados, que mide el error en paralelo al eje y . El caso que se muestra, con desviaciones medidas perpendicularmente, surge cuando los errores en x e y tienen varianzas iguales.

En estadística , la regresión de Deming , llamada así por W. Edwards Deming , es un modelo de errores en las variables que intenta encontrar la línea de mejor ajuste para un conjunto de datos bidimensionales. Se diferencia de la regresión lineal simple en que tiene en cuenta los errores en las observaciones tanto en el eje x como en el eje y . Es un caso especial de mínimos cuadrados totales , que permite cualquier número de predictores y una estructura de error más complicada.

La regresión de Deming es equivalente a la estimación de máxima verosimilitud de un modelo de errores en las variables en el que se supone que los errores de las dos variables son independientes y se distribuyen normalmente , y se conoce la relación de sus varianzas, denotada δ . [1] En la práctica, esta relación se puede estimar a partir de fuentes de datos relacionadas; sin embargo, el procedimiento de regresión no tiene en cuenta los posibles errores al estimar esta relación.

La regresión de Deming es apenas un poco más difícil de calcular que la regresión lineal simple . La mayoría de los paquetes de software estadístico utilizados en química clínica ofrecen la regresión de Deming.

El modelo fue introducido originalmente por Adcock (1878) que consideró el caso δ  = 1, y luego de manera más general por Kummell (1879) con δ arbitrario . Sin embargo, sus ideas pasaron desapercibidas durante más de 50 años, hasta que fueron retomadas por Koopmans (1936) y luego propagadas aún más por Deming (1943). Este último libro se hizo tan popular en la química clínica y campos relacionados que el método incluso fue denominado regresión de Deming en esos campos. [2]

Especificación

Supongamos que los datos disponibles ( y i , x i ) son observaciones medidas de los valores "verdaderos" ( y i * , x i * ), que se encuentran en la línea de regresión:

donde los errores ε y η son independientes y se supone que se conoce la relación de sus varianzas:

En la práctica, las varianzas de los parámetros y a menudo son desconocidas, lo que complica la estimación de . Tenga en cuenta que cuando el método de medición para y es el mismo, es probable que estas varianzas sean iguales, por lo que para este caso.

Buscamos encontrar la línea de “mejor ajuste”

de manera que se minimice la suma ponderada de los residuos cuadrados del modelo: [3]

Véase Jensen (2007) para una derivación completa.

Solución

La solución se puede expresar en términos de los momentos muestrales de segundo grado. Es decir, primero calculamos las siguientes cantidades (todas las sumas van desde i  = 1 hasta n ):

Finalmente, las estimaciones de mínimos cuadrados de los parámetros del modelo serán [4]

Regresión ortogonal

Para el caso de varianzas de error iguales, es decir, cuando , la regresión de Deming se convierte en regresión ortogonal : minimiza la suma de las distancias perpendiculares al cuadrado de los puntos de datos a la línea de regresión . En este caso, denote cada observación como un punto en el plano complejo (es decir, el punto donde es la unidad imaginaria ). Denote como la suma de las diferencias al cuadrado de los puntos de datos desde el centroide (también denotado en coordenadas complejas), que es el punto cuyas ubicaciones horizontal y vertical son los promedios de las de los puntos de datos. Entonces: [5]

Coolidge proporcionó una representación trigonométrica de la línea de regresión ortogonal en 1913. [6]

Solicitud

En el caso de tres puntos no colineales en el plano, el triángulo con estos puntos como sus vértices tiene una única elipse de Steiner que es tangente a los lados del triángulo en sus puntos medios. El eje mayor de esta elipse cae sobre la línea de regresión ortogonal para los tres vértices. [7] La ​​cuantificación del ruido celular intrínseco de una célula biológica se puede cuantificar al aplicar la regresión de Deming al comportamiento observado de un circuito biológico sintético de dos reporteros . [8]

Cuando se les pide a los humanos que dibujen una regresión lineal en un diagrama de dispersión adivinando, sus respuestas están más cerca de la regresión ortogonal que de la regresión de mínimos cuadrados ordinaria. [9]

Regresión de York

La regresión de York extiende la regresión de Deming al permitir errores correlacionados en x e y. [10]

Véase también

Referencias

Notas
  1. ^ Pardillo 1993.
  2. ^ Cornbleet y Gochman 1979.
  3. ^ Fuller 1987, cap. 1.3.3.
  4. ^ Glaister 2001.
  5. ^ Minda y Phelps 2008, Teorema 2.3.
  6. ^ Coolidge 1913.
  7. ^ Minda y Phelps 2008, Corolario 2.4.
  8. ^ Cuarto 2020.
  9. ^ Ciccione, Lorenzo; Dehaene, Stanislas (agosto de 2021). "¿Pueden los humanos realizar una regresión mental en un gráfico? Precisión y sesgo en la percepción de los diagramas de dispersión". Psicología cognitiva . 128 : 101406. doi :10.1016/j.cogpsych.2021.101406.
  10. ^ York, D., Evensen, NM, Martınez, ML y Delgado, JDB: Ecuaciones unificadas para la pendiente, la intersección y los errores estándar de la mejor línea recta, Am. J. Phys., 72, 367–375, https://doi.org/10.1119/1.1632486, 2004.
Bibliografía