En estadística robusta , la regresión de mediana repetida , también conocida como estimador de mediana repetida , es un algoritmo de regresión lineal robusta . El estimador tiene un punto de ruptura del 50%. [1] Aunque es equivariante bajo escalamiento, o bajo transformaciones lineales de su variable explicativa o su variable de respuesta, no lo es bajo transformaciones afines que combinan ambas variables. [1] Puede calcularse en el tiempo por fuerza bruta, en el tiempo utilizando técnicas más sofisticadas, [2] o en tiempo esperado aleatorio. [3] También puede calcularse utilizando un algoritmo en línea con tiempo de actualización. [4]
Método
El método de mediana repetida estima la pendiente de la línea de regresión para un conjunto de puntos como
donde se define como . [5]
La intersección estimada del eje Y se define como
donde se define como . [5]
Una alternativa más sencilla y rápida para estimar la intersección es utilizar el valor recién estimado, así: [5]
Nota: Los métodos directos y jerárquicos de estimación arrojan valores ligeramente diferentes, siendo el método jerárquico normalmente la mejor estimación. Este último enfoque jerárquico es idéntico al método de estimación de la regresión del estimador de Theil-Sen .
Véase también
Referencias
- ^ ab Peter J. Rousseeuw, Nathan S. Netanyahu y David M. Mount, "Nuevos resultados estadísticos y computacionales sobre el estimador de regresión mediana repetida", en Nuevas direcciones en análisis de datos estadísticos y robustez , editado por Stephan Morgenthaler, Elvezio Ronchetti y Werner A. Stahel, Birkhauser Verlag, Basilea, 1993, págs. 177-194.
- ^ Stein, Andrew; Werman, Michael (1992). "Encontrar la línea de regresión mediana repetida". Actas del Tercer Simposio Anual ACM-SIAM sobre Algoritmos Discretos (SODA '92) . Filadelfia, PA, EE. UU.: Society for Industrial and Applied Mathematics. págs. 409–413. ISBN 0-89791-466-X.
- ^ Matoušek, J. ; Mount, DM ; Netanyahu, NS (1998), "Algoritmos aleatorios eficientes para el estimador de línea mediana repetida", Algorithmica , 20 (2): 136–150, doi :10.1007/PL00009190, MR 1484533, S2CID 17362967
- ^ Bernholt, Thorsten; Fried, Roland (2003). "Cálculo de la actualización de la línea de regresión mediana repetida en tiempo lineal". Information Processing Letters . 88 (3): 111–117. doi :10.1016/s0020-0190(03)00350-8. hdl : 2003/5224 .
- ^ abc Siegel, Andrew (septiembre de 1980). «Informe técnico n.º 172, serie 2 del Departamento de Estadística de la Universidad de Princeton: Regresión robusta con medianas repetidas» (PDF) . Archivado (PDF) del original el 28 de julio de 2018. Consultado el 20 de febrero de 2018 .