stringtranslate.com

SegReg

En estadística y análisis de datos , el software de aplicación SegReg es una herramienta gratuita y fácil de usar para el análisis de regresión lineal segmentada para determinar el punto de ruptura donde la relación entre la variable dependiente y la variable independiente cambia abruptamente. [1]

Características

Captura de pantalla de la hoja de entrada
Regresión segmentada de residuos sobre número de riegos. Se muestran los intervalos de confianza .
Serigrafía de la mesa Anova

SegReg permite la introducción de una o dos variables independientes. Cuando se utilizan dos variables, primero se determina la relación entre la variable dependiente y la variable independiente más influyente, para luego encontrar la relación entre los residuos y la segunda variable independiente. Los residuos son las desviaciones de los valores observados de la variable dependiente respecto de los valores obtenidos mediante regresión segmentada sobre la primera variable independiente.

El punto de quiebre se encuentra numéricamente adoptando una serie de puntos de quiebre tentativos y realizando una regresión lineal en ambos lados de ellos. El punto de quiebre tentativo que proporciona el coeficiente de determinación más grande (como parámetro para el ajuste de las líneas de regresión a los valores de datos observados) se selecciona como el punto de quiebre verdadero. Para asegurar que las líneas en ambos lados del punto de quiebre se intersequen exactamente en el punto de quiebre, SegReg emplea dos métodos y selecciona el método que proporciona el mejor ajuste.

SegReg reconoce muchos tipos de relaciones y selecciona el tipo definitivo en función de criterios estadísticos como la importancia de los coeficientes de regresión. La salida de SegReg proporciona cinturones de confianza estadística de las líneas de regresión y un bloque de confianza para el punto de ruptura. [2] El nivel de confianza se puede seleccionar como 90%, 95% y 98% de certeza.

Para completar las declaraciones de confianza, SegReg proporciona un análisis de varianza y una tabla Anova . [3]

Durante la fase de introducción de datos, el usuario puede indicar una preferencia o exclusión de un determinado tipo. La preferencia por un determinado tipo sólo se acepta cuando es estadísticamente significativa, incluso cuando la significación de otro tipo es mayor.

ILRI [4] proporciona ejemplos de aplicación a magnitudes como el rendimiento de los cultivos , la profundidad del nivel freático y la salinidad del suelo .

Se puede consultar una lista de publicaciones en las que se utiliza SegReg. [5]

Ecuaciones

Cuando sólo está presente una variable independiente, los resultados pueden verse así:

donde BP es el punto de ruptura, Y es la variable dependiente, X la variable independiente, A el coeficiente de regresión , B la constante de regresión y R Y el residuo de Y. Cuando hay dos variables independientes, los resultados pueden verse así:

donde, además, BP X es BP de X, BP Z es BP de Z, Z es la segunda variable independiente, C es el coeficiente de regresión y D la constante de regresión para la regresión de R Y en Z.

Sustituyendo las expresiones de R Y en el segundo conjunto de ecuaciones en el primer conjunto se obtiene:

donde E 1 = B 1 + D 1 , E 2 = B 1 + D 2 , E 3 = B 2 + D 1 y E 4 = B 2 + D 2 .

Alternativa

Serigrafía, datos que muestran un nivel de tolerancia (umbral) del cultivo de trigo para la salinidad del suelo expresado en conductividad eléctrica como ECe = 7,1 dS/m.

Como alternativa a las regresiones en ambos lados del punto de quiebre (umbral), se puede utilizar el método de regresión parcial para encontrar el tramo horizontal más largo posible con coeficiente de regresión insignificante, fuera del cual hay una pendiente definida con un coeficiente de regresión significativo. El método alternativo se puede utilizar para regresiones segmentadas de tipo 3 y tipo 4 cuando se pretende detectar un nivel de tolerancia de la variable dependiente para cantidades variables de la variable explicativa independiente (también llamada predictora). [6]

La figura adjunta se refiere a los mismos datos que se muestran en el gráfico azul del cuadro de información en la parte superior de esta página. En este caso, el cultivo de trigo tiene una tolerancia a la salinidad del suelo de hasta el nivel de CE = 7,1 dS/m en lugar de 4,6 en la figura azul. Sin embargo, el ajuste de los datos más allá del umbral no es tan bueno como en la figura azul que se ha realizado utilizando el principio de minimización de la suma de cuadrados de las desviaciones de los valores observados de las líneas de regresión en todo el dominio de la variable explicativa X (es decir, maximización del coeficiente de determinación), mientras que la regresión parcial está diseñada solo para encontrar el punto donde la tendencia horizontal cambia a una tendencia inclinada.

Véase también

Referencias

  1. ^ Principios estadísticos de la regresión segmentada con punto de ruptura
  2. ^ determinación del intervalo de confianza del punto de ruptura
  3. ^ Pruebas F en el análisis de varianza para regresión lineal segmentada
  4. ^ Investigación sobre drenaje en campos de agricultores: análisis de datos , 2002. Contribución al proyecto “Oro líquido” del Instituto Internacional para la Recuperación y Mejora de Tierras (ILRI), Wageningen, Países Bajos. [1]
  5. ^ Lista de publicaciones que utilizan SegReg
  6. ^ Software libre para regresión parcial