Función lineal por partes

En matemáticas , una función lineal o segmentada por tramos es una función con valor real de una variable real, cuya gráfica está compuesta por segmentos de recta . ^[1]

Definición

Una función lineal por partes es una función definida en un intervalo (posiblemente ilimitado) de números reales , de modo que hay una colección de intervalos en cada uno de los cuales la función es una función afín . (Por lo tanto, "lineal por partes" en realidad se define como " afín por partes ".) Si el dominio de la función es compacto , es necesario que haya una colección finita de dichos intervalos; si el dominio no es compacto, es posible que sea necesario que sea finito o que sea localmente finito en los reales.

Ejemplos

La función definida por

f(x)={\begin{casos}-x-3&{\text{if }}x\leq -3\\x+3&{\text{if }}-3<x<0\\ -2x+3&{\text{if }}0\leq x<3\\0.5x-4.5&{\text{if }}x\geq 3\end{casos}}

es lineal por partes con cuatro piezas. La gráfica de esta función se muestra a la derecha. Dado que la gráfica de una función afín (*) es una recta , la gráfica de una función lineal por partes consta de segmentos de recta y rayos . Los valores de x (en el ejemplo anterior −3, 0 y 3) donde cambian la pendiente normalmente se denominan puntos de interrupción, puntos de cambio, valores de umbral o nudos. Como ocurre en muchas aplicaciones, esta función también es continua. La gráfica de una función lineal continua por partes en un intervalo compacto es una cadena poligonal .

Otros ejemplos de funciones lineales por partes incluyen la función de valor absoluto , la función de diente de sierra y la función de suelo .

(*) Una función lineal satisface por definición y por tanto en particular ; Las funciones cuya gráfica es una línea recta son afines en lugar de lineales . $f(\lambda x)=\lambda f(x)$ $f(0)=0$

Ajuste a una curva

Se puede encontrar una aproximación a una curva conocida muestreando la curva e interpolando linealmente entre los puntos. Se ha publicado un algoritmo para calcular los puntos más significativos sujetos a una tolerancia de error determinada. ^[2]

Ajuste a los datos

Si ya se conocen las particiones y luego los puntos de interrupción, la regresión lineal se puede realizar de forma independiente en estas particiones. Sin embargo, en ese caso no se preserva la continuidad y tampoco existe un modelo de referencia único subyacente a los datos observados. Se ha derivado un algoritmo estable con este caso. ^[3]

Si no se conocen las particiones, se puede utilizar la suma residual de cuadrados para elegir los puntos de separación óptimos. ^[4] Sin embargo, se puede obtener un cálculo eficiente y una estimación conjunta de todos los parámetros del modelo (incluidos los puntos de interrupción) mediante un procedimiento iterativo ^[5] actualmente implementado en el paquete segmented^[6] para el lenguaje R.

Una variante del aprendizaje de árboles de decisión llamada árboles modelo aprende funciones lineales por partes. ^[7]

Notación

La noción de función lineal por partes tiene sentido en varios contextos diferentes. Las funciones lineales por partes se pueden definir en un espacio euclidiano de n dimensiones , o más generalmente en cualquier espacio vectorial o espacio afín , así como en variedades lineales por partes y complejos simpliciales (ver mapa simplicial ). En cada caso, la función puede tener un valor real o puede tomar valores de un espacio vectorial, un espacio afín, una variedad lineal por partes o un complejo simplicial. (En estos contextos, el término "lineal" no se refiere únicamente a transformaciones lineales , sino a funciones lineales afines más generales ).

En dimensiones superiores a uno es común exigir que el dominio de cada pieza sea un polígono o politopo . Esto garantiza que la gráfica de la función estará compuesta por piezas poligonales o politópicas.

Las subclases importantes de funciones lineales por partes incluyen las funciones lineales por partes continuas y las funciones lineales por partes convexas . En general, para cada función lineal continua por tramos de n dimensiones , existe una $f:\mathbb {R} ^{n}\to \mathbb {R}$

\Pi \in {\mathcal {P}}({\mathcal {P}}(\mathbb {R} ^{n+1}))

tal que

f({\vec {x}})=\min _{\Sigma \in \Pi }\max _{({\vec {a}},b)\in \Sigma }{\vec {a }}\cdot {\vec {x}}+b.

^[8]

Si es convexa y continua, entonces existe una $f$

\Sigma \in {\mathcal {P}}(\mathbb {R} ^{n+1})

tal que

f({\vec {x}})=\max _{({\vec {a}},b)\in \Sigma }{\vec {a}}\cdot {\vec {x}} +b.

Los splines generalizan funciones lineales por partes a polinomios de orden superior, que a su vez están contenidos en la categoría de funciones diferenciables por partes, PDIFF .

Aplicaciones

Respuesta del cultivo a la profundidad del nivel freático ^[9]

En agricultura, el análisis de regresión por partes de los datos medidos se utiliza para detectar el rango en el que los factores de crecimiento afectan el rendimiento y el rango en el que el cultivo no es sensible a los cambios en estos factores.

La imagen de la izquierda muestra que en los niveles freáticos poco profundos el rendimiento disminuye, mientras que en los niveles freáticos más profundos (> 7 dm) el rendimiento no se ve afectado. La gráfica se realiza utilizando el método de mínimos cuadrados para encontrar los dos segmentos con mejor ajuste .

El gráfico de la derecha revela que el rendimiento de los cultivos tolera una salinidad del suelo de hasta ECe = 8 dS/m (ECe es la conductividad eléctrica de un extracto de una muestra de suelo saturado), mientras que más allá de ese valor la producción del cultivo se reduce. La gráfica se realiza con el método de regresión parcial para encontrar el rango más largo de "no efecto", es decir, donde la línea es horizontal. No es necesario que los dos segmentos se unan en el mismo punto. Sólo para el segundo segmento se utiliza el método de mínimos cuadrados.

Ver también

Otras lecturas

Aplicaciones, P., Long, N. y Rees, R. (2014). Impuesto sobre la renta lineal por tramos óptimo. Revista de Teoría Económica Pública , 16 (4), 523–545.

Referencias

^ Stanley, William D. (2004). Análisis técnico y aplicaciones con Matlab . Aprendizaje Cengage. pag. 143.ISBN 978-1401864811.
^ Hamann, B.; Chen, JL (1994). "Selección de puntos de datos para la aproximación de curvas lineales por partes" (PDF) . Diseño Geométrico Asistido por Computadora . 11 (3): 289. doi :10.1016/0167-8396(94)90004-3.
^ Golovchenko, Nikolai. "Ajuste de mínimos cuadrados de una función lineal continua por partes" . Consultado el 6 de diciembre de 2012 .
^ Vieth, E. (1989). "Ajustar funciones de regresión lineal por partes a las respuestas biológicas". Revista de fisiología aplicada . 67 (1): 390–396. doi :10.1152/jappl.1989.67.1.390. PMID 2759968.
^ Muggeo, VMR (2003). "Estimación de modelos de regresión con puntos de ruptura desconocidos". Estadística en Medicina . 22 (19): 3055–3071. doi :10.1002/sim.1545. PMID 12973787. S2CID 36264047.
^ Muggeo, VMR (2008). "Segmentado: un paquete R para ajustar modelos de regresión con relaciones de líneas discontinuas" (PDF) . Noticias R. 8 : 20–25.
^ Landwehr, N.; Salón, M.; Frank, E. (2005). "Árboles modelo logísticos" (PDF) . Aprendizaje automático . 59 (1–2): 161–205. doi : 10.1007/s10994-005-0466-3 . S2CID 6306536.
^ Ovchinnikov, Sergei (2002). "Representación máxima-mínima de funciones lineales por partes". Beiträge zur Algebra und Geometrie . 43 (1): 297–302. arXiv : matemáticas/0009026 . SEÑOR 1913786.
^ Una calculadora para regresión por partes.
^ Una calculadora para regresión parcial.