En matemáticas , una función lineal o segmentada por tramos es una función con valor real de una variable real, cuya gráfica está compuesta por segmentos de recta . [1]
Una función lineal por partes es una función definida en un intervalo (posiblemente ilimitado) de números reales , de modo que hay una colección de intervalos en cada uno de los cuales la función es una función afín . (Por lo tanto, "lineal por partes" en realidad se define como " afín por partes ".) Si el dominio de la función es compacto , es necesario que haya una colección finita de dichos intervalos; si el dominio no es compacto, es posible que sea necesario que sea finito o que sea localmente finito en los reales.
La función definida por
es lineal por partes con cuatro piezas. La gráfica de esta función se muestra a la derecha. Dado que la gráfica de una función afín (*) es una recta , la gráfica de una función lineal por partes consta de segmentos de recta y rayos . Los valores de x (en el ejemplo anterior −3, 0 y 3) donde cambian la pendiente normalmente se denominan puntos de interrupción, puntos de cambio, valores de umbral o nudos. Como ocurre en muchas aplicaciones, esta función también es continua. La gráfica de una función lineal continua por partes en un intervalo compacto es una cadena poligonal .
Otros ejemplos de funciones lineales por partes incluyen la función de valor absoluto , la función de diente de sierra y la función de suelo .
(*) Una función lineal satisface por definición y por tanto en particular ; Las funciones cuya gráfica es una línea recta son afines en lugar de lineales .
Se puede encontrar una aproximación a una curva conocida muestreando la curva e interpolando linealmente entre los puntos. Se ha publicado un algoritmo para calcular los puntos más significativos sujetos a una tolerancia de error determinada. [2]
Si ya se conocen las particiones y luego los puntos de interrupción, la regresión lineal se puede realizar de forma independiente en estas particiones. Sin embargo, en ese caso no se preserva la continuidad y tampoco existe un modelo de referencia único subyacente a los datos observados. Se ha derivado un algoritmo estable con este caso. [3]
Si no se conocen las particiones, se puede utilizar la suma residual de cuadrados para elegir los puntos de separación óptimos. [4] Sin embargo, se puede obtener un cálculo eficiente y una estimación conjunta de todos los parámetros del modelo (incluidos los puntos de interrupción) mediante un procedimiento iterativo [5] actualmente implementado en el paquete segmented
[6] para el lenguaje R.
Una variante del aprendizaje de árboles de decisión llamada árboles modelo aprende funciones lineales por partes. [7]
La noción de función lineal por partes tiene sentido en varios contextos diferentes. Las funciones lineales por partes se pueden definir en un espacio euclidiano de n dimensiones , o más generalmente en cualquier espacio vectorial o espacio afín , así como en variedades lineales por partes y complejos simpliciales (ver mapa simplicial ). En cada caso, la función puede tener un valor real o puede tomar valores de un espacio vectorial, un espacio afín, una variedad lineal por partes o un complejo simplicial. (En estos contextos, el término "lineal" no se refiere únicamente a transformaciones lineales , sino a funciones lineales afines más generales ).
En dimensiones superiores a uno es común exigir que el dominio de cada pieza sea un polígono o politopo . Esto garantiza que la gráfica de la función estará compuesta por piezas poligonales o politópicas.
Las subclases importantes de funciones lineales por partes incluyen las funciones lineales por partes continuas y las funciones lineales por partes convexas . En general, para cada función lineal continua por tramos de n dimensiones , existe una
tal que
Si es convexa y continua, entonces existe una
tal que
Los splines generalizan funciones lineales por partes a polinomios de orden superior, que a su vez están contenidos en la categoría de funciones diferenciables por partes, PDIFF .
En agricultura, el análisis de regresión por partes de los datos medidos se utiliza para detectar el rango en el que los factores de crecimiento afectan el rendimiento y el rango en el que el cultivo no es sensible a los cambios en estos factores.
La imagen de la izquierda muestra que en los niveles freáticos poco profundos el rendimiento disminuye, mientras que en los niveles freáticos más profundos (> 7 dm) el rendimiento no se ve afectado. La gráfica se realiza utilizando el método de mínimos cuadrados para encontrar los dos segmentos con mejor ajuste .
El gráfico de la derecha revela que el rendimiento de los cultivos tolera una salinidad del suelo de hasta ECe = 8 dS/m (ECe es la conductividad eléctrica de un extracto de una muestra de suelo saturado), mientras que más allá de ese valor la producción del cultivo se reduce. La gráfica se realiza con el método de regresión parcial para encontrar el rango más largo de "no efecto", es decir, donde la línea es horizontal. No es necesario que los dos segmentos se unan en el mismo punto. Sólo para el segundo segmento se utiliza el método de mínimos cuadrados.