En matemáticas , una función lineal por partes o segmentada es una función de valor real de una variable real, cuyo gráfico está compuesto por segmentos de línea recta . [1]
Una función lineal por partes es una función definida en un intervalo (posiblemente ilimitado) de números reales , de modo que existe una colección de intervalos en cada uno de los cuales la función es una función afín . (Por lo tanto, "lineal por partes" en realidad se define como " afín por partes "). Si el dominio de la función es compacto , debe haber una colección finita de dichos intervalos; si el dominio no es compacto, puede requerirse que sea finito o que sea localmente finito en los números reales.
La función definida por
es lineal por partes con cuatro partes. El gráfico de esta función se muestra a la derecha. Dado que el gráfico de una función afín (*) es una línea , el gráfico de una función lineal por partes consta de segmentos de línea y rayos . Los valores x (en el ejemplo anterior −3, 0 y 3) donde cambia la pendiente se denominan normalmente puntos de quiebre, puntos de cambio, valores de umbral o nudos. Como en muchas aplicaciones, esta función también es continua. El gráfico de una función lineal continua por partes en un intervalo compacto es una cadena poligonal .
(*) Una función lineal satisface por definición y por lo tanto en particular ; las funciones cuya gráfica es una línea recta son afines en lugar de lineales .
Hay otros ejemplos de funciones lineales por partes:
Se puede encontrar una aproximación a una curva conocida muestreando la curva e interpolando linealmente entre los puntos. Se ha publicado un algoritmo para calcular los puntos más significativos sujetos a una tolerancia de error dada. [3]
Si ya se conocen las particiones y, por lo tanto, los puntos de ruptura, se puede realizar una regresión lineal de forma independiente sobre estas particiones. Sin embargo, en ese caso no se conserva la continuidad y, además, no existe un modelo de referencia único subyacente a los datos observados. Se ha derivado un algoritmo estable para este caso. [4]
Si no se conocen las particiones, se puede utilizar la suma residual de cuadrados para elegir puntos de separación óptimos. [5] Sin embargo, se puede obtener un cálculo eficiente y una estimación conjunta de todos los parámetros del modelo (incluidos los puntos de ruptura) mediante un procedimiento iterativo [6] actualmente implementado en el paquete segmented
[7] para el lenguaje R.
Una variante del aprendizaje de árboles de decisión llamada árboles modelo aprende funciones lineales por partes. [8]
La noción de una función lineal por partes tiene sentido en varios contextos diferentes. Las funciones lineales por partes pueden definirse en un espacio euclidiano n -dimensional , o más generalmente en cualquier espacio vectorial o espacio afín , así como en variedades lineales por partes y complejos simpliciales (véase la función simplicial ). En cada caso, la función puede tener valores reales , o puede tomar valores de un espacio vectorial, un espacio afín, una variedad lineal por partes o un complejo simplicial. (En estos contextos, el término “lineal” no se refiere únicamente a transformaciones lineales , sino a funciones lineales afines más generales).
En dimensiones mayores a uno, es común exigir que el dominio de cada pieza sea un polígono o politopo . Esto garantiza que la gráfica de la función estará compuesta por piezas poligonales o politópicas.
Los splines generalizan funciones lineales por partes a polinomios de orden superior, que a su vez están contenidos en la categoría de funciones diferenciables por partes, PDIFF .
Las subclases importantes de funciones lineales por partes incluyen las funciones lineales por partes continuas y las funciones lineales por partes convexas . En general, para cada función lineal por partes continua de n dimensiones , existe una
de tal manera que
Si es convexa y continua, entonces hay una
de tal manera que
En agricultura, se utiliza el análisis de regresión por partes de datos medidos para detectar el rango en el que los factores de crecimiento afectan el rendimiento y el rango en el que el cultivo no es sensible a los cambios en estos factores.
La imagen de la izquierda muestra que en los niveles freáticos poco profundos el rendimiento disminuye, mientras que en los niveles freáticos más profundos (> 7 dm) el rendimiento no se ve afectado. El gráfico se realizó utilizando el método de mínimos cuadrados para encontrar los dos segmentos con el mejor ajuste .
El gráfico de la derecha revela que los rendimientos de los cultivos toleran una salinidad del suelo de hasta ECe = 8 dS/m (ECe es la conductividad eléctrica de un extracto de una muestra de suelo saturado), mientras que más allá de ese valor la producción del cultivo se reduce. El gráfico se realizó con el método de regresión parcial para encontrar el rango más largo de "ningún efecto", es decir, donde la línea es horizontal. Los dos segmentos no necesitan unirse en el mismo punto. Solo para el segundo segmento se utiliza el método de mínimos cuadrados.