Función real con recta secante entre puntos encima del propio gráfico
Una función (en negro) es convexa si y sólo si la región encima de su gráfica (en verde) es un conjunto convexo .Una gráfica de la función convexa bivariada x 2 + xy + y 2 .Convexo versus no convexo
En matemáticas , una función de valor real se llama convexa si el segmento de línea entre dos puntos distintos en la gráfica de la función se encuentra por encima de la gráfica entre los dos puntos. De manera equivalente, una función es convexa si su epígrafe (el conjunto de puntos sobre o encima de la gráfica de la función) es un conjunto convexo . En términos simples, la gráfica de una función convexa tiene forma de copa (o una línea recta como una función lineal), mientras que la gráfica de una función cóncava tiene forma de gorra .
Las funciones convexas juegan un papel importante en muchas áreas de las matemáticas. Son especialmente importantes en el estudio de problemas de optimización donde se distinguen por una serie de propiedades convenientes. Por ejemplo, una función estrictamente convexa en un conjunto abierto no tiene más de un mínimo . Incluso en espacios de dimensión infinita, bajo hipótesis adicionales adecuadas, las funciones convexas continúan satisfaciendo tales propiedades y, como resultado, son los funcionales mejor comprendidos en el cálculo de variaciones . En teoría de la probabilidad , una función convexa aplicada al valor esperado de una variable aleatoria siempre está acotada arriba por el valor esperado de la función convexa de la variable aleatoria. Este resultado, conocido como desigualdad de Jensen , se puede utilizar para deducir desigualdades como la desigualdad de la media aritmético-geométrica y la desigualdad de Hölder .
Definición
Visualizando una función convexa y la desigualdad de Jensen
Entonces se llama convexo si y sólo si se cumple alguna de las siguientes condiciones equivalentes:
Para todos y todas :
El lado derecho representa la línea recta entre y en la gráfica de como una función de aumento de a o disminución de a barre esta línea. De manera similar, el argumento de la función en el lado izquierdo representa la línea recta entre y en o el eje de la gráfica de Entonces, esta condición requiere que la línea recta entre cualquier par de puntos en la curva de esté arriba o justo cumple con la gráfica. [2]
Por todos y todas tales que :
La diferencia de esta segunda condición con respecto a la primera condición anterior es que esta condición no incluye los puntos de intersección (por ejemplo, y ) entre la recta que pasa por un par de puntos de la curva de (la recta está representada por el lado derecho de esta condición) y la curva de la primera condición incluye los puntos de intersección a medida que se convierte en o en o o De hecho, los puntos de intersección no necesitan considerarse en una condición de convexo usando
porque y siempre son verdaderas (por lo que no es útil ser parte de una condición).
La segunda afirmación que caracteriza las funciones convexas que se valoran en la recta real extendida es también la afirmación utilizada para definir funciones convexas que se valoran en la recta numérica real extendida donde dicha función puede tomar como valor. La primera afirmación no se utiliza porque permite tomar o como valor, en cuyo caso, if o respectivamente, entonces sería indefinido (porque las multiplicaciones y no están definidas). La suma tampoco está definida, por lo que a una función convexa extendida de valor real generalmente solo se le permite tomar exactamente uno de y como valor.
La segunda afirmación también se puede modificar para obtener la definición de convexidad estricta , donde esta última se obtiene reemplazando con la desigualdad estricta.
Explícitamente, el mapa se llama estrictamente convexo si y sólo si para todo real y todo tal que :
Una función estrictamente convexa es una función en la que la línea recta entre cualquier par de puntos de la curva está por encima de la curva, excepto los puntos de intersección entre la línea recta y la curva. Un ejemplo de una función que es convexa pero no estrictamente convexa es . Esta función no es estrictamente convexa porque dos puntos cualesquiera que compartan una coordenada x tendrán una línea recta entre ellos, mientras que dos puntos cualesquiera que NO compartan una coordenada x tendrán un valor mayor de la función que los puntos entre ellos.
Se dice que la función es cóncava (resp. estrictamente cóncava ) si ( multiplicado por −1) es convexa (resp. estrictamente convexa).
Denominación alternativa
El término convexo suele denominarse convexo hacia abajo o cóncavo hacia arriba , y el término cóncavo suele denominarse cóncavo hacia abajo o convexo hacia arriba . [3] [4] [5] Si el término "convexo" se usa sin una palabra clave "arriba" o "abajo", entonces se refiere estrictamente a un gráfico en forma de copa . Como ejemplo, la desigualdad de Jensen se refiere a una desigualdad que involucra una función convexa o convexa (hacia abajo). [6]
Propiedades
Muchas propiedades de funciones convexas tienen la misma formulación simple para funciones de muchas variables que para funciones de una variable. Vea a continuación las propiedades para el caso de muchas variables, ya que algunas de ellas no figuran en la lista para funciones de una variable.
Funciones de una variable
Supongamos que es una función de una variable real definida en un intervalo, y sea
(tenga en cuenta que es la pendiente de la línea violeta en el dibujo de arriba; la función es simétrica en el sentido de que no cambia al intercambiar y ). es convexo si y solo si es monótonamente no decreciente para cada fijo (o viceversa). Esta caracterización de la convexidad es bastante útil para probar los siguientes resultados.
Una función convexa de una variable real definida en algún intervalo abierto es continua en admite derivadas izquierda y derecha , y éstas son monótonamente no decrecientes . En consecuencia, es diferenciable en todos los puntos, pero como máximo en un número contable , pero el conjunto en el que no es diferenciable puede ser denso. Si está cerrado, es posible que no sea continuo en los puntos finales de (se muestra un ejemplo en la sección de ejemplos).
Una función derivable de una variable es convexa en un intervalo si y sólo si su gráfica se encuentra por encima de todas sus tangentes : [7] : 69
para todos y en el intervalo.
Una función dos veces diferenciable de una variable es convexa en un intervalo si y sólo si su segunda derivada no es negativa allí; esto proporciona una prueba práctica de convexidad. Visualmente, una función convexa dos veces diferenciable "se curva hacia arriba", sin curvarse hacia el otro lado ( puntos de inflexión ). Si su segunda derivada es positiva en todos los puntos, entonces la función es estrictamente convexa, pero lo contrario no se cumple. Por ejemplo, la segunda derivada de es , que es cero pero es estrictamente convexa.
Esta propiedad y la propiedad anterior en términos de "...su derivada es monótonamente no decreciente..." no son iguales ya que si no es negativa en un intervalo entonces es monótonamente no decreciente mientras que su recíproco no es cierto, por ejemplo, es monótonamente no decreciente mientras que su derivada no está definida en algunos puntos de .
Si es una función convexa de una variable real, y , entonces es superaditiva en los reales positivos , es decir, para números reales positivos y .
Prueba
Dado que es convexo, al usar una de las definiciones de funciones convexas anteriores y dejar que se deduzca que para todos los reales
De esto se deduce que
Una función es convexa en el punto medio de un intervalo si para todos
Esta condición es sólo ligeramente más débil que la convexidad. Por ejemplo, una función medible de Lebesgue de valor real que es convexa en el punto medio es convexa: este es un teorema de Sierpiński . [8] En particular, una función continua que sea convexa en el punto medio será convexa.
Para una función convexa, los conjuntos de subniveles y con son conjuntos convexos. Una función que satisface esta propiedad se llama función cuasiconvexa y puede no ser una función convexa.
En consecuencia, el conjunto de minimizadores globales de una función convexa es un conjunto convexo: - convexo.
Cualquier mínimo local de una función convexa es también un mínimo global . Una función estrictamente convexa tendrá como máximo un mínimo global. [9]
La desigualdad de Jensen se aplica a toda función convexa . Si es una variable aleatoria que toma valores en el dominio de entonces , donde denota la expectativa matemática . De hecho, las funciones convexas son exactamente aquellas que satisfacen la hipótesis de la desigualdad de Jensen .
Una función homogénea de primer orden de dos variables positivas y (es decir, una función que satisface para todos los reales positivos ) que es convexa en una variable debe ser convexa en la otra variable. [10]
Operaciones que preservan la convexidad.
es cóncavo si y sólo si es convexo.
Si es cualquier número real entonces es convexo si y sólo si es convexo.
Sumas ponderadas no negativas:
si y son todas convexas, entonces también lo es. En particular, la suma de dos funciones convexas es convexa.
esta propiedad se extiende también a sumas infinitas, integrales y valores esperados (siempre que existan).
Máximo por elementos: sea una colección de funciones convexas. Entonces es convexo. El dominio de es la colección de puntos donde la expresión es finita. Casos especiales importantes:
Si son funciones convexas entonces también lo es
Teorema de Danskin : si es convexo en entonces es convexo en incluso si no es un conjunto convexo.
Composición:
Si y son funciones convexas y no decrecientes en un dominio univariado, entonces es convexa. Por ejemplo, si es convexo, entonces también lo es porque es convexo y monótonamente creciente.
Si es cóncavo, convexo y no creciente en un dominio univariado, entonces es convexo.
La convexidad es invariante en aplicaciones afines: es decir, si es convexa con dominio , entonces también lo es , donde con dominio
Minimización: Si es convexo en entonces es convexo en siempre que sea un conjunto convexo y que
Si es convexo, entonces su perspectiva con dominio es convexa.
Sea un espacio vectorial. es convexo y satisface si y sólo si para cualquier número real no negativo que satisfaga
Funciones fuertemente convexas
El concepto de convexidad fuerte amplía y parametriza la noción de convexidad estricta. Intuitivamente, una función fuertemente convexa es una función que crece tan rápido como una función cuadrática. [11] Una función fuertemente convexa también es estrictamente convexa, pero no al revés. Si una función unidimensional es dos veces continuamente diferenciable y el dominio es la recta real, entonces podemos caracterizarla de la siguiente manera:
convexo si y sólo si para todos
estrictamente convexo si es para todos (nota: esto es suficiente, pero no necesario).
fuertemente convexo si y sólo si para todos
Por ejemplo, seamos estrictamente convexos y supongamos que hay una secuencia de puntos tal que . Aunque , la función no es fuertemente convexa porque se volverá arbitrariamente pequeña.
De manera más general, una función diferenciable se llama fuertemente convexa con parámetro si la siguiente desigualdad se cumple para todos los puntos en su dominio: [12]
No es necesario que una función sea derivable para ser fuertemente convexa. Una tercera definición [14] para una función fuertemente convexa, con parámetro es que, para todos en el dominio y
Tenga en cuenta que esta definición se acerca a la definición de convexidad estricta como y es idéntica a la definición de función convexa cuando . A pesar de esto, existen funciones que son estrictamente convexas pero no fuertemente convexas para ninguna (consulte el ejemplo a continuación).
Si la función es dos veces diferenciable continuamente, entonces es fuertemente convexa con parámetro si y solo si para todos en el dominio, donde es la identidad y es la matriz de Hesse , y la desigualdad significa que es semidefinida positiva . Esto equivale a exigir que el valor propio mínimo de sea al menos para todos. Si el dominio es solo la línea real, entonces es solo la segunda derivada, por lo que la condición se convierte en . Entonces, si esto significa que el hessiano es semidefinido positivo (o si el dominio es la línea real, significa que ), lo que implica que la función es convexa, y quizás estrictamente convexa, pero no fuertemente convexa.
Suponiendo aún que la función es dos veces continuamente diferenciable, se puede demostrar que el límite inferior de implica que es fuertemente convexa. Usando el teorema de Taylor existe
Una función es fuertemente convexa con parámetro m si y sólo si la función
Una función dos veces continuamente diferenciable en un dominio compacto que satisface para todos es fuertemente convexa. La prueba de esta afirmación se deriva del teorema del valor extremo , que establece que una función continua en un conjunto compacto tiene un máximo y un mínimo.
En general, es más fácil trabajar con funciones fuertemente convexas que con funciones convexas o estrictamente convexas, ya que son una clase más pequeña. Al igual que las funciones estrictamente convexas, las funciones fuertemente convexas tienen mínimos únicos en conjuntos compactos.
Propiedades de funciones fuertemente convexas
Si f es una función fuertemente convexa con parámetro m , entonces: [15] : Prop.6.1.4
Una función uniformemente convexa, [16] [17] con módulo , es una función que, para todos en el dominio y satisface
Vale la pena señalar que algunos autores requieren que el módulo sea una función creciente, [17] pero no todos los autores exigen esta condición. [dieciséis]
Ejemplos
Funciones de una variable
La función tiene , por lo que f es una función convexa. También es fuertemente convexo (y por lo tanto estrictamente convexo también), con una constante de convexidad fuerte 2.
La función tiene , por lo que f es una función convexa. Es estrictamente convexa, aunque la segunda derivada no es estrictamente positiva en todos los puntos. No es fuertemente convexo.
La función exponencial es convexa. También es estrictamente convexo, ya que , pero no es fuertemente convexo ya que la segunda derivada puede ser arbitrariamente cercana a cero. De manera más general, la función es logarítmicamente convexa si es una función convexa. En su lugar, a veces se utiliza el término "superconvexo". [18]
La función con dominio [0,1] definida por for es convexa; es continuo en el intervalo abierto pero no continuo en 0 y 1.
La función tiene segunda derivada ; por lo tanto es convexo en el conjunto donde y cóncavo en el conjunto donde
Toda transformación lineal de valor real es convexa pero no estrictamente convexa, ya que si es lineal, entonces . Esta afirmación también es válida si reemplazamos "convexo" por "cóncavo".
Toda función afín de valor real , es decir, cada función de la forma es simultáneamente convexa y cóncava.
^ W. Hamming, Richard (2012). Métodos de matemáticas aplicadas al cálculo, la probabilidad y la estadística (edición ilustrada). Corporación de mensajería. pag. 227.ISBN978-0-486-13887-9.Extracto de la página 227
^ Prügel-Bennett, Adam (2020). The Probability Companion para ingeniería e informática (edición ilustrada). Prensa de la Universidad de Cambridge. pag. 160.ISBN _978-1-108-48053-6.Extracto de la página 160
^ ab Boyd, Stephen P.; Vandenberghe, Lieven (2004). Optimización convexa (pdf) . Prensa de la Universidad de Cambridge. ISBN978-0-521-83378-3. Consultado el 15 de octubre de 2011 .
^ Donoghue, William F. (1969). Distribuciones y transformadas de Fourier. Prensa académica. pag. 12.ISBN _9780122206504. Consultado el 29 de agosto de 2012 .
^ "Si f es estrictamente convexa en un conjunto convexo, demuestre que no tiene más de 1 mínimo". Intercambio de pila de matemáticas. 21 de marzo de 2013 . Consultado el 14 de mayo de 2016 .
^ Altenberg, L., 2012. Los operadores lineales positivos solventes exhiben el fenómeno de reducción. Actas de la Academia Nacional de Ciencias, 109(10), páginas 3705-3710.
^ "Fuerte convexidad · Blog de Xingyu Zhou". xingyuzhou.org . Consultado el 27 de septiembre de 2023 .
^ Dimitri Bertsekas (2003). Análisis y optimización convexos . Colaboradores: Angelia Nedic y Asuman E. Ozdaglar. Atenas científica. pag. 72.ISBN _9781886529458.
^ Philippe G. Ciarlet (1989). Introducción al álgebra lineal numérica y optimización . Prensa de la Universidad de Cambridge. ISBN9780521339841.
^ ab Yurii Nesterov (2004). Conferencias introductorias sobre optimización convexa: un curso básico . Editores académicos de Kluwer. págs. 63–64. ISBN9781402075537.
^ ab C. Zalinescu (2002). Análisis convexo en espacios vectoriales generales . Científico mundial. ISBN9812380671.
^ ab H. Bauschke y PL Combettes (2011). Análisis convexo y teoría del operador monótono en espacios de Hilbert . Saltador. pag. 144.ISBN _978-1-4419-9467-7.
^ Kingman, JFC (1961). "Una propiedad de convexidad de matrices positivas". La Revista Trimestral de Matemáticas . 12 : 283–284. doi :10.1093/qmath/12.1.283.
^ Cohen, JE, 1981. Convexidad del valor propio dominante de una matriz esencialmente no negativa. Actas de la Sociedad Estadounidense de Matemáticas, 81 (4), páginas 657-658.
Referencias
Bertsekas, Dimitri (2003). Análisis y optimización convexos . Atenas científica.
Borwein, Jonathan y Lewis, Adrian. (2000). Análisis convexo y optimización no lineal. Saltador.
Donoghue, William F. (1969). Distribuciones y transformadas de Fourier . Prensa académica.
Hiriart-Urruty, Jean-Baptiste y Lemaréchal, Claude . (2004). Fundamentos del análisis convexo. Berlín: Springer.
Krasnosel'skii MA , Rutickii Ya.B. (1961). Funciones convexas y espacios de Orlicz . Groninga: P.Noordhoff Ltd.
Lauritzen, Niels (2013). Convexidad de pregrado . Publicaciones científicas mundiales.
Lüenberger, David (1984). Programación lineal y no lineal . Addison-Wesley.
Lüenberger, David (1969). Optimización por métodos de espacio vectorial . Wiley e hijos.
Rockafellar, RT (1970). Análisis convexo . Princeton: Prensa de la Universidad de Princeton.
Thomson, Brian (1994). Propiedades simétricas de funciones reales . Prensa CRC.
Zălinescu, C. (2002). Análisis convexo en espacios vectoriales generales . River Edge, Nueva Jersey: World Scientific Publishing Co., Inc. págs. xx+367. ISBN 981-238-067-1. SEÑOR 1921556.