stringtranslate.com

Gradiente

El gradiente, representado por las flechas azules, indica la dirección del mayor cambio de una función escalar. Los valores de la función se representan en escala de grises y aumentan de valor desde blanco (bajo) a oscuro (alto).

En cálculo vectorial , el gradiente de una función diferenciable de valor escalar de varias variables es el campo vectorial (o función de valor vectorial ) cuyo valor en un punto da la dirección y la tasa de aumento más rápido. El gradiente se transforma como un vector bajo el cambio de base del espacio de variables de . Si el gradiente de una función no es cero en un punto , la dirección del gradiente es la dirección en la que la función aumenta más rápidamente desde , y la magnitud del gradiente es la tasa de aumento en esa dirección, la mayor derivada direccional absoluta . [1] Además, un punto donde el gradiente es el vector cero se conoce como punto estacionario . El gradiente, por lo tanto, juega un papel fundamental en la teoría de optimización , donde se utiliza para minimizar una función mediante el descenso del gradiente . En términos libres de coordenadas, el gradiente de una función puede definirse por:

donde es el cambio infinitesimal total en para un desplazamiento infinitesimal , y se observa que es máximo cuando está en la dirección del gradiente . El símbolo nabla , escrito como un triángulo invertido y pronunciado "del", denota el operador diferencial vectorial .

Cuando se utiliza un sistema de coordenadas en el que los vectores base no son funciones de la posición, el gradiente viene dado por el vector [a] cuyos componentes son las derivadas parciales de en . [2] Es decir, para , su gradiente se define en el punto en el espacio n -dimensional como el vector [b]

Tenga en cuenta que la definición anterior de gradiente solo se define para la función , si es diferenciable en . Puede haber funciones para las que existen derivadas parciales en todas las direcciones pero que no son diferenciables. Además, esta definición como el vector de derivadas parciales solo es válida cuando la base del sistema de coordenadas es ortonormal. Para cualquier otra base, se debe tener en cuenta el tensor métrico en ese punto.

Por ejemplo, la función a menos que en el origen donde , no es diferenciable en el origen ya que no tiene un plano tangente bien definido a pesar de tener derivadas parciales bien definidas en cada dirección en el origen. [3] En este ejemplo particular, bajo la rotación del sistema de coordenadas xy, la fórmula anterior para el gradiente no se transforma como un vector (el gradiente se vuelve dependiente de la elección de la base para el sistema de coordenadas) y también no apunta hacia el 'ascenso más pronunciado' en algunas orientaciones. Para funciones diferenciables donde la fórmula para el gradiente es válida, se puede demostrar que siempre se transforma como un vector bajo la transformación de la base para apuntar siempre hacia el aumento más rápido.

El gradiente es dual a la derivada total : el valor del gradiente en un punto es un vector tangente – un vector en cada punto; mientras que el valor de la derivada en un punto es un vector cotangente – una función lineal sobre vectores. [c] Están relacionados en que el producto escalar del gradiente de en un punto con otro vector tangente es igual a la derivada direccional de en de la función a lo largo de ; es decir, . El gradiente admite múltiples generalizaciones a funciones más generales sobre variedades ; ver § Generalizaciones.

Motivación

El gradiente de la función 2D f ( x , y ) = xe −( x 2 + y 2 ) se representa como flechas sobre el gráfico de pseudocolor de la función.

Consideremos una habitación donde la temperatura está dada por un campo escalar , T , por lo que en cada punto ( x , y , z ) la temperatura es T ( x , y , z ) , independientemente del tiempo. En cada punto de la habitación, el gradiente de T en ese punto mostrará la dirección en la que la temperatura aumenta más rápidamente, alejándose de ( x , y , z ) . La magnitud del gradiente determinará qué tan rápido aumenta la temperatura en esa dirección.

Considere una superficie cuya altura sobre el nivel del mar en el punto ( x , y ) es H ( x , y ) . El gradiente de H en un punto es un vector plano que apunta en la dirección de la pendiente o nivel más pronunciado en ese punto. La inclinación de la pendiente en ese punto está dada por la magnitud del vector gradiente.

El gradiente también se puede utilizar para medir cómo cambia un campo escalar en otras direcciones, en lugar de solo la dirección de mayor cambio, tomando un producto escalar . Supongamos que la pendiente más pronunciada de una colina es del 40%. Una carretera que sube directamente tiene una pendiente del 40%, pero una carretera que rodea la colina en ángulo tendrá una pendiente más suave. Por ejemplo, si la carretera está en un ángulo de 60° desde la dirección cuesta arriba (cuando ambas direcciones se proyectan sobre el plano horizontal), entonces la pendiente a lo largo de la carretera será el producto escalar entre el vector de gradiente y un vector unitario a lo largo de la carretera, ya que el producto escalar mide cuánto se alinea el vector unitario a lo largo de la carretera con la pendiente más pronunciada, [d] que es 40% multiplicado por el coseno de 60°, o 20%.

De manera más general, si la función de altura de la colina H es diferenciable , entonces el gradiente de H punteado con un vector unitario da la pendiente de la colina en la dirección del vector, la derivada direccional de H a lo largo del vector unitario.

Notación

El gradiente de una función en un punto suele escribirse como . También puede denotarse con cualquiera de las siguientes expresiones:

Definición

El gradiente de la función f ( x , y ) = −(cos 2 x + cos 2 y ) 2 se representa como un campo vectorial proyectado en el plano inferior.

El gradiente (o campo vectorial de gradiente) de una función escalar f ( x 1 , x 2 , x 3 , …, x n ) se denota f o f donde ( nabla ) denota el operador diferencial vectorial , del . La notación grad f también se utiliza comúnmente para representar el gradiente. El gradiente de f se define como el único campo vectorial cuyo producto escalar con cualquier vector v en cada punto x es la derivada direccional de f a lo largo de v . Es decir,

donde el lado derecho es la derivada direccional y hay muchas maneras de representarla. Formalmente, la derivada es dual del gradiente; véase la relación con la derivada.

Cuando una función también depende de un parámetro como el tiempo, el gradiente a menudo se refiere simplemente al vector de sus derivadas espaciales únicamente (ver Gradiente espacial ).

La magnitud y la dirección del vector de gradiente son independientes de la representación de coordenadas particular . [4] [5]

Coordenadas cartesianas

En el sistema de coordenadas cartesianas tridimensionales con métrica euclidiana , el gradiente, si existe, viene dado por

donde i , j , k son los vectores unitarios estándar en las direcciones de las coordenadas x , y y z , respectivamente. Por ejemplo, el gradiente de la función es o

En algunas aplicaciones se acostumbra representar el gradiente como un vector fila o vector columna de sus componentes en un sistema de coordenadas rectangular; este artículo sigue la convención de que el gradiente es un vector columna, mientras que la derivada es un vector fila.

Coordenadas cilíndricas y esféricas

En coordenadas cilíndricas con métrica euclidiana, el gradiente viene dado por: [6]

donde ρ es la distancia axial, φ es el ángulo acimutal o acimutal, z es la coordenada axial y e ρ , e φ y e z son vectores unitarios que apuntan a lo largo de las direcciones de las coordenadas.

En coordenadas esféricas , el gradiente viene dado por: [6]

donde r es la distancia radial, φ es el ángulo azimutal y θ es el ángulo polar, y e r , e θ y e φ son nuevamente vectores unitarios locales que apuntan en las direcciones de coordenadas (es decir, la base covariante normalizada ).

Para el gradiente en otros sistemas de coordenadas ortogonales , consulte Coordenadas ortogonales (Operadores diferenciales en tres dimensiones) .

Coordenadas generales

Consideramos coordenadas generales , que escribimos como x 1 , …, x i , …, x n , donde n es el número de dimensiones del dominio. Aquí, el índice superior se refiere a la posición en la lista de la coordenada o componente, por lo que x 2 se refiere al segundo componente, no a la cantidad x al cuadrado. La variable de índice i se refiere a un elemento arbitrario x i . Usando la notación de Einstein , el gradiente se puede escribir como:

(Tenga en cuenta que su dual es ),

donde y se refieren a las bases covariantes y contravariantes locales no normalizadas respectivamente, es el tensor métrico inverso , y la convención de suma de Einstein implica suma sobre i y j .

Si las coordenadas son ortogonales, podemos expresar fácilmente el gradiente (y el diferencial ) en términos de las bases normalizadas, a las que nos referimos como y , utilizando los factores de escala (también conocidos como coeficientes de Lamé )  :

(y ),

donde no podemos utilizar la notación de Einstein, ya que es imposible evitar la repetición de más de dos índices. A pesar del uso de índices superiores e inferiores, , , y no son ni contravariantes ni covariantes.

La última expresión evalúa las expresiones dadas anteriormente para coordenadas cilíndricas y esféricas.

Relación con la derivada

Relación con la derivada total

El gradiente está estrechamente relacionado con la derivada total ( diferencial total ) : son transpuestos ( duales ) entre sí. Usando la convención de que los vectores en se representan por vectores columna y que los covectores (aplicaciones lineales ) se representan por vectores fila , [a] el gradiente y la derivada se expresan como un vector columna y fila, respectivamente, con los mismos componentes, pero transpuestos entre sí:

Si bien ambos tienen los mismos componentes, difieren en el tipo de objeto matemático que representan: en cada punto, la derivada es un vector cotangente , una forma lineal (o covector) que expresa cuánto cambia la salida (escalar) para un cambio infinitesimal dado en la entrada (vector), mientras que en cada punto, el gradiente es un vector tangente , que representa un cambio infinitesimal en la entrada (vector). En símbolos, el gradiente es un elemento del espacio tangente en un punto, , mientras que la derivada es una función del espacio tangente a los números reales, . Los espacios tangentes en cada punto de pueden identificarse "naturalmente" [e] con el espacio vectorial en sí, y de manera similar, el espacio cotangente en cada punto puede identificarse naturalmente con el espacio vectorial dual de covectores; por lo tanto, el valor del gradiente en un punto puede considerarse un vector en el original , no solo como un vector tangente.

Computacionalmente, dado un vector tangente, el vector se puede multiplicar por la derivada (como matrices), lo que equivale a tomar el producto escalar con el gradiente:

Derivada diferencial o (externa)

La mejor aproximación lineal a una función diferenciable en un punto en es una función lineal de a que a menudo se denota por o y se llama derivada diferencial o total de en . La función , que se asigna a , se llama derivada diferencial total o exterior de y es un ejemplo de una 1-forma diferencial .

Así como la derivada de una función de una sola variable representa la pendiente de la tangente a la gráfica de la función, [7] la derivada direccional de una función de varias variables representa la pendiente del hiperplano tangente en la dirección del vector.

El gradiente está relacionado con el diferencial mediante la fórmula para cualquier , donde es el producto escalar : tomar el producto escalar de un vector con el gradiente es lo mismo que tomar la derivada direccional a lo largo del vector.

Si se considera como el espacio de vectores columna (de números reales) (dimensión ), entonces se puede considerar como el vector fila con componentes de modo que se da por la multiplicación de matrices . Suponiendo la métrica euclidiana estándar en , el gradiente es entonces el vector columna correspondiente, es decir,

Aproximación lineal a una función

La mejor aproximación lineal a una función se puede expresar en términos del gradiente, en lugar de la derivada. El gradiente de una función desde el espacio euclidiano hasta en cualquier punto particular en caracteriza la mejor aproximación lineal a en . La aproximación es la siguiente:

para cerca de , donde es el gradiente de calculado en , y el punto denota el producto escalar en . Esta ecuación es equivalente a los dos primeros términos en la expansión de la serie de Taylor multivariable de en .

Relación con.mw-parser-output .vanchor>:target~.vanchor-text{background-color:#b1d2ff}@media screen{html.skin-theme-clientpref-night .mw-parser-output .vanchor>:target~.vanchor-text{background-color:#0f4dc9}}@media screen and (prefers-color-scheme:dark){html.skin-theme-clientpref-os .mw-parser-output .vanchor>:target~.vanchor-text{background-color:#0f4dc9}}Derivada de Fréchet

Sea U un conjunto abierto en R n . Si la función f  : UR es diferenciable, entonces la diferencial de f es la derivada de Fréchet de f . Por lo tanto f es una función de U en el espacio R n tal que donde · es el producto escalar.

En consecuencia, las propiedades usuales de la derivada son válidas para el gradiente, aunque el gradiente no es una derivada en sí mismo, sino más bien dual de la derivada:

Linealidad
El gradiente es lineal en el sentido de que si f y g son dos funciones de valor real diferenciables en el punto aR n , y α y β son dos constantes, entonces αf + βg es diferenciable en a , y además
Regla del producto
Si f y g son funciones de valor real diferenciables en un punto aR n , entonces la regla del producto afirma que el producto fg es diferenciable en a , y
Regla de la cadena
Supóngase que f  : AR es una función de valor real definida en un subconjunto A de R n , y que f es diferenciable en un punto a . Hay dos formas de la regla de la cadena que se aplican al gradiente. Primero, supóngase que la función g es una curva paramétrica ; es decir, una función g  : IR n mapea un subconjunto IR en R n . Si g es diferenciable en un punto cI tal que g ( c ) = a , entonces donde ∘ es el operador de composición : ( f  ∘  g )( x ) = f ( g ( x )) .

De manera más general, si en cambio IR k , entonces se cumple lo siguiente: donde ( Dg ) T denota la matriz jacobiana transpuesta .

Para la segunda forma de la regla de la cadena, supongamos que h  : IR es una función de valor real en un subconjunto I de R , y que h es diferenciable en el punto f ( a ) ∈ I . Entonces

Otras propiedades y aplicaciones

Conjuntos de niveles

Una superficie nivelada, o isosuperficie , es el conjunto de todos los puntos donde alguna función tiene un valor dado.

Si f es diferenciable, entonces el producto escalar (∇ f  ) xv del gradiente en un punto x por un vector v da la derivada direccional de f en x en la dirección v . De ello se deduce que en este caso el gradiente de f es ortogonal a los conjuntos de niveles de f . Por ejemplo, una superficie de nivel en el espacio tridimensional se define mediante una ecuación de la forma F ( x , y , z ) = c . El gradiente de F es entonces normal a la superficie.

En términos más generales, cualquier hipersuperficie incrustada en una variedad de Riemann se puede eliminar mediante una ecuación de la forma F ( P ) = 0 tal que dF no sea cero en ningún punto. El gradiente de F es entonces normal a la hipersuperficie.

De manera similar, una hipersuperficie algebraica afín puede definirse mediante una ecuación F ( x 1 , ..., x n ) = 0 , donde F es un polinomio. El gradiente de F es cero en un punto singular de la hipersuperficie (esta es la definición de un punto singular). En un punto no singular, es un vector normal distinto de cero.

Campos vectoriales conservativos y teorema del gradiente

El gradiente de una función se denomina campo de gradientes. Un campo de gradientes (continuo) es siempre un campo vectorial conservativo : su integral lineal a lo largo de cualquier trayectoria depende únicamente de los puntos finales de la trayectoria y se puede evaluar mediante el teorema del gradiente (el teorema fundamental del cálculo para integrales lineales). Por el contrario, un campo vectorial conservativo (continuo) es siempre el gradiente de una función.

El gradiente es la dirección del ascenso más pronunciado.

El gradiente de una función en el punto x es también la dirección de su ascenso más pronunciado, es decir, maximiza su derivada direccional :

Sea un vector unitario arbitrario. Con la derivada direccional definida como

obtenemos, sustituyendo la función por su serie de Taylor ,

donde denota términos de orden superior en .

Dividiendo por , y tomando el límite se obtiene un término que está acotado desde arriba por la desigualdad de Cauchy-Schwarz [8]

La elección maximiza la derivada direccional y es igual al límite superior.

Generalizaciones

Jacobiano

La matriz jacobiana es la generalización del gradiente para funciones vectoriales de varias variables y mapas diferenciables entre espacios euclidianos o, más generalmente, variedades . [9] [10] Una generalización adicional para una función entre espacios de Banach es la derivada de Fréchet .

Supóngase que f  : R nR m es una función tal que cada una de sus derivadas parciales de primer orden existe en n . Entonces la matriz jacobiana de f se define como una matriz m × n , denotada por o simplemente . La entrada ( i , j ) es . Explícitamente

Gradiente de un campo vectorial

Dado que la derivada total de un campo vectorial es una aplicación lineal de vectores a vectores, es una cantidad tensorial .

En coordenadas rectangulares, el gradiente de un campo vectorial f = (  f 1 , f 2 , f 3 ) se define por:

(donde se utiliza la notación de suma de Einstein y el producto tensorial de los vectores e i y e k es un tensor diádico de tipo (2,0)). En general, esta expresión es igual a la transpuesta de la matriz jacobiana:

En coordenadas curvilíneas, o más generalmente en una variedad curva , el gradiente implica símbolos de Christoffel :

donde g jk son los componentes del tensor métrico inverso y e i son los vectores base de coordenadas.

Expresado de manera más invariable, el gradiente de un campo vectorial f se puede definir mediante la conexión de Levi-Civita y el tensor métrico: [11]

donde c es la conexión.

Variedades de Riemann

Para cualquier función suave f en una variedad de Riemann ( M , g ) , el gradiente de f es el campo vectorial f tal que para cualquier campo vectorial X , es decir, donde g x ( , ) denota el producto interno de los vectores tangentes en x definidos por la métrica g y X f es la función que lleva cualquier punto xM a la derivada direccional de f en la dirección X , evaluada en x . En otras palabras, en un diagrama de coordenadas φ de un subconjunto abierto de M a un subconjunto abierto de R n , (∂ X f  )( x ) viene dado por: donde X j denota el componente j ésimo de X en este diagrama de coordenadas.

Entonces, la forma local del gradiente toma la forma:

Generalizando el caso M = R n , el gradiente de una función está relacionado con su derivada exterior, ya que Más precisamente, el gradiente f es el campo vectorial asociado a la 1-forma diferencial df utilizando el isomorfismo musical (llamado "sostenido") definido por la métrica g . La relación entre la derivada exterior y el gradiente de una función en R n es un caso especial de esto en el que la métrica es la métrica plana dada por el producto escalar.

Véase también

Notas

  1. ^ ab Este artículo utiliza la convención de que los vectores de columna representan vectores y los vectores de fila representan covectores, pero la convención opuesta también es común.
  2. ^ Estrictamente hablando, el gradiente es un campo vectorial , y el valor del gradiente en un punto es un vector tangente en el espacio tangente en ese punto, , no un vector en el espacio original . Sin embargo, todos los espacios tangentes pueden identificarse naturalmente con el espacio original , por lo que no es necesario distinguirlos; consulte § Definición y relación con la derivada.
  3. ^ El valor del gradiente en un punto puede considerarse como un vector en el espacio original , mientras que el valor de la derivada en un punto puede considerarse como un covector en el espacio original: una función lineal .
  4. ^ el producto escalar (la pendiente de la carretera alrededor de la colina) sería 40% si el grado entre la carretera y la pendiente más pronunciada es 0°, es decir, cuando están completamente alineadas, y plano cuando el grado es 90°, es decir, cuando la carretera es perpendicular a la pendiente más pronunciada.
  5. ^ De manera informal, la identificación "natural" significa que esto se puede hacer sin tomar decisiones arbitrarias. Esto se puede formalizar con una transformación natural .

Referencias

  1. ^
    • Bachman (2007, pág. 77)
    • Downing (2010, págs. 316-317)
    • Kreyszig (1972, pág. 309)
    • McGraw-Hill (2007, pág. 196)
    • Moise (1967, pág. 684)
    • Protter y Morrey (1970, pág. 715)
    • Swokowski y otros (1994, págs. 1036, 1038–1039)
  2. ^
    • Bachman (2007, pág. 76)
    • Beauregard y Fraleigh (1973, pág. 84)
    • Downing (2010, pág. 316)
    • Harper (1976, pág. 15)
    • Kreyszig (1972, pág. 307)
    • McGraw-Hill (2007, pág. 196)
    • Moise (1967, pág. 683)
    • Protter y Morrey (1970, pág. 714)
    • Swokowski y otros (1994, pág. 1038)
  3. ^ "Las funciones no diferenciables deben tener derivadas parciales discontinuas - Math Insight". mathinsight.org . Consultado el 21 de octubre de 2023 .
  4. ^ Kreyszig (1972, págs. 308-309)
  5. ^ Stoker (1969, pág. 292)
  6. ^ desde Schey 1992, págs. 139-142.
  7. ^ Protter y Morrey (1970, págs.21, 88)
  8. ^ T. Arens (2022). Matemática (5ª ed.). Springer Spektrum Berlín. doi :10.1007/978-3-662-64389-1. ISBN 978-3-662-64388-4.
  9. ^ Beauregard y Fraleigh (1973, págs. 87, 248)
  10. ^ Kreyszig (1972, págs.333, 353, 496)
  11. ^ Dubrovin, Fomenko y Novikov 1991, págs. 348–349.

[1]

Lectura adicional

Enlaces externos

  1. ^ "Cálculo vectorial: comprensión del gradiente – BetterExplained". betterexplained.com . Consultado el 22 de agosto de 2024 .