stringtranslate.com

Degradado

El gradiente, representado por las flechas azules, denota la dirección de mayor cambio de una función escalar. Los valores de la función se representan en escala de grises y aumentan de valor de blanco (bajo) a oscuro (alto).

En cálculo vectorial , el gradiente de una función diferenciable con valores escalares de varias variables es el campo vectorial (o función con valores vectoriales ) cuyo valor en un punto da la dirección y la tasa de aumento más rápido. El gradiente se transforma como un vector bajo cambio de base del espacio de variables de . Si el gradiente de una función es distinto de cero en un punto , la dirección del gradiente es la dirección en la que la función aumenta más rápidamente desde , y la magnitud del gradiente es la tasa de aumento en esa dirección, la mayor dirección absoluta derivado. [1] Además, un punto donde el gradiente es el vector cero se conoce como punto estacionario . Por tanto, el gradiente juega un papel fundamental en la teoría de la optimización , donde se utiliza para minimizar una función mediante el descenso del gradiente . En términos libres de coordenadas, el gradiente de una función puede definirse por:

donde es el cambio infinitesimal total para un desplazamiento infinitesimal , y se considera máximo cuando está en la dirección del gradiente . El símbolo nabla , escrito como un triángulo invertido y pronunciado "del", denota el operador diferencial vectorial .

Cuando se utiliza un sistema de coordenadas en el que los vectores base no son funciones de posición, el gradiente viene dado por el vector [a] cuyas componentes son las derivadas parciales de at . [2] Es decir, para , su gradiente se define en el punto en el espacio de n dimensiones como el vector [b]

Tenga en cuenta que la definición anterior de gradiente solo se define para la función , si es diferenciable en . Puede haber funciones para las cuales existan derivadas parciales en todas las direcciones pero no sean diferenciables.

Por ejemplo, la función a menos que esté en el origen donde , no es diferenciable en el origen ya que no tiene un plano tangente bien definido a pesar de tener derivadas parciales bien definidas en todas las direcciones en el origen. [3] En este ejemplo particular, bajo la rotación del sistema de coordenadas xy, la fórmula anterior para el gradiente no se transforma como un vector (el gradiente depende de la elección de la base para el sistema de coordenadas) y tampoco apunta hacia el 'ascenso más pronunciado' en algunas orientaciones. Para funciones diferenciables donde se cumple la fórmula del gradiente, se puede demostrar que siempre se transforma como un vector bajo transformación de la base para que siempre apunte hacia el aumento más rápido.

El gradiente es dual a la derivada total : el valor del gradiente en un punto es un vector tangente – un vector en cada punto; mientras que el valor de la derivada en un punto es un vector cotangente , un funcional lineal sobre vectores. [c] Están relacionados en que el producto escalar del gradiente de en un punto con otro vector tangente es igual a la derivada direccional de en de la función a lo largo de ; eso es, . El gradiente admite múltiples generalizaciones a funciones más generales en variedades ; ver § Generalizaciones.

Motivación

El gradiente de la función 2D f ( x , y ) = xe −( x 2 + y 2 ) se traza como flechas sobre el gráfico pseudocolor de la función.

Considere una habitación donde la temperatura está dada por un campo escalar , T , por lo que en cada punto ( x , y , z ) la temperatura es T ( x , y , z ) , independiente del tiempo. En cada punto de la habitación, el gradiente de T en ese punto mostrará la dirección en la que la temperatura aumenta más rápidamente, alejándose de ( x , y , z ) . La magnitud del gradiente determinará qué tan rápido aumenta la temperatura en esa dirección.

Considere una superficie cuya altura sobre el nivel del mar en el punto ( x , y ) es H ( x , y ) . El gradiente de H en un punto es un vector plano que apunta en la dirección de la pendiente o pendiente más pronunciada en ese punto. La pendiente de la pendiente en ese punto está dada por la magnitud del vector gradiente.

El gradiente también se puede utilizar para medir cómo cambia un campo escalar en otras direcciones, en lugar de solo la dirección de mayor cambio, tomando un producto escalar . Supongamos que la pendiente más pronunciada de una colina es del 40%. Un camino que va directamente cuesta arriba tiene una pendiente del 40%, pero un camino que rodea la colina en ángulo tendrá una pendiente menor. Por ejemplo, si la carretera forma un ángulo de 60° desde la dirección cuesta arriba (cuando ambas direcciones se proyectan en el plano horizontal), entonces la pendiente a lo largo de la carretera será el producto escalar entre el vector gradiente y un vector unitario a lo largo de la carretera. , ya que el producto escalar mide cuánto se alinea el vector unitario a lo largo de la carretera con la pendiente más pronunciada [d] , que es 40% multiplicado por el coseno de 60°, o 20%.

De manera más general, si la función de altura de la colina H es derivable , entonces el gradiente de H punteado con un vector unitario da la pendiente de la colina en la dirección del vector, la derivada direccional de H a lo largo del vector unitario.

Notación

El gradiente de una función en un punto generalmente se escribe como . También puede denotarse por cualquiera de los siguientes:


Definición

El gradiente de la función f ( x , y ) = −(cos 2 x + cos 2 y ) 2 representado como un campo vectorial proyectado en el plano inferior.

El gradiente (o campo vectorial gradiente) de una función escalar f ( x 1 , x 2 , x 3 ,…, x n ) se denota f o f donde ( nabla ) denota el operador diferencial vectorial , del . La notación grad f también se usa comúnmente para representar el gradiente. El gradiente de f se define como el campo vectorial único cuyo producto escalar con cualquier vector v en cada punto x es la derivada direccional de f a lo largo de v . Eso es,

donde el lado derecho es la derivada direccional y hay muchas formas de representarla. Formalmente, la derivada es dual al gradiente; ver relación con derivada.

Cuando una función también depende de un parámetro como el tiempo, el gradiente a menudo se refiere simplemente al vector de sus derivadas espaciales únicamente (ver gradiente espacial ).

La magnitud y dirección del vector gradiente son independientes de la representación de coordenadas particular . [4] [5]

Coordenadas cartesianas

En el sistema de coordenadas cartesiano tridimensional con métrica euclidiana , el gradiente, si existe, viene dado por

donde i , j , k son los vectores unitarios estándar en las direcciones de las coordenadas x , y y z , respectivamente. Por ejemplo, el gradiente de la función.

En algunas aplicaciones es habitual representar el gradiente como un vector fila o vector columna de sus componentes en un sistema de coordenadas rectangular; Este artículo sigue la convención de que el gradiente es un vector columna, mientras que la derivada es un vector fila.

Coordenadas cilíndricas y esféricas.

En coordenadas cilíndricas con métrica euclidiana, el gradiente viene dado por: [6]

donde ρ es la distancia axial, φ es el ángulo azimutal o azimutal, z es la coordenada axial y e ρ , e φ y e z son vectores unitarios que apuntan a lo largo de las direcciones de las coordenadas.

En coordenadas esféricas , el gradiente viene dado por: [6]

donde r es la distancia radial, φ es el ángulo azimutal y θ es el ángulo polar, y e r , e θ y e φ son nuevamente vectores unitarios locales que apuntan en las direcciones de las coordenadas (es decir, la base covariante normalizada ).

Para el gradiente en otros sistemas de coordenadas ortogonales , consulte Coordenadas ortogonales (Operadores diferenciales en tres dimensiones) .

Coordenadas generales

Consideramos coordenadas generales , que escribimos como x 1 ,…, x i ,…, x n , donde n es el número de dimensiones del dominio. Aquí, el índice superior se refiere a la posición en la lista de la coordenada o componente, por lo que x 2 se refiere al segundo componente, no a la cantidad x al cuadrado. La variable índice i se refiere a un elemento arbitrario x i . Usando la notación de Einstein , el gradiente se puede escribir como:

dual

donde y se refieren a las bases covariante y contravariante local no normalizadas respectivamente, es el tensor métrico inverso , y la convención de suma de Einstein implica suma sobre i y j .

Si las coordenadas son ortogonales podemos expresar fácilmente el gradiente (y el diferencial ) en términos de las bases normalizadas, a las que nos referimos como y , utilizando los factores de escala (también conocidos como coeficientes de Lamé )  :

donde no podemos utilizar la notación de Einstein, ya que es imposible evitar la repetición de más de dos índices. A pesar del uso de índices superior e inferior, , y no son contravariantes ni covariantes.

La última expresión se evalúa como las expresiones dadas anteriormente para coordenadas cilíndricas y esféricas.

Relación con derivada

Relación con la derivada total

El gradiente está estrechamente relacionado con la derivada total ( diferencial total ) : son transpuestos ( duales ) entre sí. Usando la convención de que los vectores en están representados por vectores columna y que los covectores (mapas lineales ) están representados por vectores fila , [a] el gradiente y la derivada se expresan como un vector columna y fila, respectivamente, con los mismos componentes, pero transponer uno del otro:

Si bien ambos tienen los mismos componentes, difieren en el tipo de objeto matemático que representan: en cada punto, la derivada es un vector cotangente , una forma lineal (o covector) que expresa cuánto cambia la salida (escalar) para un determinado cambio infinitesimal en la entrada (vectorial), mientras que en cada punto, el gradiente es un vector tangente , que representa un cambio infinitesimal en la entrada (vectorial). En símbolos, el gradiente es un elemento del espacio tangente en un punto, mientras que la derivada es una aplicación del espacio tangente a los números reales . Los espacios tangentes en cada punto de pueden identificarse "naturalmente" [e] con el espacio vectorial mismo, y de manera similar, el espacio cotangente en cada punto puede identificarse naturalmente con el espacio vectorial dual de covectores; por lo tanto, el valor del gradiente en un punto puede considerarse un vector en el original , no solo un vector tangente.

Computacionalmente, dado un vector tangente, el vector se puede multiplicar por la derivada (como matrices), lo que equivale a tomar el producto escalar con el gradiente:

Derivada diferencial o (exterior)

La mejor aproximación lineal a una función diferenciable.

diferencialtotaldiferencial totalderivada exteriorforma diferencial 1

Así como la derivada de una función de una sola variable representa la pendiente de la tangente a la gráfica de la función, [7] la derivada direccional de una función en varias variables representa la pendiente del hiperplano tangente en la dirección del vector.

El gradiente está relacionado con el diferencial mediante la fórmula

producto escalar

Si se ve como el espacio de vectores columna (dimensión) (de números reales), entonces se puede considerar como el vector fila con componentes

la multiplicación de matrices

Aproximación lineal a una función

La mejor aproximación lineal a una función se puede expresar en términos del gradiente, en lugar de la derivada. El gradiente de una función desde el espacio euclidiano hasta en cualquier punto particular caracteriza la mejor aproximación lineal a en . La aproximación es la siguiente:

para cerca de , donde se calcula el gradiente de en , y el punto denota el producto escalar en . Esta ecuación es equivalente a los dos primeros términos de la expansión multivariable de la serie de Taylor de at .

Una relación con.mw-parser-output .vanchor>:target~.vanchor-text{background-color:#b1d2ff}derivado de frechet

Sea U un conjunto abierto en R n . Si la función f  : UR es diferenciable, entonces el diferencial de f es la derivada de Fréchet de f . Por tanto f es una función desde U hasta el espacio R n tal que

Como consecuencia, las propiedades habituales de la derivada se mantienen para el gradiente, aunque el gradiente no es una derivada en sí misma, sino más bien dual con la derivada:

Linealidad
El gradiente es lineal en el sentido de que si f y g son dos funciones de valor real diferenciables en el punto aR n , y α y β son dos constantes, entonces αf + βg es diferenciable en a , y además
Regla del producto
Si f y g son funciones de valor real diferenciables en un punto aR n , entonces la regla del producto afirma que el producto fg es diferenciable en a , y
Cadena de reglas
Supongamos que f  : AR es una función de valor real definida en un subconjunto A de R n , y que f es diferenciable en un punto a . Hay dos formas de la regla de la cadena que se aplican al gradiente. Primero, supongamos que la función g es una curva paramétrica ; es decir, una función g  : IR n asigna un subconjunto IR a R n . Si g es derivable en un punto cI tal que g ( c ) = a , entonces
donde ∘ es el operador de composición : ( f  ∘  g )( x ) = f ( g ( x )) .

De manera más general, si en cambio IR k , entonces se cumple lo siguiente:

( Dg ) Tmatriz jacobiana

Para la segunda forma de la regla de la cadena, supongamos que h  : IR es una función con valor real en un subconjunto I de R , y que h es derivable en el punto f ( a ) ∈ I . Entonces

Otras propiedades y aplicaciones

conjuntos de niveles

Una superficie nivelada, o isosuperficie , es el conjunto de todos los puntos donde alguna función tiene un valor determinado.

Si f es diferenciable, entonces el producto escalar (∇ f  ) xv del gradiente en un punto x con un vector v da la derivada direccional de f en x en la dirección v . De ello se deduce que en este caso el gradiente de f es ortogonal a los conjuntos de niveles de f . Por ejemplo, una superficie nivelada en un espacio tridimensional se define mediante una ecuación de la forma F ( x , y , z ) = c . Entonces el gradiente de F es normal a la superficie.

De manera más general, cualquier hipersuperficie incrustada en una variedad de Riemann puede recortarse mediante una ecuación de la forma F ( P ) = 0 tal que dF no sea cero en ninguna parte. El gradiente de F es entonces normal a la hipersuperficie.

De manera similar, una hipersuperficie algebraica afín puede definirse mediante una ecuación F ( x 1 , ..., x n ) = 0 , donde F es un polinomio. El gradiente de F es cero en un punto singular de la hipersuperficie (esta es la definición de punto singular). En un punto no singular, es un vector normal distinto de cero.

Campos vectoriales conservadores y el teorema del gradiente

El gradiente de una función se llama campo de gradiente. Un campo gradiente (continuo) es siempre un campo vectorial conservador : su integral de línea a lo largo de cualquier camino depende sólo de los puntos finales del camino y puede evaluarse mediante el teorema del gradiente (el teorema fundamental del cálculo para integrales de línea). Por el contrario, un campo vectorial conservador (continuo) es siempre el gradiente de una función.

Generalizaciones

jacobiano

La matriz jacobiana es la generalización del gradiente para funciones vectoriales de varias variables y mapas diferenciables entre espacios euclidianos o, más generalmente, variedades . [8] [9] Una generalización adicional para una función entre espacios de Banach es la derivada de Fréchet .

Supongamos que f  : R nR m es una función tal que cada una de sus derivadas parciales de primer orden existe en n . Entonces la matriz jacobiana de f se define como una matriz m × n , denotada por o simplemente . La ( i , j ) ésima entrada es . Explícitamente

Degradado de un campo vectorial

Dado que la derivada total de un campo vectorial es una aplicación lineal de vectores a vectores, es una cantidad tensorial .

En coordenadas rectangulares, el gradiente de un campo vectorial f = (  f 1 , f 2 , f 3 ) está definido por:

(donde se utiliza la notación de suma de Einstein y el producto tensorial de los vectores e i y e k es un tensor diádico de tipo (2,0)). En general, esta expresión es igual a la transpuesta de la matriz jacobiana:

En coordenadas curvilíneas, o más generalmente en una variedad curva , el gradiente involucra símbolos de Christoffel :

donde g jk son los componentes del tensor métrico inverso y e i son los vectores base de coordenadas.

Expresado de manera más invariante, el gradiente de un campo vectorial f puede definirse mediante la conexión de Levi-Civita y el tensor métrico: [10]

donde c es la conexión.

variedades de Riemann

Para cualquier función suave f en una variedad de Riemann ( M , g ) , el gradiente de f es el campo vectorial f tal que para cualquier campo vectorial X ,

g x ( , )producto internoxgX fxMfXxgráfico de coordenadas φMR n(∂ X f  )( x )
X jjésimoX

Entonces, la forma local del gradiente toma la forma:

Generalizando el caso M = R n , el gradiente de una función está relacionado con su derivada exterior, ya que

fdfisomorfismo musical
gR n

Ver también

Notas

  1. ^ ab Este artículo utiliza la convención de que los vectores de columna representan vectores y los vectores de fila representan covectores, pero la convención opuesta también es común.
  2. ^ Estrictamente hablando, el gradiente es un campo vectorial y el valor del gradiente en un punto es un vector tangente en el espacio tangente en ese punto, no un vector en el espacio original . Sin embargo, todos los espacios tangentes pueden identificarse naturalmente con el espacio original , por lo que no es necesario distinguirlos; ver § Definición y relación con la derivada.
  3. ^ El valor del gradiente en un punto se puede considerar como un vector en el espacio original , mientras que el valor de la derivada en un punto se puede considerar como un covector en el espacio original: un mapa lineal .
  4. ^ el producto escalar (la pendiente del camino alrededor de la colina) sería 40% si el grado entre el camino y la pendiente más pronunciada es 0°, es decir, cuando están completamente alineados, y plano cuando el grado es 90°, es decir, cuando el camino es perpendicular a la pendiente más pronunciada.
  5. ^ De manera informal, identificado "naturalmente" significa que esto se puede hacer sin tomar decisiones arbitrarias. Esto se puede formalizar con una transformación natural .

Referencias

  1. ^
    • Bachman (2007, pág. 77)
    • Derribar (2010, págs. 316-317)
    • Kreyszig (1972, pág. 309)
    • McGraw-Hill (2007, pág. 196)
    • Moisés (1967, p. 684)
    • Protter y Morrey (1970, pág. 715)
    • Swokowski et al. (1994, págs. 1036, 1038-1039)
  2. ^
    • Bachman (2007, pág.76)
    • Beauregard y Fraleigh (1973, pág. 84)
    • Derribar (2010, p. 316)
    • Harper (1976, pág.15)
    • Kreyszig (1972, pág. 307)
    • McGraw-Hill (2007, pág. 196)
    • Moisés (1967, p. 683)
    • Protter y Morrey (1970, pág. 714)
    • Swokowski et al. (1994, pág. 1038)
  3. ^ "Las funciones no diferenciables deben tener derivadas parciales discontinuas - Math Insight". mathinsight.org . Consultado el 21 de octubre de 2023 .
  4. ^ Kreyszig (1972, págs. 308-309)
  5. ^ Fogonero (1969, pág.292)
  6. ^ ab Schey 1992, págs. 139-142.
  7. ^ Protter y Morrey (1970, págs.21, 88)
  8. ^ Beauregard y Fraleigh (1973, págs. 87, 248)
  9. ^ Kreyszig (1972, págs.333, 353, 496)
  10. ^ Dubrovin, Fomenko y Novikov 1991, págs. 348–349.

Otras lecturas

enlaces externos