stringtranslate.com

Cadena de reglas

En cálculo , la regla de la cadena es una fórmula que expresa la derivada de la composición de dos funciones diferenciables f y g en términos de las derivadas de f y g . Más precisamente, si la función es tal que para cada x , entonces la regla de la cadena es, en la notación de Lagrange ,

o equivalente,

La regla de la cadena también puede expresarse en la notación de Leibniz . Si una variable z depende de la variable y , que a su vez depende de la variable x (es decir, y y z son variables dependientes ), entonces z también depende de x , a través de la variable intermedia y . En este caso, la regla de la cadena se expresa como

y

para indicar en qué puntos deben evaluarse las derivadas.

En la integración , la contraparte de la regla de la cadena es la regla de sustitución .

Explicación intuitiva

Intuitivamente, la regla de la cadena establece que conocer la tasa de cambio instantánea de z con respecto a y y la de y con respecto a x permite calcular la tasa de cambio instantánea de z con respecto a x como el producto de las dos tasas de cambio.

Como dijo George F. Simmons : "Si un automóvil viaja dos veces más rápido que una bicicleta y la bicicleta es cuatro veces más rápida que un hombre que camina, entonces el automóvil viaja 2 × 4 = 8 veces más rápido que el hombre". [1]

La relación entre este ejemplo y la regla de la cadena es la siguiente. Sean z , y y x las posiciones (variables) del automóvil, la bicicleta y el caminante, respectivamente. La tasa de cambio de las posiciones relativas del automóvil y la bicicleta es similar. Entonces, la tasa de cambio de las posiciones relativas del automóvil y el caminante es

La tasa de cambio de posiciones es la relación de las velocidades, y la velocidad es la derivada de la posición con respecto al tiempo; eso es,

o equivalente,

que también es una aplicación de la regla de la cadena.

Historia

La regla de la cadena parece haber sido utilizada por primera vez por Gottfried Wilhelm Leibniz . Lo usó para calcular la derivada de como la combinación de la función de raíz cuadrada y la función . Lo mencionó por primera vez en una memoria de 1676 (con un signo de error en el cálculo). [2] La notación común de la regla de la cadena se debe a Leibniz. [3] Guillaume de l'Hôpital utilizó la regla de la cadena implícitamente en su Analyse des infiniment petits . La regla de la cadena no aparece en ninguno de los libros de análisis de Leonhard Euler , a pesar de que fueron escritos más de cien años después del descubrimiento de Leibniz. [ cita necesaria ] . Se cree que la primera versión "moderna" de la regla de la cadena aparece en la Théorie des fonctions analytiques de Lagrange de 1797 ; también aparece en el Résumé des Leçons données a L'École Royale Polytechnique sur Le Calcul Infinitesimal de Cauchy de 1823 . [4]

Declaración

La forma más simple de la regla de la cadena es para funciones con valores reales de una variable real . Afirma que si g es una función que es diferenciable en un punto c (es decir, la derivada g ′( c ) existe) y f es una función que es diferenciable en g ( c ) , entonces la función compuesta es diferenciable en c , y la derivada es [5]

La regla a veces se abrevia como

Si y = f ( u ) y u = g ( x ) , entonces esta forma abreviada se escribe en notación de Leibniz como:

También podrán indicarse explícitamente los puntos donde se evalúan las derivadas:

Continuando con el mismo razonamiento, dadas n funciones con la función compuesta , si cada función es diferenciable en su entrada inmediata, entonces la función compuesta también es diferenciable mediante la aplicación repetida de la regla de la cadena, donde la derivada es (en la notación de Leibniz):

Aplicaciones

Compuestos de más de dos funciones.

La regla de la cadena se puede aplicar a compuestos de más de dos funciones. Para tomar la derivada de una compuesta de más de dos funciones, observe que la compuesta de f , g y h (en ese orden) es la compuesta de f con gh . La regla de la cadena establece que para calcular la derivada de fgh , es suficiente calcular la derivada de f y la derivada de gh . La derivada de f se puede calcular directamente y la derivada de gh se puede calcular aplicando nuevamente la regla de la cadena. [ cita necesaria ]

Para mayor concreción, considere la función.

Esto se puede descomponer como una combinación de tres funciones:

De modo que .

Sus derivados son:

La regla de la cadena establece que la derivada de su compuesto en el punto x = a es:

En la notación de Leibniz , esto es:

o para abreviar,

Por tanto, la función derivada es:

Otra forma de calcular esta derivada es ver la función compuesta fgh como la compuesta de fg y h . Aplicando la regla de la cadena de esta manera se obtendría:

Esto es lo mismo que se calculó anteriormente. Esto debería esperarse porque ( fg ) ∘ h = f ∘ ( gh ) .

En ocasiones, es necesario diferenciar una composición arbitrariamente larga de la forma . En este caso, defina

donde y cuando . Entonces la regla de la cadena toma la forma

o, en la notación de Lagrange,

Regla del cociente

La regla de la cadena se puede utilizar para derivar algunas reglas de diferenciación bien conocidas. Por ejemplo, la regla del cociente es consecuencia de la regla de la cadena y de la regla del producto . Para ver esto, escribe la función f ( x )/ g ( x ) como el producto f ( x ) · 1/ g ( x ) . Primero aplique la regla del producto:

Para calcular la derivada de 1/ g ( x ) , observe que es la combinación de g con la función recíproca, es decir, la función que envía x a 1/ x . La derivada de la función recíproca es . Aplicando la regla de la cadena, la última expresión queda:

que es la fórmula habitual para la regla del cociente.

Derivadas de funciones inversas

Supongamos que y = g ( x ) tiene una función inversa . Llame a su función inversa f para que tengamos x = f ( y ) . Existe una fórmula para la derivada de f en términos de la derivada de g . Para ver esto, observe que f y g satisfacen la fórmula

Y como las funciones y x son iguales, sus derivadas deben ser iguales. La derivada de x es la función constante con valor 1, y la derivada de está determinada por la regla de la cadena. Por tanto, tenemos que:

Para expresar f' como función de una variable independiente y , sustituimos x dondequiera que aparezca . Entonces podemos resolver para f' .

Por ejemplo, considere la función g ( x ) = e x . Tiene una inversa f ( y ) = ln y . Debido a que g ′( x ) = e x , la fórmula anterior dice que

Esta fórmula es cierta siempre que g sea diferenciable y su inversa f también sea diferenciable. Esta fórmula puede fallar cuando una de estas condiciones no se cumple. Por ejemplo, considere g ( x ) = x 3 . Su inversa es f ( y ) = y 1/3 , que no es diferenciable en cero. Si intentamos utilizar la fórmula anterior para calcular la derivada de f en cero, entonces debemos evaluar 1/ g ′( f (0)) . Como f (0) = 0 y g ′(0) = 0 , debemos evaluar 1/0, que no está definido. Por tanto, la fórmula falla en este caso. Esto no sorprende porque f no es derivable en cero.

Derivados superiores

La fórmula de Faà di Bruno generaliza la regla de la cadena a derivadas superiores. Suponiendo que y = f ( u ) y u = g ( x ) , entonces las primeras derivadas son:

Pruebas

Primera prueba

Una prueba de la regla de la cadena comienza definiendo la derivada de la función compuesta fg , donde tomamos el límite del cociente de diferencias para fg cuando x se acerca a a :

Supongamos por el momento que eso no es igual para ningún cercano . Entonces la expresión anterior es igual al producto de dos factores:

Si oscila cerca de a , entonces puede suceder que no importa qué tan cerca uno se acerque a a , siempre hay una x aún más cercana tal que g ( x ) = g ( a ) . Por ejemplo, esto sucede cerca de a = 0 para la función continua g definida por g ( x ) = 0 para x = 0 y g ( x ) = x 2 sin(1/ x ) en caso contrario. Siempre que esto sucede, la expresión anterior no está definida porque implica división por cero . Para solucionar este problema, introduzca una función de la siguiente manera:

Demostraremos que el cociente de diferencias para fg siempre es igual a:

Siempre que g ( x ) no es igual a g ( a ) , esto está claro porque los factores de g ( x ) − g ( a ) se cancelan. Cuando g ( x ) es igual a g ( a ) , entonces el cociente de diferencias para fg es cero porque f ( g ( x ) ) es igual a f ( g ( a )) , y el producto anterior es cero porque es igual a f ′( g ( a )) multiplicado por cero. Entonces, el producto anterior siempre es igual al cociente de diferencias, y para demostrar que la derivada de fg en a existe y determinar su valor, sólo necesitamos demostrar que el límite cuando x llega a a del producto anterior existe y determinar es valioso.

Para ello recordemos que el límite de un producto existe si existen los límites de sus factores. Cuando esto suceda, el límite del producto de estos dos factores será igual al producto de los límites de los factores. Los dos factores son Q ( g ( x ) ) y ( g ( x ) − g ( a )) / ( xa ) . Este último es el cociente de diferencias para g en a , y debido a que g es diferenciable en a por supuesto, su límite cuando x tiende a a existe y es igual a g ′( a ) .

En cuanto a Q ( g ( x )) , observe que Q se define dondequiera que esté f . Además, f es diferenciable en g ( a ) por suposición, por lo que Q es continua en g ( a ) , por definición de derivada. La función g es continua en a porque es diferenciable en a y , por lo tanto, Qg es continua en a . Entonces, su límite cuando x llega a a existe y es igual a Q ( g ( a )) , que es f ′( g ( a )) .

Esto muestra que los límites de ambos factores existen y que son iguales a f ′( g ( a )) y g ′( a ) , respectivamente. Por lo tanto, la derivada de fg en a existe y es igual a f ′( g ( a )) g ′( a ) .

Segunda prueba

Otra forma de demostrar la regla de la cadena es medir el error en la aproximación lineal determinado por la derivada. Esta prueba tiene la ventaja de que se generaliza a varias variables. Se basa en la siguiente definición equivalente de diferenciabilidad en un punto: Una función g es diferenciable en a si existe un número real g ′( a ) y una función ε ( h ) que tiende a cero cuando h tiende a cero, y además

Aquí el lado izquierdo representa la verdadera diferencia entre el valor de g en a y en a + h , mientras que el lado derecho representa la aproximación determinada por la derivada más un término de error.

En la situación de la regla de la cadena, tal función ε existe porque se supone que g es diferenciable en a . Nuevamente por suposición, también existe una función similar para f en g ( a ). Llamando a esta función η , tenemos

La definición anterior no impone restricciones a η (0), aunque se supone que η ( k ) tiende a cero cuando k tiende a cero. Si establecemos η (0) = 0 , entonces η es continua en 0.

Para demostrar el teorema es necesario estudiar la diferencia f ( g ( a + h )) − f ( g ( a )) cuando h tiende a cero. El primer paso es sustituir g ( a + h ) usando la definición de diferenciabilidad de g en a :

El siguiente paso es utilizar la definición de diferenciabilidad de f en g ( a ). Esto requiere un término de la forma f ( g ( a ) + k ) para algún k . En la ecuación anterior, la k correcta varía con h . Conjunto k h = g ′( a ) h + ε ( h ) h y el lado derecho se convierte en f ( g ( a ) + k h ) − f ( g ( a )) . Aplicando la definición de derivada se obtiene:

Para estudiar el comportamiento de esta expresión cuando h tiende a cero, expanda kh . Después de reagrupar los términos, el lado derecho queda:

Debido a que ε ( h ) y η ( k h ) tienden a cero cuando h tiende a cero, los dos primeros términos entre corchetes tienden a cero cuando h tiende a cero. Aplicando el mismo teorema sobre productos de límites que en la primera demostración, el tercer término entre corchetes también tiende a cero. Debido a que la expresión anterior es igual a la diferencia f ( g ( a + h )) − f ( g ( a )) , según la definición de la derivada fg es diferenciable en a y su derivada es f ′( g ( a )) g ′( a ).

El papel de Q en la primera prueba lo desempeña η en esta prueba. Están relacionados por la ecuación:

La necesidad de definir Q en g ( a ) es análoga a la necesidad de definir η en cero.

Tercera prueba

La definición alternativa de Constantin Carathéodory de la diferenciabilidad de una función puede utilizarse para dar una prueba elegante de la regla de la cadena. [6]

Según esta definición, una función f es diferenciable en un punto a si y solo si hay una función q , continua en a y tal que f ( x ) − f ( a ) = q ( x )( xa ) . Existe como máximo una de esas funciones, y si f es diferenciable en a , entonces f ′( a ) = q ( a ) .

Dados los supuestos de la regla de la cadena y el hecho de que las funciones diferenciables y las composiciones de funciones continuas son continuas, tenemos que existen funciones q , continuas en g ( a ) , y r , continuas en a , y tales que,

y

Por lo tanto,

pero la función dada por h ( x ) = q ( g ( x ) r ( x ) es continua en a , y obtenemos, para esto a

Un enfoque similar funciona para funciones (vectoriales) continuamente diferenciables de muchas variables. Este método de factorización también permite un enfoque unificado para formas más fuertes de diferenciabilidad, cuando se requiere que la derivada sea continua de Lipschitz , continua de Hölder , etc. La diferenciación en sí misma puede verse como el teorema del resto polinómico (el pequeño teorema de Bézout o teorema del factor). , generalizado a una clase apropiada de funciones. [ cita necesaria ]

Prueba mediante infinitesimales

Si y luego elegimos infinitesimal calculamos el correspondiente y luego el correspondiente , de modo que

y aplicando la parte estándar obtenemos

que es la regla de la cadena.

Caso multivariable

La generalización completa de la regla de la cadena a funciones multivariables (como ) es bastante técnica. Sin embargo, es más sencillo escribir en el caso de funciones de la forma

Como este caso ocurre frecuentemente en el estudio de funciones de una sola variable, vale la pena describirlo por separado.

Caso de funciones escalares con múltiples entradas

Sea , y para cada Para escribir la regla de la cadena para la composición de funciones.

derivadas parcialesfkla notación D

la derivada parcial de f con respecto a su i ésimo argumento, y por

el valor de esta derivada en z .

Con esta notación, la regla de la cadena es

Ejemplo: operaciones aritméticas

Si la función f es suma, es decir, si

entonces y . Por tanto, la regla de la cadena da

para multiplicar

los parciales son y . De este modo,

El caso de la exponenciación

es un poco más complicado, ya que

y como

Resulta que

Regla general: funciones con valores vectoriales con múltiples entradas

La forma más sencilla de escribir la regla de la cadena en el caso general es utilizar la derivada total , que es una transformación lineal que captura todas las derivadas direccionales en una única fórmula. Considere funciones diferenciables f  : R mR k y g  : R nR m , y un punto a en R n . Sea D a g la derivada total de g en a y D g ( a ) f la derivada total de f en g ( a ) . Estas dos derivadas son transformaciones lineales R nR m y R mR k , respectivamente, por lo que se pueden componer. La regla de la cadena para las derivadas totales es que su compuesto es la derivada total de fg en a :

o para abreviar,

La regla de la cadena de dimensiones superiores se puede demostrar utilizando una técnica similar a la segunda prueba anterior. [7]

Como la derivada total es una transformación lineal, las funciones que aparecen en la fórmula se pueden reescribir como matrices. La matriz correspondiente a una derivada total se llama matriz jacobiana , y la compuesta de dos derivadas corresponde al producto de sus matrices jacobianas. Desde esta perspectiva, la regla de la cadena dice:

o para abreviar,

Es decir, el jacobiano de una función compuesta es el producto de los jacobianos de las funciones compuestas (evaluados en los puntos apropiados).

La regla de la cadena de dimensiones superiores es una generalización de la regla de la cadena unidimensional. Si k , m y n son 1, de modo que f  : RR y g  : RR , entonces las matrices jacobianas de f y g son 1 × 1 . En concreto, son:

El jacobiano de fg es el producto de estas matrices de 1 × 1 , por lo que es f ′( g ( a ))⋅ g ′( a ) , como se esperaba de la regla de la cadena unidimensional. En el lenguaje de transformaciones lineales, D a ( g ) es la función que escala un vector por un factor de g ′ ( a ) y D g ( a ) ( f ) es la función que escala un vector por un factor de f ′ ( g ( a )). La regla de la cadena dice que la compuesta de estas dos transformaciones lineales es la transformación lineal D a ( fg ) y, por lo tanto, es la función que escala un vector por f ′( g ( a ))⋅ g ′( a ).

Otra forma de escribir la regla de la cadena se utiliza cuando f y g se expresan en términos de sus componentes como y = f ( u ) = ( f 1 ( u ), …, f k ( u )) y u = g ( x ) = ( gramo 1 ( x ), …, gramo metro ( x )) . En este caso, la regla anterior para matrices jacobianas suele escribirse como:

La regla de la cadena para derivadas totales implica una regla de la cadena para derivadas parciales. Recuerde que cuando existe la derivada total, la derivada parcial en la dirección de la i -ésima coordenada se encuentra multiplicando la matriz jacobiana por el i -ésimo vector de base. Al hacer esto con la fórmula anterior, encontramos:

Dado que las entradas de la matriz jacobiana son derivadas parciales, podemos simplificar la fórmula anterior para obtener:

Más conceptualmente, esta regla expresa el hecho de que un cambio en la dirección x i puede cambiar todos los g 1 hasta g m , y cualquiera de estos cambios puede afectar a f .

En el caso especial donde k = 1 , de modo que f sea una función de valor real, entonces esta fórmula se simplifica aún más:

Esto se puede reescribir como un producto escalar . Recordando que u = ( g 1 , …, g m ) , la derivada parcial u / ∂ x i también es un vector, y la regla de la cadena dice que:

Ejemplo

Dado u ( x , y ) = x 2 + 2 y donde x ( r , t ) = r sin ( t ) e y ( r , t ) = sin 2 ( t ) , determine el valor de u / ∂ r y u / ∂ t usando la regla de la cadena. [ cita necesaria ]

y

Derivadas superiores de funciones multivariables.

La fórmula de Faà di Bruno para derivadas de orden superior de funciones de una sola variable se generaliza al caso multivariable. Si y = f ( u ) es una función de u = g ( x ) como arriba, entonces la segunda derivada de fg es:

Más generalizaciones

Todas las extensiones del cálculo tienen una regla de la cadena. En la mayoría de ellos, la fórmula sigue siendo la misma, aunque el significado de esa fórmula puede ser muy diferente.

Una generalización es a variedades . En esta situación, la regla de la cadena representa el hecho de que la derivada de fg es la compuesta de la derivada de f y la derivada de g . Este teorema es una consecuencia inmediata de la regla de la cadena de dimensiones superiores dada anteriormente y tiene exactamente la misma fórmula.

La regla de la cadena también es válida para las derivadas de Fréchet en espacios de Banach . Se aplica la misma fórmula que antes. [8] Este caso y el anterior admiten una generalización simultánea a variedades de Banach .

En álgebra diferencial , la derivada se interpreta como un morfismo de módulos de diferenciales de Kähler . Un homomorfismo de anillo de anillos conmutativos f  : RS determina un morfismo de diferenciales de Kähler Df  : Ω R → Ω S que envía un elemento dr a d ( f ( r ) ), el diferencial exterior de f ( r ). La fórmula D ( fg ) = DfDg también se cumple en este contexto.

La característica común de estos ejemplos es que son expresiones de la idea de que la derivada es parte de un funtor . Un funtor es una operación sobre espacios y funciones entre ellos. Asocia a cada espacio un nuevo espacio y a cada función entre dos espacios una nueva función entre los nuevos espacios correspondientes. En cada uno de los casos anteriores, el funtor envía cada espacio a su paquete tangente y envía cada función a su derivada. Por ejemplo, en el caso de la variedad, la derivada envía una variedad C r a una variedad C r −1 (su paquete tangente) y una función C r a su derivada total. Hay un requisito para que esto sea un functor, a saber, que la derivada de un compuesto debe ser la compuesta de las derivadas. Esta es exactamente la fórmula D ( fg ) = DfDg .

También existen reglas en cadena en el cálculo estocástico . Uno de ellos, el lema de Itō , expresa la combinación de un proceso de Itō (o más generalmente una semimartingala ) dX t con una función f dos veces diferenciable . En el lema de Itō, la derivada de la función compuesta depende no sólo de dX t y de la derivada de f sino también de la segunda derivada de f . La dependencia de la segunda derivada es una consecuencia de la variación cuadrática distinta de cero del proceso estocástico, lo que en términos generales significa que el proceso puede moverse hacia arriba y hacia abajo de una manera muy aproximada. Esta variante de la regla de la cadena no es un ejemplo de functor porque las dos funciones que se componen son de diferentes tipos.

Ver también

Referencias

  1. ^ George F. Simmons , Cálculo con geometría analítica (1985), pág. 93.
  2. ^ Niño, JM (1917). "LOS MANUSCRITOS DE LEIBNIZ SOBRE SU DESCUBRIMIENTO DEL CÁLCULO DIFERENCIAL. PARTE II (Continuación)". El monista . 27 (3): 411–454. ISSN  0026-9662. JSTOR  27900650.
  3. ^ Rodríguez, Omar Hernández; López Fernández, Jorge M. (2010). "Una reflexión semiótica sobre la didáctica de la regla de la cadena". El entusiasta de las matemáticas . 7 (2): 321–332. doi : 10.54870/1551-3440.1191 . S2CID  29739148 . Consultado el 4 de agosto de 2019 .
  4. ^ Rodríguez, Omar Hernández; López Fernández, Jorge M. (2010). "Una reflexión semiótica sobre la didáctica de la regla de la cadena". El entusiasta de las matemáticas . 7 (2): 321–332. doi : 10.54870/1551-3440.1191 . S2CID  29739148 . Consultado el 4 de agosto de 2019 .
  5. ^ Apóstol, Tom (1974). Análisis matemático (2ª ed.). Addison Wesley. Teorema 5.5.
  6. ^ Kuhn, Stephen (1991). "El Derivado á la Carathéodory". El Mensual Matemático Estadounidense . 98 (1): 40–44. doi :10.2307/2324035. JSTOR  2324035.
  7. ^ Spivak, Michael (1965). Cálculo de variedades . Boston: Addison-Wesley. págs. 19-20. ISBN 0-8053-9021-9.
  8. ^ Cheney, sala (2001). "La regla de la cadena y los teoremas del valor medio". Análisis para Matemática Aplicada . Nueva York: Springer. págs. 121-125. ISBN 0-387-95279-9.

enlaces externos