stringtranslate.com

Diferencial de una función

En cálculo , la diferencial representa la parte principal del cambio en una función con respecto a los cambios en la variable independiente. La diferencial se define por donde es la derivada de f con respecto a , y es una variable real adicional (por lo que es una función de y ). La notación es tal que la ecuación

se cumple, donde la derivada se representa en la notación de Leibniz , y esto es consistente con considerar la derivada como el cociente de las diferenciales. También se escribe

El significado preciso de las variables y depende del contexto de la aplicación y del nivel requerido de rigor matemático. El dominio de estas variables puede adquirir un significado geométrico particular si la diferencial se considera como una forma diferencial particular , o un significado analítico si la diferencial se considera como una aproximación lineal al incremento de una función. Tradicionalmente, las variables y se consideran muy pequeñas ( infinitesimales ), y esta interpretación se hace rigurosa en el análisis no estándar .

Historia y uso

La diferencial fue introducida por primera vez a través de una definición intuitiva o heurística por Isaac Newton y ampliada por Gottfried Leibniz , quien pensó en la diferencial  dy como un cambio infinitamente pequeño (o infinitesimal ) en el valor  y de la función, correspondiente a un cambio infinitamente pequeño  dx en el argumento  x de la función . Por esa razón, la tasa instantánea de cambio de y con respecto a x , que es el valor de la derivada de la función, se denota por la fracción

en lo que se denomina la notación de Leibniz para derivadas. El cociente no es infinitamente pequeño, sino que es un número real .

El uso de infinitesimales en esta forma fue ampliamente criticado, por ejemplo, por el famoso panfleto El analista del obispo Berkeley. Augustin-Louis Cauchy (1823) definió la diferencial sin apelar al atomismo de los infinitesimales de Leibniz. [1] [2] En cambio, Cauchy, siguiendo a d'Alembert , invirtió el orden lógico de Leibniz y sus sucesores: la derivada misma se convirtió en el objeto fundamental, definido como un límite de cocientes de diferencias, y las diferenciales se definieron entonces en términos de él. Es decir, uno era libre de definir la diferencial mediante una expresión en la que y son simplemente nuevas variables que toman valores reales finitos, [3] no infinitesimales fijos como lo habían sido para Leibniz. [4]

Según Boyer (1959, p. 12), el enfoque de Cauchy fue una mejora lógica significativa sobre el enfoque infinitesimal de Leibniz porque, en lugar de invocar la noción metafísica de infinitesimales, las cantidades y ahora podían manipularse exactamente de la misma manera que cualquier otra cantidad real de una manera significativa. El enfoque conceptual general de Cauchy para las diferenciales sigue siendo el estándar en los tratamientos analíticos modernos, [5] aunque la última palabra sobre el rigor, una noción completamente moderna del límite, se debió en última instancia a Karl Weierstrass . [6]

En los tratamientos físicos, como los aplicados a la teoría de la termodinámica , todavía prevalece la visión infinitesimal. Courant y John (1999, p. 184) concilian el uso físico de diferenciales infinitesimales con la imposibilidad matemática de los mismos de la siguiente manera. Los diferenciales representan valores finitos distintos de cero que son menores que el grado de precisión requerido para el propósito particular para el que están destinados. Por lo tanto, los "infinitesimales físicos" no necesitan apelar a un infinitesimal matemático correspondiente para tener un sentido preciso.

Tras los avances del siglo XX en el análisis matemático y la geometría diferencial , se hizo evidente que la noción de diferencial de una función podía extenderse de diversas maneras. En el análisis real , es más deseable tratar directamente con la diferencial como la parte principal del incremento de una función. Esto conduce directamente a la noción de que la diferencial de una función en un punto es una funcional lineal de un incremento . Este enfoque permite desarrollar la diferencial (como una función lineal) para una variedad de espacios más sofisticados, dando lugar en última instancia a nociones como la derivada de Fréchet o Gateaux . Del mismo modo, en la geometría diferencial , la diferencial de una función en un punto es una función lineal de un vector tangente (un "desplazamiento infinitamente pequeño"), que la exhibe como una especie de forma única: la derivada exterior de la función. En el cálculo no estándar , las diferenciales se consideran infinitesimales, que pueden ponerse en una base rigurosa (véase diferencial (infinitesimal) ).

Definición

La diferencial de una función en un punto .

La diferencial se define en los tratamientos modernos del cálculo diferencial de la siguiente manera. [7] La ​​diferencial de una función de una sola variable real es la función de dos variables reales independientes y está dada por

Se puede suprimir uno o ambos argumentos, es decir, se puede ver o simplemente . Si , la diferencial también se puede escribir como . Como , es convencional escribir de modo que se cumpla la siguiente igualdad:

Esta noción de diferencial es ampliamente aplicable cuando se busca una aproximación lineal a una función, en la que el valor del incremento es suficientemente pequeño. Más precisamente, si es una función diferenciable en , entonces la diferencia en valores de

satisface

donde el error en la aproximación satisface como . En otras palabras, se tiene la identidad aproximada

en la que el error puede hacerse tan pequeño como se desee en relación con restringiendo a que sea suficientemente pequeño; es decir, como . Por esta razón, la diferencial de una función se conoce como la parte principal (lineal) en el incremento de una función: la diferencial es una función lineal del incremento , y aunque el error puede ser no lineal, tiende a cero rápidamente a medida que tiende a cero.

Diferenciales en varias variables

Siguiendo a Goursat (1904, I, §15), para funciones de más de una variable independiente,

La diferencial parcial de y con respecto a cualquiera de las variables  x 1 es la parte principal del cambio en y resultante de un cambio  dx 1 en esa variable. La diferencial parcial es, por lo tanto,

que involucra la derivada parcial de y con respecto a  x 1 . La suma de las diferenciales parciales con respecto a todas las variables independientes es la diferencial total

que es la parte principal del cambio en y resultante de los cambios en las variables independientes  x i .

Más precisamente, en el contexto del cálculo multivariable, siguiendo a Courant (1937b), si f es una función diferenciable, entonces por la definición de diferenciabilidad , el incremento

donde los términos de error ε i  tienden a cero a medida que los incrementos Δ x i tienden conjuntamente a cero. La diferencial total se define entonces rigurosamente como

Ya que con esta definición se tiene

Como en el caso de una variable, la identidad aproximada se cumple

en el que el error total puede hacerse tan pequeño como se desee limitando la atención a incrementos suficientemente pequeños.

Aplicación del diferencial total a la estimación del error

En medición, la diferencial total se utiliza para estimar el error de una función en función de los errores de los parámetros . Suponiendo que el intervalo es lo suficientemente corto para que el cambio sea aproximadamente lineal:

y que todas las variables son independientes, entonces para todas las variables,

Esto se debe a que la derivada con respecto al parámetro particular proporciona la sensibilidad de la función a un cambio en , en particular el error . Como se supone que son independientes, el análisis describe el escenario del peor caso. Se utilizan los valores absolutos de los errores de los componentes, porque después de un cálculo simple, la derivada puede tener un signo negativo. A partir de este principio se derivan las reglas de error de suma, multiplicación, etc., por ejemplo:

Sea . Entonces, el error finito puede aproximarse como

Evaluación de las derivadas: Dividiendo por f , que es a × b

Es decir, en la multiplicación, el error relativo total es la suma de los errores relativos de los parámetros.

Para ilustrar cómo esto depende de la función considerada, considere el caso donde la función es en cambio. Entonces, se puede calcular que la estimación del error es con un factor ' ln b ' adicional que no se encuentra en el caso de un producto simple. Este factor adicional tiende a hacer que el error sea menor, ya que ln b no es tan grande como un  b simple .

Diferenciales de orden superior

Las diferenciales de orden superior de una función y = f ( x ) de una sola variable x se pueden definir mediante: [8] y, en general, De manera informal, esto motiva la notación de Leibniz para derivadas de orden superior Cuando se permite que la variable independiente x dependa de otras variables, entonces la expresión se vuelve más complicada, ya que debe incluir también diferenciales de orden superior en la propia x . Así, por ejemplo, y así sucesivamente.

Consideraciones similares se aplican a la definición de diferenciales de orden superior de funciones de varias variables. Por ejemplo, si f es una función de dos variables x e y , entonces donde es un coeficiente binomial . En más variables, se cumple una expresión análoga, pero con una expansión multinomial apropiada en lugar de una expansión binomial. [9]

Las diferenciales de orden superior en varias variables también se vuelven más complicadas cuando se permite que las variables independientes dependan de otras variables. Por ejemplo, para una función f de x e y que se permite que dependan de variables auxiliares, se tiene

Debido a esta incomodidad de notación, el uso de diferenciales de orden superior fue duramente criticado por Hadamard (1935), quien concluyó:

En fin, que significa o que representa la igualdad

A mi juicio, nada de todo.

Es decir: ¿qué se quiere decir, o qué se representa, finalmente, con la igualdad [...]? En mi opinión, nada en absoluto. A pesar de este escepticismo, las diferenciales de orden superior surgieron como una herramienta importante en el análisis. [10]

En estos contextos, la diferencial de orden n de la función f aplicada a un incremento Δ x se define mediante o una expresión equivalente, como donde es una diferencia hacia adelante de orden n con incremento t Δ x .

Esta definición también tiene sentido si f es una función de varias variables (para simplificar, se toma aquí como un argumento vectorial). Entonces, la n -ésima diferencial definida de esta manera es una función homogénea de grado n en el incremento vectorial Δ x . Además, la serie de Taylor de f en el punto x está dada por La derivada de Gateaux de orden superior generaliza estas consideraciones a espacios de dimensión infinita.

Propiedades

Varias propiedades de la diferencial se derivan de manera directa de las propiedades correspondientes de la derivada, la derivada parcial y la derivada total. Entre ellas se incluyen: [11]

Una operación d con estas dos propiedades se conoce en álgebra abstracta como derivación . Implican la regla de potencia Además, se cumplen varias formas de la regla de la cadena , con un nivel de generalidad creciente: [12]

Formulación general

Se puede desarrollar una noción consistente de diferencial para una función f  : R nR m entre dos espacios euclidianos . Sea xxR n un par de vectores euclidianos . El incremento en la función f es Si existe una matriz A m × n tal que en la que el vector ε → 0 cuando Δ x → 0 , entonces f es por definición diferenciable en el punto x . La matriz A a veces se conoce como matriz jacobiana , y la transformación lineal que asocia al incremento Δ xR n del vector A Δ xR m se conoce, en este contexto general, como diferencial df ( x ) de f en el punto x . Esta es precisamente la derivada de Fréchet , y se puede hacer que la misma construcción funcione para una función entre cualesquiera espacios de Banach .

Otro punto de vista fructífero es definir la diferencial directamente como una especie de derivada direccional : que es el enfoque ya adoptado para definir diferenciales de orden superior (y es el que más se aproxima a la definición establecida por Cauchy). Si t representa el tiempo y x la posición, entonces h representa una velocidad en lugar de un desplazamiento como lo hemos considerado hasta ahora. Esto produce otro refinamiento de la noción de diferencial: que debería ser una función lineal de una velocidad cinemática. El conjunto de todas las velocidades a través de un punto dado del espacio se conoce como el espacio tangente , y por lo tanto df da una función lineal en el espacio tangente: una forma diferencial . Con esta interpretación, la diferencial de f se conoce como la derivada exterior , y tiene una amplia aplicación en geometría diferencial porque la noción de velocidades y el espacio tangente tienen sentido en cualquier variedad diferenciable . Si, además, el valor de salida de f también representa una posición (en un espacio euclidiano), entonces un análisis dimensional confirma que el valor de salida de df debe ser una velocidad. Si uno trata el diferencial de esta manera, entonces se lo conoce como empuje hacia adelante ya que "empuja" las velocidades desde un espacio fuente hacia velocidades en un espacio destino.

Otros enfoques

Aunque la noción de tener un incremento infinitesimal dx no está bien definida en el análisis matemático moderno , existe una variedad de técnicas para definir la diferencial infinitesimal de modo que la diferencial de una función pueda manejarse de una manera que no entre en conflicto con la notación de Leibniz . Estas incluyen:

Ejemplos y aplicaciones

Las diferenciales pueden usarse eficazmente en el análisis numérico para estudiar la propagación de errores experimentales en un cálculo y, por lo tanto, la estabilidad numérica general de un problema (Courant 1937a). Supongamos que la variable x representa el resultado de un experimento e y es el resultado de un cálculo numérico aplicado a x . La pregunta es hasta qué punto los errores en la medición de x influyen en el resultado del cálculo de y . Si x se conoce dentro de Δ x de su valor verdadero, entonces el teorema de Taylor da la siguiente estimación del error Δ y en el cálculo de y : donde ξ = x + θ Δ x para algún 0 < θ < 1 . Si Δ x es pequeño, entonces el término de segundo orden es despreciable, de modo que Δ y es, para fines prácticos, bien aproximado por dy = f' ( x ) Δ x .

La diferencial suele ser útil para reescribir una ecuación diferencial en la forma , en particular cuando se quieren separar las variables .

Notas

  1. ^ Para una descripción histórica detallada de la diferencial, véase Boyer 1959, especialmente la página 275, donde se encuentra la contribución de Cauchy sobre el tema. Una descripción abreviada aparece en Kline 1972, capítulo 40.
  2. ^ Cauchy negó explícitamente la posibilidad de cantidades reales infinitesimales e infinitas (Boyer 1959, pp. 273-275), y adoptó el punto de vista radicalmente diferente de que "una cantidad variable se vuelve infinitamente pequeña cuando su valor numérico disminuye indefinidamente de tal manera que converge a cero" (Cauchy 1823, p. 12; traducción de Boyer 1959, p. 273).
  3. ^ Boyer 1959, pág. 275
  4. ^ Boyer 1959, p. 12: "Los diferenciales así definidos son sólo nuevas variables , y no infinitesimales fijos..."
  5. ^ Courant 1937a, II, §9: "Aquí observamos sólo de pasada que es posible utilizar esta representación aproximada del incremento por la expresión lineal para construir una definición lógicamente satisfactoria de un "diferencial", como lo hizo Cauchy en particular".
  6. ^ Boyer 1959, pág. 284
  7. ^ Véanse, por ejemplo, los influyentes tratados de Courant 1937a, Kline 1977, Goursat 1904 y Hardy 1908. Las fuentes terciarias para esta definición incluyen también Tolstov 2001 e Itô 1993, §106.
  8. ^ Cauchy 1823. Véase también, por ejemplo, Goursat 1904, I, §14.
  9. ^ Goursat 1904, I, §14
  10. ^ En particular, a la holomorfía de dimensión infinita (Hille y Phillips 1974) y al análisis numérico a través del cálculo de diferencias finitas .
  11. ^ Goursat 1904, I, §17
  12. ^ Goursat 1904, I, §§14,16
  13. ^ Eisenbud y Harris 1998.
  14. ^ Véase Kock 2006 y Moerdijk & Reyes 1991.
  15. ^ Véase Robinson 1996 y Keisler 1986.

Véase también

Referencias

Enlaces externos