stringtranslate.com

Integración por sustitución

En cálculo , la integración por sustitución , también conocida como u -sustitución , regla de la cadena inversa o cambio de variables , [1] es un método para evaluar integrales y antiderivadas . Es la contraparte de la regla de la cadena para la diferenciación y se puede pensar libremente que es el uso de la regla de la cadena "al revés".

Sustitución de una sola variable

Introducción (integrales indefinidas)

Antes de enunciar el resultado rigurosamente , consideremos un caso simple que utiliza integrales indefinidas .

Calcular [2]

Establecer Esto significa o como una forma diferencial , Ahora: donde es una constante arbitraria de integración .

Este procedimiento se utiliza con frecuencia, pero no todas las integrales tienen una forma que permita su uso. En cualquier caso, el resultado debe verificarse derivando y comparando con el integrando original. En el caso de las integrales definidas, también deben ajustarse los límites de integración, pero el procedimiento es básicamente el mismo.

Enunciado para integrales definidas

Sea una función diferenciable con derivada continua , donde es un intervalo . Supóngase que es una función continua . Entonces: [3]

En la notación de Leibniz, la sustitución da como resultado: Trabajando heurísticamente con infinitesimales se obtiene la ecuación que sugiere la fórmula de sustitución anterior. (Esta ecuación puede ponerse sobre una base rigurosa interpretándola como una afirmación sobre las formas diferenciales ). Se puede ver el método de integración por sustitución como una justificación parcial de la notación de Leibniz para integrales y derivadas.

La fórmula se utiliza para transformar una integral en otra integral que sea más fácil de calcular. Por lo tanto, la fórmula se puede leer de izquierda a derecha o de derecha a izquierda para simplificar una integral dada. Cuando se utiliza de la primera manera, a veces se conoce como u -sustitución o w -sustitución en la que una nueva variable se define como una función de la variable original que se encuentra dentro de la función compuesta multiplicada por la derivada de la función interna. La última manera se utiliza comúnmente en la sustitución trigonométrica , reemplazando la variable original con una función trigonométrica de una nueva variable y la diferencial original con la diferencial de la función trigonométrica.

Prueba

La integración por sustitución se puede derivar del teorema fundamental del cálculo de la siguiente manera. Sean y dos funciones que satisfacen la hipótesis anterior de que es continua en y es integrable en el intervalo cerrado . Entonces la función también es integrable en . Por lo tanto, las integrales y de hecho existen, y queda por demostrar que son iguales.

Como es continua, tiene una antiderivada . Luego se define la función compuesta . Como es diferenciable, al combinar la regla de la cadena y la definición de una antiderivada se obtiene:

Aplicando dos veces el teorema fundamental del cálculo se obtiene: que es la regla de sustitución.

Ejemplos: Antiderivadas (integrales indefinidas)

La sustitución se puede utilizar para determinar antiderivadas . Se elige una relación entre y se determina la relación correspondiente entre y mediante la diferenciación, y se realizan las sustituciones. Con suerte, se puede determinar una antiderivada para la función sustituida; luego se deshace la sustitución original entre y .

Ejemplo 1

Consideremos la integral: Realice la sustitución para obtener el significado Por lo tanto: donde es una constante arbitraria de integración .

Ejemplo 2: Antiderivadas de la tangente y la cotangente

La función tangente se puede integrar mediante sustitución expresándola en términos del seno y el coseno: .

Usando la sustitución se obtiene y

La función cotangente se puede integrar de manera similar expresándola como y utilizando la sustitución :

Ejemplos: Integrales definidas

Al evaluar integrales definidas por sustitución, se puede calcular primero la antiderivada completa y luego aplicar las condiciones de contorno. En ese caso, no hay necesidad de transformar los términos de contorno. Alternativamente, se puede evaluar primero completamente la integral indefinida (ver arriba) y luego aplicar las condiciones de contorno. Esto resulta especialmente útil cuando se utilizan múltiples sustituciones.

Ejemplo 1

Considere la integral: Realice la sustitución para obtener el significado Por lo tanto: Dado que el límite inferior se reemplazó con y el límite superior con , una transformación nuevamente en términos de fue innecesaria.

Ejemplo 2:Sustitución trigonométrica

Para la integral se necesita una variación del procedimiento anterior. La sustitución que implica es útil porque tenemos:

La integral resultante se puede calcular mediante la integración por partes o una fórmula de ángulo doble , seguida de una sustitución más. También se puede observar que la función que se está integrando es el cuarto superior derecho de un círculo con un radio de uno, y por lo tanto, la integración del cuarto superior derecho de cero a uno es el equivalente geométrico del área de un cuarto del círculo unitario, o

Sustitución de múltiples variables

También se puede utilizar la sustitución al integrar funciones de varias variables .

Aquí, la función de sustitución ( v 1 ,..., v n ) = φ ( u 1 , ..., u n ) debe ser inyectiva y continuamente diferenciable, y las diferenciales se transforman como: donde det( )( u 1 , ..., u n ) denota el determinante de la matriz jacobiana de derivadas parciales de φ en el punto ( u 1 , ..., u n ) . Esta fórmula expresa el hecho de que el valor absoluto del determinante de una matriz es igual al volumen del paraleletopo abarcado por sus columnas o filas.

Más precisamente, la fórmula del cambio de variables se enuncia en el siguiente teorema:

Teorema  —  Sea U un conjunto abierto en R n y φ  : UR n una función inyectiva diferenciable con derivadas parciales continuas, cuyo jacobiano es distinto de cero para cada x en U . Entonces, para cualquier función continua f , de valor real y con soporte compacto , con soporte contenido en φ ( U ) :

Las condiciones del teorema se pueden debilitar de varias maneras. En primer lugar, el requisito de que φ sea continuamente diferenciable se puede reemplazar por el supuesto más débil de que φ sea meramente diferenciable y tenga una inversa continua. [4] Se garantiza que esto se cumple si φ es continuamente diferenciable por el teorema de la función inversa . Alternativamente, el requisito de que det( ) ≠ 0 se puede eliminar aplicando el teorema de Sard . [5]

Para las funciones medibles de Lebesgue, el teorema puede enunciarse de la siguiente forma: [6]

Teorema  —  Sea U un subconjunto medible de R n y φ  : UR n una función inyectiva , y supongamos que para cada x en U existe φ ′( x ) en R n , n tal que φ ( y ) = φ ( x ) + φ′ ( x )( yx ) + o (‖ yx ‖) cuando yx (aquí o es notación o minúscula ). Entonces φ ( U ) es medible, y para cualquier función de valor real f definida en φ ( U ) : en el sentido de que si existe cualquiera de las integrales (incluyendo la posibilidad de ser propiamente infinita), entonces también existe la otra, y tienen el mismo valor.

Otra versión muy general de la teoría de la medida es la siguiente: [7]

Teorema  —  Sea X un espacio de Hausdorff localmente compacto equipado con una medida de Radon finita μ , y sea Y un espacio de Hausdorff σ-compacto con una medida de Radon ρ σ-finita . Sea φ  : XY una función absolutamente continua (donde esto último significa que ρ ( φ ( E )) = 0 siempre que μ ( E ) = 0 ). Entonces existe una función medible de Borel de valor real w en X tal que para cada función integrable de Lebesgue f  : YR , la función ( fφ ) ⋅ w es integrable de Lebesgue en X , y Además, es posible escribir para alguna función medible de Borel g en Y .

En la teoría de la medida geométrica , la integración por sustitución se utiliza con funciones de Lipschitz . Una función bi-Lipschitz es una función de Lipschitz φ  : UR n que es inyectiva y cuya función inversa φ −1  : φ ( U ) → U también es Lipschitz. Por el teorema de Rademacher , una función bi-Lipschitz es diferenciable casi en todas partes . En particular, el determinante jacobiano de una función bi-Lipschitz det está bien definido casi en todas partes. Entonces se cumple el siguiente resultado:

Teorema  —  Sea U un subconjunto abierto de R n y φ  : UR n una función bi-Lipschitz. Sea f  : φ ( U ) → R medible. Entonces, en el sentido de que si cualquiera de las integrales existe (o es propiamente infinita), entonces también existe la otra, y tienen el mismo valor.

El teorema anterior fue propuesto por primera vez por Euler cuando desarrolló la noción de integrales dobles en 1769. Aunque fue generalizado a integrales triples por Lagrange en 1773, y utilizado por Legendre , Laplace y Gauss , y generalizado por primera vez a n variables por Mikhail Ostrogradsky en 1836, resistió una prueba formal completamente rigurosa durante un tiempo sorprendentemente largo, y fue resuelto satisfactoriamente por primera vez 125 años después, por Élie Cartan en una serie de artículos que comenzaron a mediados de la década de 1890. [8] [9]

Aplicación en probabilidad

La sustitución se puede utilizar para responder la siguiente pregunta importante sobre probabilidad: dada una variable aleatoria X con densidad de probabilidad p X y otra variable aleatoria Y tal que Y = ϕ ( X ) para ϕ inyectiva (uno a uno) , ¿ cuál es la densidad de probabilidad para Y ?

Es más fácil responder a esta pregunta respondiendo primero a una pregunta ligeramente diferente: ¿cuál es la probabilidad de que Y tome un valor en algún subconjunto particular S ? Denotemos esta probabilidad como P ( YS ). Por supuesto, si Y tiene una densidad de probabilidad p Y , entonces la respuesta es: pero esto no es realmente útil porque no conocemos p Y ; es lo que estamos tratando de encontrar. Podemos avanzar considerando el problema en la variable X . Y toma un valor en S siempre que X toma un valor en así que:

Al cambiar de la variable x a y obtenemos: Al combinar esto con nuestra primera ecuación obtenemos: entonces:

En el caso en que X e Y dependen de varias variables no correlacionadas (es decir, y ), se pueden encontrar por sustitución en varias variables analizadas anteriormente. El resultado es:

Véase también

Notas

  1. ^ Swokowski 1983, pág. 257
  2. ^ Swokowski 1983, pág. 258
  3. ^ Briggs y Cochran 2011, pág. 361
  4. ^ Rudin 1987, Teorema 7.26
  5. ^ Spivak 1965, pág. 72
  6. ^ Fremlin 2010, Teorema 263D
  7. ^ Hewitt y Stromberg 1965, Teorema 20.3
  8. ^ Catz 1982
  9. ^ Ferzola 1994

Referencias

Enlaces externos