stringtranslate.com

Número de condición

En el análisis numérico , el número de condición de una función mide cuánto puede cambiar el valor de salida de la función ante un pequeño cambio en el argumento de entrada. Esto se utiliza para medir la sensibilidad de una función a los cambios o errores en la entrada, y cuánto error en la salida resulta de un error en la entrada. Muy frecuentemente, uno está resolviendo el problema inverso: dado que uno está resolviendo para x, y por lo tanto se debe utilizar el número de condición de la inversa (local). [1] [2]

El número de condición se deriva de la teoría de propagación de la incertidumbre y se define formalmente como el valor del cambio relativo asintótico en el peor de los casos en la salida para un cambio relativo en la entrada. La "función" es la solución de un problema y los "argumentos" son los datos del problema. El número de condición se aplica con frecuencia a preguntas de álgebra lineal , en cuyo caso la derivada es sencilla pero el error podría estar en muchas direcciones diferentes y, por lo tanto, se calcula a partir de la geometría de la matriz. De manera más general, los números de condición se pueden definir para funciones no lineales en varias variables.

Un problema con un número de condición bajo se dice que está bien condicionado , mientras que un problema con un número de condición alto se dice que está mal condicionado . En términos no matemáticos, un problema mal condicionado es aquel en el que, para un pequeño cambio en las entradas (las variables independientes ), hay un gran cambio en la respuesta o variable dependiente . Esto significa que la solución/respuesta correcta a la ecuación se vuelve difícil de encontrar. El número de condición es una propiedad del problema. Junto con el problema hay cualquier número de algoritmos que se pueden usar para resolver el problema, es decir, para calcular la solución. Algunos algoritmos tienen una propiedad llamada estabilidad hacia atrás ; en general, se puede esperar que un algoritmo estable hacia atrás resuelva con precisión problemas bien condicionados. Los libros de texto de análisis numérico brindan fórmulas para los números de condición de los problemas e identifican algoritmos estables hacia atrás conocidos.

Como regla general, si el número de condición es , entonces puede perder hasta dígitos de precisión además de lo que se perdería con el método numérico debido a la pérdida de precisión de los métodos aritméticos. [3] Sin embargo, el número de condición no da el valor exacto de la inexactitud máxima que puede ocurrir en el algoritmo. Generalmente solo lo limita con una estimación (cuyo valor calculado depende de la elección de la norma para medir la inexactitud).

Definición general en el contexto del análisis de errores

Dado un problema y un algoritmo con una entrada y una salida, el error es el error absoluto es y el error relativo es

En este contexto, el número de condición absoluta de un problema es [ aclaración necesaria ]

y el número de condición relativa es [ aclaración necesaria ]

Matrices

Por ejemplo, el número de condición asociado con la ecuación lineal Ax  =  b da un límite sobre cuán inexacta será la solución x después de la aproximación. Nótese que esto es antes de que se tengan en cuenta los efectos del error de redondeo ; el condicionamiento es una propiedad de la matriz , no del algoritmo o la precisión de punto flotante de la computadora utilizada para resolver el sistema correspondiente. En particular, uno debe pensar en el número de condición como siendo (muy aproximadamente) la tasa a la que la solución x cambiará con respecto a un cambio en b . Por lo tanto, si el número de condición es grande, incluso un pequeño error en b puede causar un gran error en x . Por otro lado, si el número de condición es pequeño, entonces el error en x no será mucho mayor que el error en b .

El número de condición se define con mayor precisión como la relación máxima entre el error relativo en x y el error relativo en b .

Sea e el error en b . Suponiendo que A es una matriz no singular , el error en la solución A −1 b es A −1 e . La razón entre el error relativo en la solución y el error relativo en b es

Se ve entonces que el valor máximo (para b y e distintos de cero ) es el producto de las dos normas del operador , como sigue:

La misma definición se utiliza para cualquier norma consistente , es decir, aquella que satisface

Cuando el número de condición es exactamente uno (lo que sólo puede ocurrir si A es un múltiplo escalar de una isometría lineal ), entonces un algoritmo de solución puede encontrar (en principio, es decir, si el algoritmo no introduce errores propios) una aproximación de la solución cuya precisión no sea peor que la de los datos.

Sin embargo, esto no significa que el algoritmo convergerá rápidamente a esta solución, sino que no divergirá arbitrariamente debido a la inexactitud de los datos de origen (error hacia atrás), siempre que el error hacia adelante introducido por el algoritmo no diverja también debido a la acumulación de errores de redondeo intermedios. [ aclaración necesaria ]

El número de condición también puede ser infinito, pero esto implica que el problema está mal planteado (no posee una solución única y bien definida para cada elección de datos; es decir, la matriz no es invertible ) y no se puede esperar que ningún algoritmo encuentre una solución de manera confiable.

La definición del número de condición depende de la elección de la norma , como se puede ilustrar con dos ejemplos.

Si es la norma matricial inducida por la norma euclidiana (vectorial) (a veces conocida como norma L 2 y típicamente denotada como ), entonces

donde y son valores singulares máximo y mínimo de respectivamente. Por lo tanto:

El número de condición con respecto a L 2 surge tan a menudo en el álgebra lineal numérica que se le da un nombre: el número de condición de una matriz .

Si es la norma matricial inducida por la norma (vectorial) y es triangular inferior no singular (es decir, para todos ), entonces

recordando que los valores propios de cualquier matriz triangular son simplemente las entradas diagonales.

El número de condición calculado con esta norma es generalmente mayor que el número de condición calculado en relación con la norma euclidiana , pero se puede evaluar más fácilmente (y este es a menudo el único número de condición prácticamente computable, cuando el problema a resolver involucra un álgebra no lineal [ aclaración necesaria ] , por ejemplo al aproximar funciones o números irracionales y trascendentales con métodos numéricos).

Si el número de condición no es significativamente mayor que uno, la matriz está bien condicionada , lo que significa que su inversa se puede calcular con buena precisión. Si el número de condición es muy grande, entonces se dice que la matriz está mal condicionada . En la práctica, una matriz de este tipo es casi singular, y el cálculo de su inversa, o solución de un sistema lineal de ecuaciones, es propenso a grandes errores numéricos.

A menudo se dice que una matriz que no es invertible tiene un número de condición igual a infinito. Alternativamente, se puede definir como , donde es la pseudoinversa de Moore-Penrose . Para matrices cuadradas, esto lamentablemente hace que el número de condición sea discontinuo, pero es una definición útil para matrices rectangulares, que nunca son invertibles pero aún se usan para definir sistemas de ecuaciones.

No lineal

Los números de condición también se pueden definir para funciones no lineales y se pueden calcular mediante cálculo . El número de condición varía con el punto; en algunos casos, se puede utilizar el número de condición máximo (o supremo ) sobre el dominio de la función o el dominio de la pregunta como un número de condición general, mientras que en otros casos el número de condición en un punto particular es de mayor interés.

Una variable

El número de condición de una función diferenciable en una variable como función es . Evaluado en un punto , esto es

Nótese que este es el valor absoluto de la elasticidad de una función en economía.

De manera más elegante, esto se puede entender como (el valor absoluto de) la relación entre la derivada logarítmica de , que es , y la derivada logarítmica de , que es , lo que da una relación de . Esto se debe a que la derivada logarítmica es la tasa infinitesimal de cambio relativo en una función: es la derivada escalada por el valor de . Tenga en cuenta que si una función tiene un cero en un punto, su número de condición en el punto es infinito, ya que los cambios infinitesimales en la entrada pueden cambiar la salida de cero a positiva o negativa, lo que produce una relación con cero en el denominador, por lo tanto, un cambio relativo infinito.

Más directamente, dado un pequeño cambio en , el cambio relativo en es , mientras que el cambio relativo en es . Tomando la relación se obtiene

El último término es el cociente de diferencias (la pendiente de la recta secante ), y al tomar el límite se obtiene la derivada.

Los números de condición de funciones elementales comunes son particularmente importantes para calcular cifras significativas y se pueden calcular inmediatamente a partir de la derivada. A continuación se indican algunos de los más importantes:

Varias variables

Los números de condición se pueden definir para cualquier función que asigne sus datos de algún dominio (por ejemplo, una -tupla de números reales ) a algún codominio (por ejemplo, una -tupla de números reales ), donde tanto el dominio como el codominio son espacios de Banach . Expresan cuán sensible es esa función a pequeños cambios (o pequeños errores) en sus argumentos. Esto es crucial para evaluar la sensibilidad y las posibles dificultades de precisión de numerosos problemas computacionales, por ejemplo, la búsqueda de raíces polinómicas o el cálculo de valores propios .

El número de condición de en un punto (específicamente, su número de condición relativo [4] ) se define entonces como la relación máxima del cambio fraccionario en a cualquier cambio fraccionario en , en el límite donde el cambio en se vuelve infinitesimalmente pequeño: [4]

donde es una norma en el dominio/codominio de .

Si es diferenciable, esto es equivalente a: [4]

donde ⁠ ⁠ denota la matriz jacobiana de derivadas parciales de en , y es la norma inducida en la matriz.

Véase también

Referencias

  1. ^ Belsley, David A.; Kuh, Edwin ; Welsch, Roy E. (1980). "El número de condición". Diagnóstico de regresión: identificación de datos influyentes y fuentes de colinealidad . Nueva York: John Wiley & Sons. págs. 100–104. ISBN 0-471-05856-4.
  2. ^ Pesaran, M. Hashem (2015). "El problema de la multicolinealidad". Econometría de series temporales y datos de panel . Nueva York: Oxford University Press. pp. 67–72 [p. 70]. ISBN 978-0-19-875998-0.
  3. ^ Cheney; Kincaid (2008). Matemática numérica y computación. Cengage Learning. pág. 321. ISBN 978-0-495-11475-8.
  4. ^ abc Trefethen, LN; Bau, D. (1997). Álgebra lineal numérica. SIAM. ISBN 978-0-89871-361-9.

Lectura adicional

Enlaces externos