Los métodos para calcular raíces cuadradas son algoritmos para aproximar la raíz cuadrada no negativa de un número real positivo . Dado que todas las raíces cuadradas de los números naturales , excepto las de los cuadrados perfectos , son irracionales , [1] las raíces cuadradas normalmente solo se pueden calcular con una precisión finita: estos métodos suelen construir una serie de aproximaciones cada vez más precisas .
La mayoría de los métodos de cálculo de la raíz cuadrada son iterativos: después de elegir una estimación inicial adecuada de , se realiza un refinamiento iterativo hasta que se cumple algún criterio de terminación. Un esquema de refinamiento es el método de Heron, un caso especial del método de Newton . Si la división es mucho más costosa que la multiplicación, puede ser preferible calcular la raíz cuadrada inversa en su lugar.
Existen otros métodos para calcular la raíz cuadrada dígito por dígito o mediante series de Taylor. Se pueden calcular aproximaciones racionales de raíces cuadradas mediante desarrollos de fracciones continuas.
El método empleado depende de la precisión necesaria, de las herramientas disponibles y de la capacidad computacional. Los métodos pueden clasificarse a grandes rasgos como los adecuados para el cálculo mental, los que normalmente requieren al menos papel y lápiz, y los que se implementan como programas que se ejecutan en una computadora electrónica digital u otro dispositivo informático. Los algoritmos pueden tener en cuenta la convergencia (cuántas iteraciones se requieren para lograr una precisión específica), la complejidad computacional de operaciones individuales (es decir, división) o iteraciones, y la propagación de errores (la precisión del resultado final).
Algunos métodos, como la división sintética con lápiz y papel y la expansión de series, no requieren un valor inicial. En algunas aplicaciones, se requiere una raíz cuadrada entera , que es la raíz cuadrada redondeada o truncada al entero más cercano (en este caso, se puede emplear un procedimiento modificado).
Los procedimientos para hallar raíces cuadradas (en particular la raíz cuadrada de 2 ) se conocen al menos desde el período de la antigua Babilonia en el siglo XVII a. C. Los matemáticos babilónicos calcularon la raíz cuadrada de 2 a tres "dígitos" sexagesimales después del 1, pero no se sabe exactamente cómo. Sabían cómo aproximar una hipotenusa utilizando (dando por ejemplo para la diagonal de una puerta cuya altura es de varillas y cuyo ancho es de varillas) y es posible que hayan utilizado un enfoque similar para hallar la aproximación de [2]
El método de Herón , del siglo I en Egipto, fue el primer algoritmo comprobable para calcular la raíz cuadrada. [3]
Los métodos analíticos modernos comenzaron a desarrollarse después de la introducción del sistema de numeración arábigo en Europa occidental a principios del Renacimiento. [ cita requerida ]
Hoy en día, casi todos los dispositivos informáticos tienen una función de raíz cuadrada rápida y precisa, ya sea como una construcción del lenguaje de programación, una función intrínseca del compilador o de la biblioteca, o como un operador de hardware, basado en uno de los procedimientos descritos.
Muchos algoritmos iterativos de raíz cuadrada requieren un valor inicial de semilla . La semilla debe ser un número positivo distinto de cero; debe estar entre 1 y , el número cuya raíz cuadrada se desea, porque la raíz cuadrada debe estar en ese rango. Si la semilla está muy alejada de la raíz, el algoritmo requerirá más iteraciones. Si uno inicializa con (o ), entonces aproximadamente se desperdiciarán iteraciones solo para obtener el orden de magnitud de la raíz. Por lo tanto, es útil tener una estimación aproximada, que puede tener una precisión limitada pero es fácil de calcular. En general, cuanto mejor sea la estimación inicial, más rápida será la convergencia. Para el método de Newton (también llamado método babilónico o de Heron), una semilla algo más grande que la raíz convergerá ligeramente más rápido que una semilla algo más pequeña que la raíz.
En general, una estimación se realiza de acuerdo con un intervalo arbitrario que se sabe que contiene la raíz (como ). La estimación es un valor específico de una aproximación funcional a lo largo del intervalo. Obtener una mejor estimación implica obtener límites más estrictos en el intervalo o encontrar una mejor aproximación funcional a . Esto último suele significar utilizar un polinomio de orden superior en la aproximación, aunque no todas las aproximaciones son polinómicas. Los métodos comunes de estimación incluyen escalar, lineal, hiperbólico y logarítmico. Por lo general, se utiliza una base decimal para la estimación mental o con papel y lápiz. Una base binaria es más adecuada para las estimaciones por computadora. Al estimar, el exponente y la mantisa suelen tratarse por separado, ya que el número se expresaría en notación científica.
Normalmente, el número se expresa en notación científica como donde y n es un número entero, y el rango de posibles raíces cuadradas es donde .
Los métodos escalares dividen el rango en intervalos y la estimación en cada intervalo se representa mediante un único número escalar. Si el rango se considera como un único intervalo, las medias aritméticas (5,5) o geométricas ( ) son estimaciones plausibles. El error absoluto y relativo para estas serán diferentes. En general, un único escalar será muy inexacto. Las estimaciones mejores dividen el rango en dos o más intervalos, pero las estimaciones escalares tienen una precisión inherentemente baja.
Para dos intervalos, divididos geométricamente, la raíz cuadrada se puede estimar como [Nota 1]
Esta estimación tiene un error absoluto máximo de a = 100 y un error relativo máximo del 100% en a = 1.
Por ejemplo, para factorizado como , la estimación es , un error absoluto de 246 y un error relativo de casi 70%.
Una mejor estimación, y el método estándar utilizado, es una aproximación lineal a la función sobre un arco pequeño. Si, como se indicó anteriormente, se eliminan del número las potencias de la base y se reduce el intervalo a , se puede utilizar como aproximación una línea secante que abarque el arco o una línea tangente en algún punto a lo largo del arco, pero una línea de regresión de mínimos cuadrados que intersecta el arco será más precisa.
Una línea de regresión de mínimos cuadrados minimiza la diferencia promedio entre la estimación y el valor de la función. Su ecuación es . Reordenando, . Redondeando los coeficientes para facilitar el cálculo,
Esta es la mejor estimación en promedio que se puede lograr con una aproximación lineal de una sola pieza de la función y=x 2 en el intervalo . Tiene un error absoluto máximo de 1,2 en a=100 y un error relativo máximo del 30% en S=1 y 10. [Nota 2]
Para dividir por 10, reste uno del exponente de , o, en sentido figurado, mueva el punto decimal un dígito a la izquierda. Para esta formulación, cualquier constante aditiva 1 más un pequeño incremento dará como resultado una estimación satisfactoria, por lo que recordar el número exacto no es una carga. La aproximación (redondeada o no) utilizando una sola línea que abarca el rango es menor que un dígito significativo de precisión; el error relativo es mayor que 1/2 2 , por lo que se proporcionan menos de 2 bits de información. La precisión está severamente limitada porque el rango es de dos órdenes de magnitud, bastante grande para este tipo de estimación.
Se puede obtener una estimación mucho mejor mediante una aproximación lineal por partes: múltiples segmentos de línea, cada uno de los cuales se aproxima a algún subarco del original. Cuantos más segmentos de línea se utilicen, mejor será la aproximación. La forma más común es utilizar líneas tangentes; las opciones críticas son cómo dividir el arco y dónde colocar los puntos tangentes. Una forma eficaz de dividir el arco de y = 1 a y = 100 es geométricamente: para dos intervalos, los límites de los intervalos son la raíz cuadrada de los límites del intervalo original, 1×100, es decir, [1, 2 √ 100 ] y [ 2 √ 100 ,100]. Para tres intervalos, los límites son las raíces cúbicas de 100: [1, 3 √ 100 ], [ 3 √ 100 ,( 3 √ 100 ) 2 ] y [( 3 √ 100 ) 2 ,100], etc. Para dos intervalos, 2 √ 100 = 10, un número muy conveniente. Las rectas tangentes son fáciles de derivar y están ubicadas en x = √ 1* √ 10 y x = √ 10* √ 10 . Sus ecuaciones son: y . Invirtiendo, las raíces cuadradas son: y . Por lo tanto, para :
Los errores absolutos máximos se producen en los puntos altos de los intervalos, en a = 10 y 100, y son 0,54 y 1,7 respectivamente. Los errores relativos máximos se encuentran en los puntos finales de los intervalos, en a = 1, 10 y 100, y son 17% en ambos casos. 17% o 0,17 es mayor que 1/10, por lo que el método arroja una precisión de menos de un dígito decimal.
En algunos casos, las estimaciones hiperbólicas pueden ser eficaces, porque una hipérbola también es una curva convexa y puede estar situada a lo largo de un arco de Y = x 2 mejor que una línea. Las estimaciones hiperbólicas son más complejas computacionalmente, porque necesariamente requieren una división flotante. Una aproximación hiperbólica casi óptima a x 2 en el intervalo es y = 190/(10-x)-20. Transponiendo, la raíz cuadrada es x = -190/(y+20)+10. Por lo tanto, para :
La división flotante debe ser precisa solo hasta un dígito decimal, porque la estimación general solo es así de precisa y se puede hacer mentalmente. Una estimación hiperbólica es mejor en promedio que las estimaciones escalares o lineales. Tiene un error absoluto máximo de 1,58 en 100 y un error relativo máximo de 16,0 % en 10. Para el peor caso en a=10, la estimación es 3,67. Si uno comienza con 10 y aplica iteraciones de Newton-Raphson directamente, se requerirán dos iteraciones, lo que dará como resultado 3,66, antes de que se exceda la precisión de la estimación hiperbólica. Para un caso más típico como 75, la estimación hiperbólica es 8,00 y se requerirían 5 iteraciones de Newton-Raphson comenzando en 75 para obtener un resultado más preciso.
Un método análogo a la aproximación lineal por partes pero que utiliza solo ecuaciones aritméticas en lugar de algebraicas, utiliza las tablas de multiplicar al revés: la raíz cuadrada de un número entre 1 y 100 está entre 1 y 10, por lo que si sabemos que 25 es un cuadrado perfecto (5 × 5), y 36 es un cuadrado perfecto (6 × 6), entonces la raíz cuadrada de un número mayor o igual a 25 pero menor que 36, comienza con un 5. Lo mismo ocurre con los números entre otros cuadrados. Este método dará un primer dígito correcto, pero no es preciso hasta un dígito: el primer dígito de la raíz cuadrada de 35, por ejemplo, es 5, pero la raíz cuadrada de 35 es casi 6.
Una mejor manera es dividir el rango en intervalos que estén a la mitad de los cuadrados. Por lo tanto, cualquier número entre 25 y la mitad de 36, que es 30,5, se estima en 5; cualquier número mayor que 30,5 hasta 36, se estima en 6. [Nota 3] El procedimiento solo requiere un poco de aritmética para encontrar un número límite en el medio de dos productos de la tabla de multiplicar. Aquí hay una tabla de referencia de esos límites:
La operación final es multiplicar la estimación k por la potencia de diez dividido por 2, por lo que para ,
El método produce implícitamente un dígito significativo de precisión, ya que redondea al mejor primer dígito.
El método se puede ampliar a 3 dígitos significativos en la mayoría de los casos, interpolando entre los cuadrados más cercanos que delimitan el operando. Si , entonces es aproximadamente k más una fracción, la diferencia entre a y k 2 dividida por la diferencia entre los dos cuadrados: donde
La operación final, como la anterior, es multiplicar el resultado por la potencia de diez dividido por 2;
k es un dígito decimal y R es una fracción que debe convertirse a decimal. Generalmente tiene un solo dígito en el numerador y uno o dos dígitos en el denominador, por lo que la conversión a decimal se puede hacer mentalmente.
Ejemplo: halla la raíz cuadrada de 75. 75 = 75 × 10 2 · 0 , por lo que a es 75 y n es 0. De las tablas de multiplicar, la raíz cuadrada de la mantisa debe ser 8 coma algo porque 8 × 8 es 64, pero 9 × 9 es 81, demasiado grande, por lo que k es 8; algo es la representación decimal de R . La fracción R es 75 - k 2 = 11, el numerador, y 81 - k 2 = 17, el denominador. 11/17 es un poco menor que 12/18, que es 2/3s o .67, así que adivina .66 (está bien adivinar aquí, el error es muy pequeño). Entonces la estimación es 8 + .66 = 8.66 . √ 75 elevado a tres dígitos significativos es 8,66, por lo que la estimación es válida hasta tres dígitos significativos. No todas las estimaciones realizadas con este método serán tan precisas, pero se aproximarán.
Cuando se trabaja en el sistema numérico binario (como lo hacen internamente las computadoras), al expresar como donde , la raíz cuadrada se puede estimar como
que es la línea de regresión de mínimos cuadrados para coeficientes de 3 dígitos significativos. tiene un error absoluto máximo de 0,0408 en =2 y un error relativo máximo de 3,0 % en =1. Una estimación redondeada computacionalmente conveniente (porque los coeficientes son potencias de 2) es:
que tiene un error absoluto máximo de 0,086 en 2 y un error relativo máximo de 6,1% en a = 0,5 y a = 2,0 .
Para , la aproximación binaria da . , por lo que la estimación tiene un error absoluto de 19 y un error relativo de 5,3%. El error relativo es un poco menor que 1/2 4 , por lo que la estimación es válida para 4+ bits.
Se puede obtener una estimación de 8 bits mediante una búsqueda en la tabla de los 8 bits superiores de , recordando que el bit superior está implícito en la mayoría de las representaciones de punto flotante y que el bit inferior del 8 debe redondearse. La tabla tiene 256 bytes de valores de raíz cuadrada de 8 bits precalculados. Por ejemplo, para el índice 11101101 2 que representa 1.8515625 10 , la entrada es 10101110 2 que representa 1.359375 10 , la raíz cuadrada de 1.8515625 10 con precisión de 8 bits (2+ dígitos decimales).
El primer algoritmo explícito para aproximar se conoce como método de Herón , en honor al matemático griego del siglo I Herón de Alejandría, quien describió el método en su obra Métrica del año 60 d . C. [3] Este método también se denomina método babilónico (que no debe confundirse con el método babilónico para aproximar hipotenusas), aunque no hay evidencia de que los babilonios conocieran el método.
Dado un número real positivo , sea x 0 > 0 cualquier estimación inicial positiva. El método de Heron consiste en realizar cálculos iterativos hasta lograr la precisión deseada. La secuencia definida por esta ecuación converge a
Esto equivale a utilizar el método de Newton para resolver . Este algoritmo es cuadráticamente convergente : la cantidad de dígitos correctos de se duplica aproximadamente con cada iteración.
La idea básica es que si es una sobreestimación de la raíz cuadrada de un número real no negativo, entonces será una subestimación, y viceversa, por lo que se puede esperar razonablemente que el promedio de estos dos números proporcione una mejor aproximación (aunque la prueba formal de esa afirmación depende de la desigualdad de las medias aritméticas y geométricas que muestra que este promedio es siempre una sobreestimación de la raíz cuadrada, como se señala en el artículo sobre raíces cuadradas , asegurando así la convergencia).
Más precisamente, si es nuestra estimación inicial de y es el error en nuestra estimación tal que entonces podemos expandir el binomio como: y resolver para el término de error
Por lo tanto, podemos compensar el error y actualizar nuestra estimación anterior como Dado que el error calculado no fue exacto, esta no es la respuesta real, sino que se convierte en nuestra nueva estimación para utilizar en la siguiente ronda de corrección. El proceso de actualización se repite hasta que se obtiene la precisión deseada.
Este algoritmo funciona igualmente bien en los números p -ádicos , pero no se puede utilizar para identificar raíces cuadradas reales con raíces cuadradas p -ádicas; uno puede, por ejemplo, construir una secuencia de números racionales mediante este método que converge a +3 en los reales, pero a −3 en los 2-ádicos.
Para calcular hasta seis cifras significativas, utilice el método de estimación aproximada anterior para obtener
Por lo tanto, hasta tres decimales.
Supongamos que Entonces, para cualquier número natural, el error relativo en se define por y por lo tanto
Entonces se puede demostrar que
Y por lo tanto y en consecuencia esa convergencia está asegurada, y cuadrática .
Si utilizamos la estimación aproximada anterior con el método babilónico, los casos menos precisos en orden ascendente son los siguientes:
Así que, en cualquier caso,
Los errores de redondeo ralentizarán la convergencia. Se recomienda mantener al menos un dígito adicional más allá de la precisión deseada del cálculo, para evitar un error de redondeo significativo.
Este método para hallar una aproximación a una raíz cuadrada se describió en un antiguo manuscrito indio , llamado el manuscrito Bakhshali . Es equivalente a dos iteraciones del método babilónico comenzando con x 0. Por lo tanto, el algoritmo es cuárticamente convergente, lo que significa que el número de dígitos correctos de la aproximación se cuadruplica aproximadamente con cada iteración. [4] La presentación original, utilizando notación moderna, es la siguiente: Para calcular , sea la aproximación inicial a . Luego, itere sucesivamente como:
Esto se puede utilizar para construir una aproximación racional a la raíz cuadrada comenzando con un entero. Si es un entero elegido de modo que esté cerca de , y es la diferencia cuyo valor absoluto se minimiza, entonces la primera iteración se puede escribir como:
El método Bakhshali se puede generalizar al cálculo de una raíz arbitraria, incluidas las raíces fraccionarias. [5]
Usando el mismo ejemplo dado con el método babilónico, sea Entonces, la primera iteración da
Asimismo, la segunda iteración da
Este es un método para encontrar cada dígito de la raíz cuadrada de una secuencia. Este método se basa en el teorema del binomio y básicamente en un algoritmo inverso que resuelve . Es más lento que el método babilónico, pero tiene varias ventajas:
Las desventajas son:
Los huesos de Napier incluyen una ayuda para la ejecución de este algoritmo. El algoritmo de desplazamiento de la raíz n-ésima es una generalización de este método.
En primer lugar, consideremos el caso de hallar la raíz cuadrada de un número Z , es decir, el cuadrado de un número de dos dígitos XY , donde X es el dígito de las decenas e Y es el dígito de las unidades. En concreto:
Ahora, utilizando el algoritmo dígito por dígito, primero determinamos el valor de X. X es el dígito más grande tal que X 2 es menor o igual a Z del cual eliminamos los dos dígitos más a la derecha.
En la siguiente iteración, emparejamos los dígitos, multiplicamos X por 2 y lo colocamos en el lugar de la décima mientras intentamos averiguar cuál es el valor de Y.
Dado que este es un caso simple donde la respuesta es una raíz cuadrada perfecta XY , el algoritmo se detiene aquí.
La misma idea se puede extender a cualquier cálculo de raíz cuadrada arbitrario. Supongamos que podemos hallar la raíz cuadrada de N expresándola como una suma de n números positivos tales que
Aplicando repetidamente la identidad básica, el término del lado derecho se puede expandir como
Esta expresión nos permite encontrar la raíz cuadrada adivinando secuencialmente los valores de s. Supongamos que los números ya han sido adivinados, entonces el término m -ésimo del lado derecho de la suma anterior está dado por donde es la raíz cuadrada aproximada encontrada hasta ahora. Ahora cada nueva suposición debe satisfacer la recursión tal que para todos con inicialización Cuando se ha encontrado la raíz cuadrada exacta; si no, entonces la suma de s da una aproximación adecuada de la raíz cuadrada, siendo el error de aproximación.
Por ejemplo, en el sistema de numeración decimal tenemos donde son marcadores de posición y los coeficientes . En cualquier etapa m-ésima del cálculo de la raíz cuadrada, la raíz aproximada encontrada hasta el momento y el término de suma se dan por
En este caso, dado que el valor posicional de es una potencia par de 10, solo necesitamos trabajar con el par de dígitos más significativos del término restante en cualquier etapa m-ésima. La sección siguiente codifica este procedimiento.
Es obvio que se puede utilizar un método similar para calcular la raíz cuadrada en sistemas numéricos distintos del sistema numérico decimal. Por ejemplo, encontrar la raíz cuadrada dígito por dígito en el sistema numérico binario es bastante eficiente ya que el valor de se busca en un conjunto más pequeño de dígitos binarios {0,1}. Esto hace que el cálculo sea más rápido ya que en cada etapa el valor de es para o para . El hecho de que solo tengamos dos opciones posibles para también hace que el proceso de decidir el valor de en la etapa m -ésima del cálculo sea más fácil. Esto se debe a que solo necesitamos verificar si para Si se cumple esta condición, entonces tomamos ; si no, entonces Además, el hecho de que la multiplicación por 2 se realice mediante desplazamientos de bits a la izquierda ayuda en el cálculo.
Escribe el número original en forma decimal. Los números se escriben de forma similar al algoritmo de la división larga y, como en la división larga, la raíz se escribirá en la línea de arriba. Ahora separa los dígitos en pares, comenzando desde el punto decimal y yendo tanto hacia la izquierda como hacia la derecha. El punto decimal de la raíz estará sobre el punto decimal del cuadrado. Un dígito de la raíz aparecerá sobre cada par de dígitos del cuadrado.
Comenzando con el par de dígitos más a la izquierda, realice el siguiente procedimiento para cada par:
Encuentra la raíz cuadrada de 152.2756.
1 2. 3 4 / \/ 01 52.27 56 01 1*1 <= 1 < 2*2 x=1 01 y = x*x = 1*1 = 1 00 52 22*2 <= 52 < 23*3 x=2 00 44 y = (20+x)*x = 22*2 = 44 08 27 243*3 <= 827 < 244*4 x=3 07 29 y = (240+x)*x = 243*3 = 729 98 56 2464*4 <= 9856 < 2465*5 x=4 98 56 y = (2460+x)*x = 2464*4 = 9856 00 00 El algoritmo termina: Respuesta=12.34
Esta sección utiliza el formalismo de la sección de cálculo dígito por dígito anterior, con la ligera variación de que dejamos , con cada o .
Iteramos todos los , desde abajo hasta , y construimos una solución aproximada , la suma de todos para los que hemos determinado el valor.
Para determinar si es igual a o , dejamos . Si (es decir, el cuadrado de nuestra solución aproximada incluyendo no excede el cuadrado objetivo) entonces , de lo contrario y .
Para evitar elevar al cuadrado en cada paso, almacenamos la diferencia y la actualizamos de forma incremental estableciendo con .
Inicialmente, establecemos para el más grande con .
Como optimización adicional, almacenamos y , los dos términos de en caso de que sea distinto de cero, en variables separadas , :
y se puede actualizar de manera eficiente en cada paso:
Tenga en cuenta que: cuál es el resultado final devuelto en la función siguiente.
Una implementación de este algoritmo en C: [6]
int32_t es raíz cuadrada ( int32_t n ) { assert (( "la entrada sqrt no debe ser negativa" , n > 0 )); // X_(n+1) int32_t x = n ; //c_n int32_t c = 0 ; // d_n que comienza en la potencia más alta de cuatro <= n int32_t d = 1 << 30 ; // Se establece el segundo bit desde arriba. // Igual que ((unsigned) INT32_MAX + 1) / 2. mientras ( d > n ) { d >>= 2 ; } // para dₙ … d₀ mientras ( d != 0 ) { si ( x >= c + d ) { // si X_(m+1) ≥ Y_m entonces a_m = 2^m x -= c + d ; // X_m = X_(m+1) - Y_m c = ( c >> 1 ) + d ; // c_(m-1) = c_m/2 + d_m (a_m es 2^m) } demás { c >>= 1 ; // c_(m-1) = c_m/2 (aₘ es 0) } d >>= 2 ; // d_(m-1) = d_m/4 } devolver c ; // c_(-1) }
Se pueden lograr algoritmos más rápidos, en binario, decimal o cualquier otra base, utilizando tablas de búsqueda, lo que en realidad implica intercambiar más espacio de almacenamiento por un tiempo de ejecución reducido . [7]
Las calculadoras de bolsillo suelen implementar buenas rutinas para calcular la función exponencial y el logaritmo natural , y luego calcular la raíz cuadrada de S utilizando la identidad encontrada usando las propiedades de los logaritmos ( ) y exponenciales ( ): [ cita requerida ] El denominador en la fracción corresponde a la raíz n ésima. En el caso anterior, el denominador es 2, por lo tanto, la ecuación especifica que se debe encontrar la raíz cuadrada. La misma identidad se utiliza cuando se calculan raíces cuadradas con tablas de logaritmos o reglas de cálculo .
Este método es aplicable para hallar la raíz cuadrada de y converge mejor para . Sin embargo, esto no es una limitación real para un cálculo basado en computadora, ya que en las representaciones de punto flotante y punto fijo de base 2, es trivial multiplicar por una potencia entera de 4 y, por lo tanto, por la potencia correspondiente de 2, cambiando el exponente o desplazándolo, respectivamente. Por lo tanto, se puede mover al rango . Además, el siguiente método no emplea divisiones generales, sino solo sumas, restas, multiplicaciones y divisiones por potencias de dos, que nuevamente son triviales de implementar. Una desventaja del método es que los errores numéricos se acumulan, a diferencia de los métodos iterativos de una sola variable, como el babilónico.
El paso de inicialización de este método es mientras los pasos iterativos leen Entonces, (mientras ).
La convergencia de , y por lo tanto también de , es cuadrática.
La prueba del método es bastante sencilla. Primero, reescribimos la definición iterativa de como Luego es sencillo demostrar por inducción que y, por lo tanto, la convergencia de al resultado deseado está asegurada por la convergencia de a 0, que a su vez se deduce de .
Este método fue desarrollado alrededor de 1950 por MV Wilkes , DJ Wheeler y S. Gill [8] para su uso en EDSAC , una de las primeras computadoras electrónicas. [9] El método se generalizó posteriormente, permitiendo el cálculo de raíces no cuadradas. [10]
Los siguientes son métodos iterativos para encontrar la raíz cuadrada recíproca de S que es . Una vez que se ha encontrado, se encuentra por simple multiplicación: . Estas iteraciones implican solo multiplicación y no división. Por lo tanto, son más rápidos que el método babilónico. Sin embargo, no son estables. Si el valor inicial no está cerca de la raíz cuadrada recíproca, las iteraciones se alejarán de él en lugar de converger hacia él. Por lo tanto, puede ser ventajoso realizar una iteración del método babilónico en una estimación aproximada antes de comenzar a aplicar estos métodos.
El algoritmo de Goldschmidt es una extensión de la división de Goldschmidt , llamada así por Robert Elliot Goldschmidt, [11] [12] que se puede utilizar para calcular raíces cuadradas. Algunas computadoras utilizan el algoritmo de Goldschmidt para calcular simultáneamente y . El algoritmo de Goldschmidt encuentra más rápido que la iteración de Newton-Raphson en una computadora con una instrucción de multiplicación-suma fusionada y una unidad de punto flotante segmentada o dos unidades de punto flotante independientes. [13]
La primera forma de escribir el algoritmo de Goldschmidt comienza
y se itera hasta que esté suficientemente cerca de 1, o un número fijo de iteraciones. Las iteraciones convergen a y Nótese que es posible omitir tanto y como del cálculo, y si se desean ambos, se pueden utilizar al final en lugar de calcularlo en cada iteración.
Una segunda forma, que utiliza operaciones de multiplicación-suma fusionadas , comienza
y se repite hasta que esté lo suficientemente cerca de 0, o un número fijo de iteraciones. Esto converge a y
Si N es una aproximación a , se puede encontrar una mejor aproximación utilizando la serie de Taylor de la función raíz cuadrada :
Como método iterativo, el orden de convergencia es igual al número de términos utilizados. Con dos términos, es idéntico al método babilónico. Con tres términos, cada iteración requiere casi tantas operaciones como la aproximación de Bakhshali, pero converge más lentamente. [ cita requerida ] Por lo tanto, esta no es una forma particularmente eficiente de cálculo. Para maximizar la tasa de convergencia, elija N de modo que sea lo más pequeño posible.
La representación de fracción continua de un número real se puede utilizar en lugar de su expansión decimal o binaria y esta representación tiene la propiedad de que la raíz cuadrada de cualquier número racional (que no sea un cuadrado perfecto) tiene una expansión periódica y repetida, similar a cómo los números racionales tienen expansiones repetidas en el sistema de notación decimal.
Los irracionales cuadráticos (números de la forma , donde a , b y c son enteros), y en particular, las raíces cuadradas de los enteros, tienen fracciones continuas periódicas . A veces lo que se desea es encontrar no el valor numérico de una raíz cuadrada, sino más bien su expansión en fracción continua y, por lo tanto, su aproximación racional. Sea S el número positivo para el que se requiere encontrar la raíz cuadrada. Luego, suponiendo que a es un número que sirve como una estimación inicial y que r es el término restante, podemos escribir Como tenemos , podemos expresar la raíz cuadrada de S como
Aplicando esta expresión al término denominador de la fracción, tenemos
La expansión numerador/denominador para fracciones continuas (ver a la izquierda) es complicada de escribir y de incorporar en sistemas de formato de texto. Por ello, los matemáticos han ideado varias notaciones alternativas, como [14]
En general, una notación aún más compacta es: [15] Para las fracciones continuas repetidas (que es lo que hacen todas las raíces cuadradas de cuadrados no perfectos), la repetición se representa solo una vez, con una línea superior para indicar una repetición no terminal de la parte sobrerrayada: [16]
Para √ 2 , el valor de es 1, por lo que su representación es:
Procediendo de esta manera, obtenemos una fracción continua generalizada para la raíz cuadrada como
El primer paso para evaluar dicha fracción [17] y obtener una raíz es hacer sustituciones numéricas para la raíz del número deseado y el número de denominadores seleccionados. Por ejemplo, en forma canónica, es 1 y para √ 2 , es 1, por lo que la fracción continua numérica para 3 denominadores es:
El paso 2 consiste en reducir la fracción continua de abajo hacia arriba, un denominador a la vez, para obtener una fracción racional cuyo numerador y denominador sean números enteros. La reducción se realiza de la siguiente manera (tomando los tres primeros denominadores):
Finalmente (paso 3), divide el numerador por el denominador de la fracción racional para obtener el valor aproximado de la raíz: redondeado a tres dígitos de precisión.
El valor real de √ 2 es 1,41 con tres dígitos significativos. El error relativo es 0,17%, por lo que la fracción racional es buena con una precisión de casi tres dígitos. Si se toman más denominadores, se obtienen aproximaciones cada vez mejores: cuatro denominadores dan como resultado la fracción , con una precisión de casi 4 dígitos, etc.
Los siguientes son ejemplos de raíces cuadradas, sus fracciones continuas simples y sus primeros términos, llamados convergentes , hasta el denominador 99 inclusive:
En general, cuanto mayor sea el denominador de una fracción racional, mejor será la aproximación. También se puede demostrar que al truncar una fracción continua se obtiene una fracción racional que es la mejor aproximación a la raíz de cualquier fracción con un denominador menor o igual que el denominador de esa fracción; por ejemplo, ninguna fracción con un denominador menor o igual a 70 es una aproximación tan buena a √ 2 como 99/70.
Un número se representa en un formato de punto flotante como , que también se denomina notación científica . Su raíz cuadrada es y se aplicarían fórmulas similares para raíces cúbicas y logaritmos. A primera vista, esto no supone una mejora en la simplicidad, pero supongamos que solo se requiere una aproximación: entonces, solo es bueno hasta un orden de magnitud. A continuación, reconozca que algunas potencias, p , serán impares, por lo que para 3141,59 = 3,14159 × 103 En lugar de trabajar con potencias fraccionarias de la base, multiplica la mantisa por la base y resta uno a la potencia para que quede par. La representación ajustada será el equivalente a 31,4159 × 102 por lo que la raíz cuadrada será √ 31,4159 × 101 .
Si se toma la parte entera de la mantisa ajustada, sólo pueden existir los valores de 1 a 99, y éstos podrían utilizarse como índice en una tabla de 99 raíces cuadradas precalculadas para completar la estimación. Una computadora que utilice base dieciséis requeriría una tabla más grande, pero una que utilice base dos requeriría sólo tres entradas: los bits posibles de la parte entera de la mantisa ajustada son 01 (la potencia es par, por lo que no hubo desplazamiento, recordando que un número de punto flotante normalizado siempre tiene un dígito de orden superior distinto de cero) o si la potencia es impar, 10 u 11, siendo estos los dos primeros bits de la mantisa original. Por lo tanto, 6,25 = 110,01 en binario, normalizado a 1,1001 × 2 2 una potencia par por lo que los bits apareados de la mantisa son 01, mientras que .625 = 0,101 en binario se normaliza a 1,01 × 2 −1 una potencia impar por lo que el ajuste es a 10,1 × 2 −2 y los bits apareados son 10. Observe que el bit de orden bajo de la potencia se refleja en el bit de orden alto de la mantisa por pares. Una potencia par tiene su bit de orden bajo cero y la mantisa ajustada comenzará con 0, mientras que para una potencia impar ese bit es uno y la mantisa ajustada comenzará con 1. Por lo tanto, cuando la potencia se reduce a la mitad, es como si su bit de orden bajo se desplazara para convertirse en el primer bit de la mantisa por pares.
Una tabla con sólo tres entradas podría ampliarse incorporando bits adicionales de la mantisa. Sin embargo, con las computadoras, en lugar de calcular una interpolación en una tabla, a menudo es mejor encontrar algún cálculo más simple que dé resultados equivalentes. Ahora todo depende de los detalles exactos del formato de la representación, además de las operaciones disponibles para acceder y manipular las partes del número. Por ejemplo, Fortran ofrece una EXPONENT(x)
función para obtener la potencia. El esfuerzo invertido en idear una buena aproximación inicial se recupera al evitar las iteraciones adicionales del proceso de refinamiento que se habrían necesitado para una aproximación deficiente. Dado que son pocas (una iteración requiere una división, una suma y una reducción a la mitad), la restricción es severa.
Muchos ordenadores siguen la representación IEEE (o una suficientemente similar) y se puede obtener una aproximación muy rápida a la raíz cuadrada para iniciar el método de Newton. La técnica que sigue se basa en el hecho de que el formato de punto flotante (en base dos) se aproxima al logaritmo en base 2. Es decir
Entonces, para un número de punto flotante de precisión simple de 32 bits en formato IEEE (donde, notablemente, la potencia tiene un sesgo de 127 agregado para la forma representada), puede obtener el logaritmo aproximado interpretando su representación binaria como un entero de 32 bits, escalándolo por y eliminando un sesgo de 127, es decir
Por ejemplo, 1.0 se representa con un número hexadecimal 0x3F800000, que representaría si se tomara como un entero. Si se utiliza la fórmula anterior, se obtiene , como se esperaba de . De manera similar, se obtiene 0.5 a partir de 1.5 (0x3FC00000).
Para obtener la raíz cuadrada, divida el logaritmo por 2 y convierta el valor nuevamente. El siguiente programa demuestra la idea. Se permite intencionalmente que el bit más bajo del exponente se propague hacia la mantisa. Una forma de justificar los pasos de este programa es suponer que es el sesgo del exponente y es la cantidad de bits almacenados explícitamente en la mantisa y luego demostrar que
/* Supone que float está en el formato de punto flotante de precisión simple IEEE 754 */ #include <stdint.h> float sqrt_approx ( float z ) { union { float f ; uint32_t i ; } val = { z }; /* Convertir tipo, conservando el patrón de bits */ /* * Para justificar el siguiente código, demuestre que * * ((((val.i / 2^m) - b) / 2) + b) * 2^m = ((val.i - 2^m) / 2) + ((b + 1) / 2) * 2^m) * * donde * * b = sesgo del exponente * m = número de bits de mantisa */ val . i -= 1 << 23 ; /* Restar 2^m. */ val . i >>= 1 ; /* Dividir por 2. */ val . i += 1 << 29 ; /* Suma ((b + 1) / 2) * 2^m. */ retorna val . f ; /* Interpretar nuevamente como float */ }
Las tres operaciones matemáticas que forman el núcleo de la función anterior se pueden expresar en una sola línea. Se puede agregar un ajuste adicional para reducir el error relativo máximo. Por lo tanto, las tres operaciones, sin incluir la conversión, se pueden reescribir como
val . i = ( 1 << 29 ) + ( val . i >> 1 ) - ( 1 << 22 ) + a ;
donde a es un sesgo para ajustar los errores de aproximación. Por ejemplo, con a = 0 los resultados son precisos para potencias pares de 2 (p. ej. 1,0), pero para otros números los resultados serán ligeramente demasiado grandes (p. ej. 1,5 para 2,0 en lugar de 1,414... con un error del 6%). Con a = −0x4B0D2, el error relativo máximo se minimiza a ±3,5%.
Si la aproximación se va a utilizar para una estimación inicial del método de Newton para la ecuación , entonces se prefiere la forma recíproca que se muestra en la siguiente sección.
A continuación se incluye una variante de la rutina anterior, que se puede utilizar para calcular el recíproco de la raíz cuadrada, es decir, en lugar de, fue escrita por Greg Walsh. La aproximación de desplazamiento de números enteros produjo un error relativo de menos del 4%, y el error se redujo aún más al 0,15% con una iteración del método de Newton en la siguiente línea. [18] En gráficos de computadora es una forma muy eficiente de normalizar un vector.
float invSqrt ( float x ) { float xhalf = 0.5f * x ; union { float x ; int i ; } u ; u . x = x ; u . i = 0x5f375a86 - ( u . i >> 1 ); /* La siguiente línea se puede repetir cualquier cantidad de veces para aumentar la precisión */ u . x = u . x * ( 1.5f - xhalf * u . x * u . x ); return u . x ; }
Algunos hardware VLSI implementan la raíz cuadrada inversa utilizando una estimación polinomial de segundo grado seguida de una iteración de Goldschmidt . [19]
Si S < 0, entonces su raíz cuadrada principal es
Si S = a + bi donde a y b son reales y b ≠ 0, entonces su raíz cuadrada principal es
Esto se puede verificar elevando al cuadrado la raíz. [20] [21] Aquí
es el módulo de S. La raíz cuadrada principal de un número complejo se define como la raíz con la parte real no negativa.