Punto flotante hexadecimal de IBM

El punto flotante hexadecimal (ahora llamado HFP por IBM ) es un formato para codificar números de punto flotante introducido por primera vez en las computadoras IBM System/360 y admitido en máquinas posteriores basadas en esa arquitectura,^[1]^[2]^[3] también. como máquinas que estaban destinadas a ser compatibles con las aplicaciones de System/360.^[4]^[5]

En comparación con el punto flotante IEEE 754 , el formato HFP tiene un significado más largo y un exponente más corto . Todos los formatos HFP tienen 7 bits de exponente con un sesgo de 64. El rango normalizado de números representables es de 16 ⁻⁶⁵ a 16 ⁶³ (aprox. 5,39761 × 10 ⁻⁷⁹ a 7,237005 × 10 ⁷⁵ ).

El número se representa con la siguiente fórmula: (−1) ^signo × 0. significado × 16 ^{exponente−64} .

32 bits de precisión simple

Un número HFP de precisión simple (llamado "corto" por IBM) se almacena en una palabra de 32 bits:

En este formato, el bit inicial no se suprime y el punto de base (hexadecimal) se establece a la izquierda del significado (fracción en la documentación de IBM y las figuras).

Dado que la base es 16, el exponente en esta forma es aproximadamente el doble que el equivalente en IEEE 754; para tener un rango de exponente similar en binario, se necesitarían 9 bits de exponente.

Ejemplo

Considere codificar el valor −118,625 como un valor de punto flotante de precisión simple HFP.

El valor es negativo, por lo que el bit de signo es 1.

El valor 118,625 ₁₀ en binario es 1110110,101 ₂ . Este valor se normaliza moviendo el punto de la base hacia la izquierda cuatro bits (un dígito hexadecimal) a la vez hasta que el dígito más a la izquierda sea cero, lo que produce 0,01110110101 ₂ . Los dígitos restantes del extremo derecho se rellenan con ceros, lo que produce una fracción de 24 bits de .0111 0110 1010 0000 0000 0000 ₂ .

El valor normalizado movió el punto de la base dos dígitos hexadecimales hacia la izquierda, lo que produjo un multiplicador y un exponente de 16 ⁺² . Se agrega un sesgo de +64 al exponente (+2), lo que da +66, que es 100 0010 ₂ .

La combinación del signo, el exponente más el sesgo y la fracción normalizada produce esta codificación:

En otras palabras, el número representado es −0.76A000 ₁₆ × 16 ^{66 − 64} = −0.4633789… × 16 ⁺² = −118.625

Mayor número representable

El número representado es +0.FFFFFF ₁₆ × 16 ^{127 − 64} = (1 − 16 ⁻⁶ ) × 16 ⁶³ ≈ +7.2370051 × 10 ⁷⁵

Número normalizado positivo más pequeño

El número representado es +0,1 ₁₆ × 16 ^{0 − 64} = 16 ⁻¹ × 16 ⁻⁶⁴ ≈ +5,397605 × 10 ⁻⁷⁹ .

Cero

Cero (0,0) se representa en forma normalizada como todos los bits cero, que aritméticamente es el valor +0,0 ₁₆ × 16 ^{0 − 64} = +0 × 16 ⁻⁶⁴ ≈ +0,000000 × 10 ⁻⁷⁹ = 0. Dada una fracción de todos- bits cero, cualquier combinación de bit de signo positivo o negativo y un exponente sesgado distinto de cero producirá un valor aritméticamente igual a cero. Sin embargo, la forma normalizada generada para cero por el hardware de la CPU es cero en todos los bits. Esto es válido para los tres formatos de precisión de punto flotante. La suma o resta con otros valores de exponentes puede perder precisión en el resultado.

Problemas de precisión

Dado que la base es 16, puede haber hasta tres bits cero a la izquierda en el significado binario. Eso significa que cuando el número se convierte a binario, puede haber tan solo 21 bits de precisión. Debido al efecto de "precisión tambaleante", esto puede provocar que algunos cálculos sean muy inexactos. Esto ha provocado considerables críticas. ^[6]

Un buen ejemplo de inexactitud es la representación del valor decimal 0,1. No tiene representación binaria o hexadecimal exacta. En formato hexadecimal, se representa como 0.19999999... ₁₆ o 0.0001 1001 1001 1001 1001 1001 1001... ₂ , es decir:

Este tiene sólo 21 bits, mientras que la versión binaria tiene 24 bits de precisión.

Seis dígitos hexadecimales de precisión equivalen aproximadamente a seis dígitos decimales (es decir, (6 − 1) log ₁₀ (16) ≈ 6,02). Una conversión de un valor flotante hexadecimal de precisión simple a una cadena decimal requeriría al menos 9 dígitos significativos (es decir, 6 log ₁₀ (16) + 1 ≈ 8,22) para volver a convertir al mismo valor flotante hexadecimal.

Doble precisión de 64 bits

El formato HFP de doble precisión (llamado "largo" por IBM) es el mismo que el formato "corto", excepto que el campo de fracción es más ancho y el número de doble precisión se almacena en una palabra doble (8 bytes):

El exponente de este formato cubre sólo aproximadamente una cuarta parte del rango del formato binario IEEE correspondiente.

14 dígitos hexadecimales de precisión equivalen aproximadamente a 17 dígitos decimales. Una conversión de un valor flotante hexadecimal de doble precisión a una cadena decimal requeriría al menos 18 dígitos significativos para volver a convertir al mismo valor flotante hexadecimal.

Precisión extendida de 128 bits

Llamado de precisión extendida por IBM, se agregó un formato HFP de precisión cuádruple a la serie System/370 y estaba disponible en algunos modelos S/360 (S/360-85, -195 y otros por pedido especial o simulados por software del sistema operativo). ). El campo de fracción de precisión extendida es más amplio y el número de precisión extendida se almacena como dos palabras dobles (16 bytes):

28 dígitos hexadecimales de precisión equivalen aproximadamente a 32 dígitos decimales. Una conversión de HFP de precisión extendida a una cadena decimal requeriría al menos 35 dígitos significativos para volver a convertir al mismo valor de HFP. El exponente almacenado en la parte de orden inferior es 14 menor que el de la parte de orden superior, a menos que sea menor que cero.

Operaciones aritmeticas

Las operaciones aritméticas disponibles son sumar y restar, tanto normalizadas como no normalizadas, y comparar. La prenormalización se realiza en función de la diferencia de exponentes. Multiplica y divide valores no normalizados prenormalizados y trunca el resultado después de un dígito de guardia. Existe una operación de reducción a la mitad para simplificar la división por dos. A partir del ESA/390, existe una operación de raíz cuadrada. Todas las operaciones tienen un dígito de guardia hexadecimal para evitar pérdida de precisión. La mayoría de las operaciones aritméticas se truncan como simples calculadoras de bolsillo. Por lo tanto, 1 − 16 ⁻⁸ = 1. En este caso, el resultado se redondea desde cero. ^[7]

IEEE 754 en computadoras centrales IBM

A partir del S/390 G5 en 1998, ^[8] los mainframes de IBM también han incluido unidades binarias de punto flotante IEEE que cumplen con el estándar IEEE 754 para aritmética de punto flotante . El punto flotante decimal IEEE se agregó a IBM System z9 GA2 ^[9] en 2007 usando milicode ^[10] y en 2008 al IBM System z10 en hardware. ^[11]

Los mainframes IBM modernos admiten tres raíces de punto flotante con 3 formatos hexadecimales (HFP), 3 formatos binarios (BFP) y 3 formatos decimales (DFP). Hay dos unidades de punto flotante por núcleo; uno que respalda a HFP y BFP, y otro que respalda a DFP; hay un archivo de registro, FPR, que contiene los 3 formatos. A partir del z13 en 2015, los procesadores agregaron una función vectorial que incluye 32 registros vectoriales, cada uno de 128 bits de ancho; un registro vectorial puede contener dos números de punto flotante de 64 bits o cuatro de 32 bits. ^[12] Los 16 registros tradicionales de punto flotante se superponen a los nuevos registros vectoriales, por lo que algunos datos pueden manipularse con instrucciones tradicionales de punto flotante o con las instrucciones vectoriales más nuevas.

Usos especiales

El formato IBM HFP se utiliza en:

Archivos de transporte SAS 5 (.XPT) según lo exige la Administración de Alimentos y Medicamentos (FDA) para presentaciones de estudios de Solicitud de Nuevos Medicamentos (NDA), ^[13]
Archivos de datos GRIB (GRIdded Binary) para intercambiar la salida de los modelos de predicción del tiempo ( formato de punto flotante de precisión simple IEEE en la versión actual),
Archivos en formato GDS II (Graphic Database System II) ( OASIS es el reemplazo), y
Archivos en formato SEG Y (Sociedad de Geofísicos de Exploración Y) (el punto flotante de precisión simple IEEE se agregó al formato en 2002). ^[14]

Como IBM es el único proveedor restante de hardware que utiliza el formato HFP, y como las únicas máquinas IBM que admiten ese formato son sus mainframes, pocos formatos de archivo lo requieren. Una excepción es el formato de archivo de transporte SAS 5, que exige la FDA; en ese formato, "Todos los números de punto flotante en el archivo se almacenan usando la representación de la computadora central IBM. [...] La mayoría de las plataformas usan la representación IEEE para números de punto flotante. [...] Para ayudarlo a leer y/ o escribiendo archivos de transporte, proporcionamos rutinas para convertir de representación IEEE (ya sea big endian o little endian) a representación de transporte y viceversa". ^[13] El código para el formato de IBM también está disponible en LGPLv2.1 . ^[15]

Sistemas que utilizan el formato de punto flotante de IBM

IBM System/360 y sucesores
Espectros RCA 70
Sistema Eléctrico Inglés 4
Minicomputadoras serie GEC 4000
Computadoras Interdata de 16 y 32 bits
SDS serie Sigma
Datos generales de minicomputadoras
Computadoras de la serie ICL 2900
Mainframes y sucesores de las series 7.700 y 7.500 de Siemens

La decisión a favor del punto flotante hexadecimal.

El artículo "Arquitectura del IBM System/360" explica la elección porque "esta elección reduce sustancialmente la frecuencia del cambio previo, el desbordamiento y la pérdida de precisión posterior al cambio en la adición de punto flotante". ^[16] Esto permitió un mayor rendimiento para los modelos grandes System/360 y redujo el costo para los pequeños. Los autores eran conscientes del potencial de pérdida de precisión, pero asumieron que esto no sería significativo para las variables de punto flotante de 64 bits. Desafortunadamente, los diseñadores parecen no haber sido conscientes de la Ley de Benford, lo que significa que una gran proporción de números sufrirán una precisión reducida.

El libro "Computer Architecture" de dos de los arquitectos de System/360 cita el estudio de Sweeney de 1958-65 que demostró que el uso de una base mayor que 2 reducía en gran medida el número de turnos necesarios para la alineación y la normalización, en particular el número de turnos diferentes necesarios. . Usaron una base más grande para hacer que las implementaciones se ejecutaran más rápido, y la elección de la base 16 fue natural dados los bytes de 8 bits. La intención era que los flotantes de 32 bits solo se usaran para cálculos que no propagaran errores de redondeo, y que se usara doble precisión de 64 bits para todos los cálculos científicos y de ingeniería. La implementación inicial de doble precisión carecía de un dígito de guardia para permitir un redondeo adecuado, pero esto se cambió poco después de las primeras entregas a los clientes. ^[17]

Ver también

Referencias

^ Principios de funcionamiento de IBM System/360, publicación de IBM A22-6821-6, séptima edición (13 de enero de 1967), páginas 41-50
^ Principios de funcionamiento de IBM System/370, publicación de IBM GA22-7000-4, quinta edición (1 de septiembre de 1975), páginas 157-170
^ z/Principios de funcionamiento de la arquitectura, publicación de IBM SA22-7832-01, segunda edición (octubre de 2001), capítulo 9 y siguientes.
^ Xerox Data Systems (octubre de 1973). Referencia de computadora Xerox SIGMA 7 Manyal. pag. 48 . Consultado el 13 de noviembre de 2020 .
^ RCA (marzo de 1966). Procesadores Spectra 70: 35 45 55 (PDF) . pag. 184 . Consultado el 13 de noviembre de 2020 .
^ Warren Jr., Henry S. (2013) [2002]. "La distribución de los primeros dígitos". El placer del hacker (2 ed.). Addison Wesley - Pearson Education, Inc. págs. ISBN 978-0-321-84268-8. 0-321-84268-5.
^ Compatibilidad con coma flotante mejorada de ESA/390: descripción general
^ Schwarz, EM; Krygowski, CA (septiembre de 1999). "La unidad de punto flotante S/390 G5". Revista IBM de investigación y desarrollo . 43 (5.6): 707–721. doi :10.1147/rd.435.0707.
^ Duale, AY; Decker, MH; Zipperer, H.-G.; Aharoni, M.; Bohizic, TJ (enero de 2007). "Coma flotante decimal en z9: una perspectiva de implementación y prueba". Revista IBM de investigación y desarrollo . 51 (1.2): 217–227. CiteSeerX 10.1.1.123.9055 . doi :10.1147/rd.511.0217.
^ Heller, LC; Farrell, MS (mayo de 2004). "Millicode en un procesador IBM zSeries". Revista IBM de investigación y desarrollo . 48 (3.4): 425–434. CiteSeerX 10.1.1.641.1164 . doi :10.1147/rd.483.0425.
^ Schwarz, EM; Kapernick, JS; Cowlishaw, MF (enero de 2009). "Soporte de coma flotante decimal en el procesador IBM System z10". Revista IBM de investigación y desarrollo . 53 (1): 4:1–4:10. doi :10.1147/JRD.2009.5388585.
^ z / Principios de funcionamiento de la arquitectura
^ ab "El diseño de registro de un conjunto de datos en formato SAS Transport (XPORT)" (PDF) . Consultado el 18 de septiembre de 2014 .
^ "Formato de intercambio de datos SEG Y rev 1, versión 1.0" (PDF) . Mayo de 2002.
^ "Paquete 'SASxport'" (PDF) . 10 de marzo de 2020.
^ Amdahl, gen; Blaauw, Gerrit; Brooks, hijo, Federico. "Arquitectura del IBM System/360". Revista IBM de investigación y desarrollo . 1964 : 87 . Consultado el 4 de septiembre de 2023 .
^ Blaauw, Gerrit A.; Brooks, Federico P. (1997). Arquitectura de computadoras (1ª ed.). Reading, Massachusetts: Addison-Weslet. ISBN 0-201-10557-8.

Otras lecturas

Sweeney, DW (1965). "Un análisis de la suma de punto flotante". Revista de sistemas IBM . 4 (1): 31–42. doi :10.1147/sj.41.0031.
Tomayko, J. (verano de 1995). "Problemas de coma flotante del System 360". Anales IEEE de la historia de la informática . 17 (2): 62–63. doi :10.1109/MAHC.1995.10006. ISSN 1058-6180.
Harding, LJ (1966), "Idiosincrasias del Sistema/360 Punto Flotante", Actas de SHARE 27, 8 al 12 de agosto de 1966 , Presentadas en SHARE XXVII, Toronto, Canadá doi:10.5281/zenodo.10566524.
Harding, LJ (1966), "Modifications of System/360 Floating-Point", Actas de SHARE 27, 8 al 12 de agosto de 1966 , presentadas en SHARE XXVII, Toronto, Canadá doi:10.5281/zenodo.10566780.
Harding, LJ (1966), "Modificación propuesta de multiplicación de punto flotante", cambio de ingeniería propuesto para IBM Corporation, doi:10.5281/zenodo.10567044.
Anderson, Stanley F.; Earle, John G.; Goldschmidt, Robert Elliott; Powers, Don M. (enero de 1967). "IBM System/360 Modelo 91: Unidad de ejecución de punto flotante". Revista IBM de investigación y desarrollo . 11 (1): 34–53. doi :10.1147/rd.111.0034.
Padegs, A. (1968). "Aspectos estructurales del System/360 Model 85, III: Extensiones a la arquitectura de punto flotante". Revista de sistemas IBM . 7 (1): 22–29. doi :10.1147/sj.71.0022.
Schwarz, EM; Sigal, L.; McPherson, TJ (julio de 1997). "Unidad CMOS de punto flotante para S/390 Parallel Enterprise Server G4". Revista IBM de investigación y desarrollo . 41 (4,5): 475–488. doi :10.1147/rd.414.0475.