Byte

El byte es una unidad de información digital que normalmente consta de ocho bits . Históricamente, el byte era el número de bits utilizados para codificar un solo carácter de texto en una computadora ^[1]^[2] y por esta razón es la unidad de memoria direccionable más pequeña en muchas arquitecturas de computadoras . Para eliminar la ambigüedad de los bytes de tamaño arbitrario de la definición común de 8 bits , los documentos de protocolo de red como el Protocolo de Internet ( RFC 791) se refieren a un byte de 8 bits como octeto . ^[3] Esos bits en un octeto generalmente se cuentan con numeración del 0 al 7 o del 7 al 0 dependiendo del endianismo del bit .

Históricamente, el tamaño del byte ha dependido del hardware y no existían estándares definitivos que exigieran el tamaño. Se han utilizado tamaños de 1 a 48 bits. ^[4]^[5]^[6]^[7] El código de caracteres de seis bits era una implementación de uso frecuente en los primeros sistemas de codificación, y las computadoras que usaban bytes de seis y nueve bits eran comunes en la década de 1960. Estos sistemas a menudo tenían palabras de memoria de 12, 18, 24, 30, 36, 48 o 60 bits, correspondientes a 2, 3, 4, 5, 6, 8 o 10 bytes de seis bits. En esta era, las agrupaciones de bits en el flujo de instrucciones a menudo se denominaban sílabas^[a] o losa , antes de que el término byte se volviera común.

El estándar moderno de facto de ocho bits, como se documenta en ISO/IEC 2382-1:1993, es una conveniente potencia de dos que permite valores codificados en binario del 0 al 255 para un byte, ya que 2 elevado a 8 es 256. ^[8] La norma internacional IEC 80000-13 codificó este significado común. Muchos tipos de aplicaciones utilizan información representable en ocho o menos bits y los diseñadores de procesadores suelen optimizar para este uso. La popularidad de las principales arquitecturas informáticas comerciales ha contribuido a la aceptación ubicua del byte de 8 bits. ^[9] Las arquitecturas modernas suelen utilizar palabras de 32 o 64 bits, construidas con cuatro u ocho bytes, respectivamente.

El símbolo de unidad del byte fue designado como la letra B mayúscula por la Comisión Electrotécnica Internacional (IEC) y el Instituto de Ingenieros Eléctricos y Electrónicos (IEEE). ^[10] Internacionalmente, la unidad octeto , símbolo o, define explícitamente una secuencia de ocho bits, eliminando la posible ambigüedad del término "byte". ^[11]^[12]

Etimología e historia

El término byte fue acuñado por Werner Buchholz en junio de 1956, ^[4]^[13]^[14]^[b] durante la fase inicial de diseño de IBM Stretch ^[15]^[16]^[1]^[13]^[14]^{[17 ]}^[18] computadora, que tenía direccionamiento al bit e instrucciones de longitud de campo variable (VFL) con un tamaño de byte codificado en la instrucción. ^[13] Es un rechazo deliberado de mordida para evitar una mutación accidental a mordida . ^[1]^[13]^[19]^[c]

Otro origen del byte para grupos de bits más pequeños que el tamaño de palabra de una computadora, y en particular grupos de cuatro bits , lo registra Louis G. Dooley, quien afirmó haber acuñado el término mientras trabajaba con Jules Schwartz y Dick Beeler en un sistema de defensa aérea. llamado SAGE en el Laboratorio Lincoln del MIT en 1956 o 1957, que fue desarrollado conjuntamente por Rand , MIT e IBM. ^[20]^[21] Más tarde, el lenguaje JOVIAL de Schwartz en realidad usó el término, pero el autor recordó vagamente que se derivaba de AN/FSQ-31 . ^[22]^[21]

Las primeras computadoras usaban una variedad de representaciones decimales codificadas en binario (BCD) de cuatro bits y códigos de seis bits para patrones gráficos imprimibles comunes en el Ejército de los EE. UU. ( FIELDATA ) y la Marina . Estas representaciones incluían caracteres alfanuméricos y símbolos gráficos especiales. Estos conjuntos se ampliaron en 1963 a siete bits de codificación, denominados Código Estándar Americano para el Intercambio de Información (ASCII) como Estándar Federal de Procesamiento de Información , que reemplazó los códigos de teleimpresores incompatibles utilizados por diferentes ramas del gobierno y universidades de los EE. UU. durante la década de 1960. . ASCII incluía la distinción de alfabetos en mayúsculas y minúsculas y un conjunto de caracteres de control para facilitar la transmisión del lenguaje escrito, así como las funciones del dispositivo de impresión, como el avance de página y el avance de línea, y el control físico o lógico del flujo de datos durante la transmisión. medios de comunicación. ^[18] A principios de la década de 1960, aunque también estaba activo en la estandarización ASCII, IBM introdujo simultáneamente en su línea de productos System/360 el código de intercambio decimal codificado en binario extendido (EBCDIC) de ocho bits , una expansión de su código binario de seis bits. Representaciones decimales (BCDIC) ^[d] utilizadas en perforaciones de tarjetas anteriores. ^[23] La prominencia del System/360 llevó a la adopción ubicua del tamaño de almacenamiento de ocho bits, ^[18]^[16]^[13] mientras que en detalle los esquemas de codificación EBCDIC y ASCII son diferentes.

A principios de la década de 1960, AT&T introdujo la telefonía digital en líneas troncales de larga distancia . Estos utilizaban la codificación de ley μ de ocho bits . Esta gran inversión prometía reducir los costos de transmisión de datos de ocho bits.

En el Volumen 1 de The Art of Computer Programming (publicado por primera vez en 1968), Donald Knuth usa byte en su hipotética computadora MIX para denotar una unidad que "contiene una cantidad no especificada de información... capaz de contener al menos 64 valores distintos... . como máximo 100 valores distintos. Por lo tanto, en un ordenador binario, un byte debe estar compuesto de seis bits". ^[24] Señala que "Desde 1975 aproximadamente, la palabra byte ha llegado a significar una secuencia de exactamente ocho dígitos binarios... Cuando hablamos de bytes en relación con MIX nos limitaremos al sentido anterior de la palabra, remontándonos a los días en que los bytes aún no estaban estandarizados". ^[24]

El desarrollo de microprocesadores de ocho bits en la década de 1970 popularizó este tamaño de almacenamiento. Los microprocesadores como el Intel 8008 , el predecesor directo del 8080 y el 8086 , utilizados en las primeras computadoras personales, también podían realizar una pequeña cantidad de operaciones en los pares de cuatro bits en un byte, como el decimal-sumar-ajustar ( DAA) instrucción. A una cantidad de cuatro bits se le suele llamar nibble , también nybble , que se representa convenientemente mediante un único dígito hexadecimal .

El término octeto se utiliza para especificar sin ambigüedades un tamaño de ocho bits. ^[18]^[12] Se utiliza ampliamente en las definiciones de protocolos .

Históricamente, el término octada u octada también se utilizó para indicar ocho bits, al menos en Europa occidental; ^[25]^[26] sin embargo, este uso ya no es común. El origen exacto del término no está claro, pero se puede encontrar en fuentes británicas, holandesas y alemanas de las décadas de 1960 y 1970, y en toda la documentación de las computadoras centrales de Philips .

Símbolo de unidad

El símbolo de unidad para el byte se especifica en IEC 80000-13 , IEEE 1541 y el formato de intercambio métrico ^[10] como el carácter B en mayúscula.

En el Sistema Internacional de Cantidades (ISQ), B es también el símbolo del bel , una unidad de relación de potencia logarítmica que lleva el nombre de Alexander Graham Bell , lo que crea un conflicto con la especificación IEC. Sin embargo, existe poco peligro de confusión, porque el bel es una unidad que rara vez se utiliza. Se utiliza principalmente en su fracción decádica, el decibelio (dB), para medir la intensidad de la señal y el nivel de presión sonora , mientras que una unidad para una décima parte de un byte, el decibyte, y otras fracciones, sólo se utilizan en unidades derivadas, como como tasas de transmisión.

La letra minúscula o para octeto se define como símbolo de octeto en IEC 80000-13 y se usa comúnmente en idiomas como el francés ^[27] y el rumano , y también se combina con prefijos métricos para múltiplos, por ejemplo ko y Mo.

Unidades de varios bytes

Existe más de un sistema para definir múltiplos de unidades según el byte. Algunos sistemas se basan en potencias de 10 , siguiendo el Sistema Internacional de Unidades (SI), que define por ejemplo el prefijo kilo como 1000 (10 ³ ); otros sistemas se basan en potencias de 2 . La nomenclatura de estos sistemas es confusa. Los sistemas basados en potencias de 10 utilizan prefijos estándar del SI ( kilo , mega , giga ,...) y sus correspondientes símbolos (k, M, G,...). Los sistemas basados en potencias de 2, sin embargo, pueden utilizar prefijos binarios ( kibi , mebi , gibi , ...) y sus símbolos correspondientes (Ki, Mi, Gi, ...) o pueden utilizar los prefijos K, M y G, creando ambigüedad cuando se utilizan los prefijos M o G.

Si bien la diferencia entre las interpretaciones decimal y binaria es relativamente pequeña para el kilobyte (aproximadamente un 2% más pequeño que el kibibyte), los sistemas se desvían cada vez más a medida que las unidades crecen (la desviación relativa crece un 2,4% por cada tres órdenes de magnitud). Por ejemplo, un terabyte basado en una potencia de 10 es aproximadamente un 9 % más pequeño que un tebibyte basado en una potencia de 2.

Unidades basadas en potencias de 10

La Comisión Electrotécnica Internacional (IEC) recomienda la definición de prefijos utilizando potencias de 10, en la que 1 kilobyte (símbolo kB) se define como igual a 1.000 bytes. ^[28] El estándar IEC define ocho de estos múltiplos, hasta 1 yottabyte (YB), equivalente a 1000 ⁸ bytes. ^[29] Los prefijos adicionales ronna- para 1000 ⁹ y quetta- para 1000 ¹⁰ fueron adoptados por la Oficina Internacional de Pesas y Medidas (BIPM) en 2022. ^[30]^[31]

Esta definición se usa más comúnmente para unidades de velocidad de datos en redes de computadoras , bus interno, disco duro y velocidades de transferencia de medios flash, y para las capacidades de la mayoría de los medios de almacenamiento , particularmente discos duros , ^{[32] almacenamiento basado en} flash , ^[33] y DVD ^{[ cita requerida ]} . Los sistemas operativos que utilizan esta definición incluyen macOS , ^[34] iOS , ^[34] Ubuntu , ^[35] y Debian . ^[36] También es consistente con otros usos de los prefijos SI en informática, como velocidades de reloj de CPU o medidas de rendimiento .

Unidades basadas en potencias de 2

Un sistema de unidades basado en potencias de 2 en el que 1 kibibyte (KiB) es igual a 1.024 (es decir, 2 ¹⁰ ) bytes está definido por la norma internacional IEC 80000-13 y está respaldado por organismos de normalización nacionales e internacionales ( BIPM , IEC , NIST ). El estándar IEC define ocho de estos múltiplos, hasta 1 yobibyte (YiB), equivalente a 1024 ⁸ bytes. Las contrapartes binarias naturales de ronna- y quetta- se dieron en un documento de consulta del Comité Consultivo de Unidades (CCU) del Comité Internacional de Pesas y Medidas como robi- (Ri, 1024 ⁹ ) y quebi- (Qi, 1024 ¹⁰ ). , pero aún no han sido adoptados por IEC e ISO. ^[37]

Un sistema alternativo de nomenclatura para las mismas unidades (denominado aquí convención habitual ), en el que 1 kilobyte (KB) equivale a 1.024 bytes, ^[38]^[39]^[40] 1 megabyte (MB) equivale a 1.024 ² bytes y 1 gigabyte (GB) equivalen a 1024. ³ bytes lo menciona un estándar JEDEC de la década de 1990 . El estándar JEDEC solo menciona los primeros tres múltiplos (hasta GB), que no menciona TB y mayores. Aunque confusa e incorrecta ^[41] La convención habitual es utilizada por el sistema operativo Microsoft Windows ^[42]^{[ se necesita mejor fuente ]} y la capacidad de la memoria de acceso aleatorio , como la memoria principal y el tamaño de la caché de la CPU , y en marketing y facturación por parte de las empresas de telecomunicaciones , como Vodafone , ^[43] AT&T , ^[44] Orange ^[45] y Telstra . ^[46]

Para la capacidad de almacenamiento , macOS e iOS utilizaron la convención habitual a través de Mac OS X 10.6 Snow Leopard e iOS 10, después de lo cual cambiaron a unidades basadas en potencias de 10. ^[34]

Unidades parroquiales

Varios proveedores de computadoras han acuñado términos para datos de varios tamaños, a veces con tamaños diferentes para el mismo término incluso dentro de un solo proveedor. Estos términos incluyen palabra doble , media palabra , palabra larga , palabra cuádruple , losa , superpalabra y sílaba . También hay términos informales. por ejemplo, medio byte y nybble para 4 bits, octal K para 1000 ₈ .

Historia de las definiciones contradictorias

La diferencia porcentual entre las interpretaciones decimal y binaria de los prefijos de unidad crece a medida que aumenta el tamaño de almacenamiento

^{La memoria de computadora [e]} contemporánea tiene una arquitectura binaria , lo que hace que una definición de unidades de memoria basada en potencias de 2 sea lo más práctico. El uso del prefijo métrico kilo para múltiplos binarios surgió por conveniencia, porque 1.024 es aproximadamente 1.000. ^[27] Esta definición fue popular en las primeras décadas de la informática personal , con productos como el formato de disquete DD Tandon de 5 1⁄4 pulgadas (con capacidad para 368.640 bytes) que se anunciaba como "360 KB", siguiendo la convención de 1.024 bytes. Sin embargo, no fue universal. El disquete Shugart SA-400 de 5 1 ⁄ 4 pulgadas contenía 109.375 bytes sin formato, ^[47] y se anunciaba como "110 Kbyte", utilizando la convención 1000. ^{[48] Asimismo, el disquete}DEC RX01 de 8 pulgadas (1975) tenía 256.256 bytes formateados y se anunciaba como "256k". ^[49] Otros discos se anunciaron utilizando una combinación de las dos definiciones: en particular, 3+Los discos HD de 1 ⁄ 2 pulgadas anunciados como "1,44 MB" en realidad tienen una capacidad de 1.440 KiB, el equivalente a 1,47 MB o 1,41 MiB.

En 1995, el Comité Interdivisional de Nomenclatura y Símbolos de la Unión Internacional de Química Pura y Aplicada (IUPAC) intentó resolver esta ambigüedad proponiendo un conjunto de prefijos binarios para las potencias de 1024, incluidos kibi (kilobinario), mebi (megabinario) y gibi (gigabinario). ^[50]^[51]

En diciembre de 1998, la IEC abordó estos múltiples usos y definiciones adoptando los prefijos propuestos por la IUPAC (kibi, mebi, gibi, etc.) para denotar sin ambigüedades potencias de 1024. ^[52] Así, un kibibyte (1 KiB) es 1024 ¹ bytes = 1024 bytes, un mebibyte (1 MiB) son 1024 ² bytes =1.048.576 bytes, y así sucesivamente.

En 1999, Donald Knuth sugirió llamar al kibibyte "kilobyte grande" ( KKB ). ^[53]

Definiciones estándar modernas

La IEC adoptó la propuesta de la IUPAC y publicó la norma en enero de 1999. ^[54]^[55] Los prefijos IEC son parte del Sistema Internacional de Cantidades . La IEC especificó además que el kilobyte solo debe usarse para referirse a 1.000 bytes.

Demandas por definición

Las demandas derivadas de una supuesta confusión de los consumidores sobre las definiciones binaria y decimal de múltiplos del byte generalmente han terminado a favor de los fabricantes, y los tribunales han sostenido que la definición legal de gigabyte o GB es 1 GB = 1.000.000.000 (10 ⁹ ) bytes (el decimal definición), en lugar de la definición binaria (2 ³⁰ , es decir, 1.073.741.824). En concreto, el Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California sostuvo que "el Congreso de los Estados Unidos ha considerado que la definición decimal de gigabyte es la 'preferida' para los fines del 'comercio y el comercio de los Estados Unidos' [...] La legislatura también ha adoptado el sistema decimal para todas las 'transacciones en este estado' ". [ 56 ^]

Los juicios anteriores habían terminado en un acuerdo sin que los tribunales se pronunciaran sobre la cuestión, como por ejemplo una demanda contra el fabricante de unidades Western Digital . ^[57]^[58] Western Digital resolvió el desafío y agregó exenciones de responsabilidad explícitas a los productos de que la capacidad utilizable puede diferir de la capacidad anunciada. ^[57] Seagate fue demandada por motivos similares y también llegó a un acuerdo. ^[57]^[59]

Ejemplos prácticos

Usos comunes

Muchos lenguajes de programación definen el tipo de datos byte .

Los lenguajes de programación C y C++ definen byte como una "unidad direccionable de almacenamiento de datos lo suficientemente grande como para contener cualquier miembro del conjunto de caracteres básico del entorno de ejecución" (cláusula 3.6 del estándar C). El estándar C requiere que el tipo de datos integral unsigned char contenga al menos 256 valores diferentes y esté representado por al menos ocho bits (cláusula 5.2.4.2.1). Varias implementaciones de C y C++ reservan 8, 9, 16, 32 o 36 bits para el almacenamiento de un byte. ^[66]^[67]^[g] Además, los estándares C y C++ requieren que no haya espacios entre dos bytes. Esto significa que cada bit de la memoria es parte de un byte. ^[68]

El tipo de datos primitivo de Java, byte, se define como ocho bits. Es un tipo de datos con signo que contiene valores de −128 a 127.

Los lenguajes de programación .NET , como C# , definen byte como un tipo sin signo y sbyte como un tipo de datos con signo, con valores de 0 a 255 y −128 a 127 , respectivamente.

En los sistemas de transmisión de datos, el byte se utiliza como una secuencia contigua de bits en un flujo de datos en serie, que representa la unidad de datos más pequeña distinguida. Para la comunicación asíncrona, una unidad de transmisión completa generalmente incluye además un bit de inicio, 1 o 2 bits de parada y posiblemente un bit de paridad y, por lo tanto, su tamaño puede variar de siete a doce bits para cinco a ocho bits de datos reales. ^[69] Para la comunicación síncrona, la verificación de errores generalmente utiliza bytes al final de una trama .

Ver también

Notas

^ El término sílaba se utilizó para bytes que contenían instrucciones o constituyentes de instrucciones, no para bytes de datos.
^ Muchas fuentes indican erróneamente que el término byte nació en julio de 1956, pero Werner Buchholz afirmó que el término habría sido acuñado en junio de 1956. De hecho, el documento más antiguo que respalda esto data del 11 de junio de 1956. Buchholz afirmó que la transición a los bytes de 8 bits se concibió en agosto de 1956, pero el documento más antiguo encontrado que utiliza esta noción data de septiembre de 1956.
^ Algunas máquinas posteriores, por ejemplo, Burroughs B1700 , CDC 3600 , DEC PDP-6, DEC PDP-10, tenían la capacidad de operar con bytes arbitrarios no mayores que el tamaño de la palabra.
^ Había más de una página de códigos BCD.
^ Durante la década de 1970 hubo máquinas con arquitecturas decimales .
^ El vídeo está codificado a una velocidad de bits de 27,8 Mbit/s, con un tiempo de ejecución de 1.403 min ^[70] (84.180 segundos), lo que da como resultado un tamaño aproximado de 0,2925 TB (0,2661 TiB).
^ El número real de bits en una implementación particular se documenta tal CHAR_BITcomo se implementa en el archivo limites.h .

Referencias

^ a B C Blaauw, Gerrit Anne ; Brooks, Jr., Federico Phillips ; Buchholz, Werner (1962), "Capítulo 4: Unidades de datos naturales" (PDF) , en Buchholz, Werner (ed.), Planificación de un sistema informático: extensión del proyecto , McGraw-Hill Book Company, Inc. / The Maple Press Company, York, PA., págs. 39–40, LCCN 61-10466, archivado desde el original (PDF) el 3 de abril de 2017 , consultado el 3 de abril de 2017
    Los términos utilizados aquí para describir la estructura impuesta por el diseño de la máquina, además de la broca , se enumeran a continuación.
    Byte denota un grupo de bits utilizados para codificar un carácter, o el número de bits transmitidos en paralelo hacia y desde unidades de entrada y salida. Aquí se utiliza un término distinto de carácter porque un carácter determinado puede representarse en diferentes aplicaciones mediante más de un código, y diferentes códigos pueden utilizar diferentes números de bits (es decir, diferentes tamaños de bytes). En la transmisión de entrada-salida, la agrupación de bits puede ser completamente arbitraria y no tener relación con los caracteres reales. (El término se acuñó a partir de bit , pero se repelió para evitar una mutación accidental a bit ).
    Una palabra consta del número de bits de datos transmitidos en paralelo desde o hacia la memoria en un ciclo de memoria. El tamaño de las palabras se define así como una propiedad estructural de la memoria. (El término catena fue acuñado para este propósito por los diseñadores de la computadora Bull GAMMA 60 [fr] ).
    Bloque se refiere al número de palabras transmitidas hacia o desde una unidad de entrada-salida en respuesta a una única instrucción de entrada-salida. El tamaño del bloque es una propiedad estructural de una unidad de entrada-salida; Es posible que haya sido arreglado por el diseño o dejado que el programa lo modifique.
^ Bemer, Robert William (1959), "Una propuesta para un código de tarjeta generalizado de 256 caracteres", Comunicaciones de la ACM , 2 (9): 19–23, doi : 10.1145/368424.368435 , S2CID 36115735
^ Postel, J. (septiembre de 1981). Protocolo de Internet ESPECIFICACIÓN DEL PROTOCOLO DEL PROGRAMA DE INTERNET DARPA. pag. 43.doi : 10.17487 /RFC0791 . RFC 791 . Consultado el 28 de agosto de 2020 . octeto Un byte de ocho bits.
^ ab Buchholz, Werner (11 de junio de 1956). "7. La matriz de cambios" (PDF) . El sistema de enlace . IBM . págs. 5–6. Memorándum extensible n.º 39G. Archivado desde el original (PDF) el 4 de abril de 2017 . Consultado el 4 de abril de 2016 .
    […] Lo más importante, desde el punto de vista de la edición, será la capacidad de manejar cualquier carácter o dígito, de 1 a 6 bits de longitud.
    La Figura 2 muestra la Matriz de desplazamiento que se utilizará para convertir una palabra de 60 bits , procedente de la Memoria en paralelo, en caracteres , o 'bytes' como los hemos llamado, para enviarlos al sumador en serie. Los 60 bits se vierten en núcleos magnéticos en seis niveles diferentes. Así, si sale un 1 de la posición 9, aparecerá en los seis núcleos inferiores. Al pulsar cualquier línea diagonal se enviarán los seis bits almacenados a lo largo de esa línea al sumador. El sumador puede aceptar todos o sólo algunos de los bits.
    Supongamos que se desea operar con dígitos decimales de 4 bits , comenzando por la derecha. Primero se pulsa la diagonal 0, enviando los seis bits del 0 al 5, de los cuales el sumador acepta sólo los primeros cuatro (0-3). Los bits 4 y 5 se ignoran. A continuación, se pulsa la diagonal 4. Esto envía los bits 4 a 9, de los cuales los dos últimos se ignoran nuevamente, y así sucesivamente.
    Es igual de fácil utilizar los seis bits en trabajos alfanuméricos , o manejar bytes de un solo bit para análisis lógico, o compensar los bytes en cualquier número de bits. Todo esto se puede hacer tirando de las diagonales de desplazamiento adecuadas. Se utiliza una disposición de matriz análoga para cambiar del funcionamiento en serie al paralelo en la salida del sumador. […]
^ Sistema informático 3600 - Manual de referencia (PDF) . K. St. Paul, Minnesota, EE. UU.: Control Data Corporation (CDC). 1966-10-11 [1965]. 60021300. Archivado desde el original (PDF) el 5 de abril de 2017 . Consultado el 5 de abril de 2017 . Byte: una partición de una palabra de computadora.
NÓTESE BIEN. Analiza bytes de 12, 24 y 48 bits.
^ Rao, Thammavaram RN; Fujiwara, Eiji (1989). McCluskey, Edward J. (ed.). Codificación de control de errores para sistemas informáticos. Serie Prentice Hall en Ingeniería Informática (1 ed.). Englewood Cliffs, Nueva Jersey, EE. UU.: Prentice Hall . ISBN 0-13-283953-9. LCCN 88-17892.
NÓTESE BIEN. Ejemplo del uso de un código para "bytes de 4 bits".
^ Tafel, Hans Jörg (1971). Einführung in die digitale Datenverarbeitung [ Introducción al procesamiento de información digital ] (en alemán). Múnich: Carl Hanser Verlag . pag. 300.ISBN _ 3-446-10569-7. Byte = zusammengehörige Folge von ia neun Bits; davon sind acht Datenbits, das neunte ein Prüfbit
NÓTESE BIEN. Define un byte como un grupo de normalmente 9 bits; 8 bits de datos más 1 bit de paridad.
^ ISO/IEC 2382-1: 1993, Tecnología de la información - Vocabulario - Parte 1: Términos fundamentales . 1993.
    byte:
    cadena que consta de varios bits, tratados como una unidad y que normalmente representa un carácter o una parte de un carácter.
    NOTAS:
    1 El número de bits de un byte es fijo para un sistema de procesamiento de datos determinado.
    2 El número de bits de un byte suele ser 8.
^ "Historia de Internet de la década de 1960 # 1964". Museo de Historia de la Computación . 2017 [2015]. Archivado desde el original el 24 de junio de 2022 . Consultado el 17 de agosto de 2022 .
^ ab Jaffer, Aubrey (2011) [2008]. "Formato-de-intercambio-métrico". Archivado desde el original el 3 de abril de 2017 . Consultado el 3 de abril de 2017 .
^ Kozierok, Charles M. (20 de septiembre de 2005) [2001]. "La guía TCP/IP - Información y representación binaria: bits, bytes, nibbles, octetos y caracteres - byte frente a octeto". 3.0. Archivado desde el original el 3 de abril de 2017 . Consultado el 3 de abril de 2017 .
^ ab ISO 2382-4, Organización de datos (2 ed.). byte, octeto, byte de 8 bits: una cadena que consta de ocho bits.
^ abcde Buchholz, Werner (febrero de 1977). "La palabra" Byte "alcanza la mayoría de edad ..." Revista Byte . 2 (2): 144.
    Recibimos lo siguiente de W Buchholz, una de las personas que trabajaba en el Proyecto Stretch de IBM a mediados de los años cincuenta. Su carta cuenta la historia.

    Como no soy un lector habitual de su revista, escuché la pregunta en el número de noviembre de 1976 sobre el origen del término "byte" de un colega que sabía que yo había perpetrado esta jerga [ver página 77 de BYTE de noviembre de 1976, "Inglés antiguo"] . Busqué en mis archivos y no pude encontrar un certificado de nacimiento. Pero estoy seguro de que "byte" alcanzará la mayoría de edad en 1977, cuando cumplirá 21 años.
    Muchos han asumido que el byte, es decir, 8 bits, se originó con el IBM System/360, que difundió dichos bytes por todas partes a mediados de la década de 1960. El editor tiene razón al señalar que el término se remonta a la anterior computadora Stretch (pero se equivoca en que Stretch fue la primera, no la última, de las computadoras transistorizadas de segunda generación de IBM que se desarrolló).
    La primera referencia encontrada en los archivos estaba contenida en un memorando interno escrito en junio de 1956 durante los primeros días del desarrollo de Stretch . Se describió que un byte constaba de cualquier número de bits paralelos del uno al seis. Por tanto, se suponía que un byte tenía una longitud adecuada para la ocasión. Su primer uso se produjo en el contexto de los equipos de entrada y salida de la década de 1950, que manejaban seis bits a la vez. La posibilidad de pasar a bytes de 8 bits se consideró en agosto de 1956 y poco después se incorporó al diseño de Stretch.
    La primera referencia publicada al término se produjo en 1959 en un artículo 'Processing Data in Bits and Pieces' de GA Blaauw , FP Brooks Jr y W Buchholz en IRE Transactions on Electronic Computers , junio de 1959, página 121. Las nociones de ese artículo fueron elaborados en el Capítulo 4 de Planificación de un sistema informático (Project Stretch), editado por W Buchholz, McGraw-Hill Book Company (1962). El motivo para acuñar el término se explicó allí en la página 40 de la siguiente manera:
Byte denota un grupo de bits utilizados para codificar un carácter, o el número de bits transmitidos en paralelo hacia y desde unidades de entrada y salida. Aquí se utiliza un término distinto de carácter porque un carácter determinado puede representarse en diferentes aplicaciones mediante más de un código, y diferentes códigos pueden utilizar diferentes números de bits (es decir, diferentes tamaños de bytes). En la transmisión de entrada-salida, la agrupación de bits puede ser completamente arbitraria y no tener relación con los caracteres reales. (El término se acuñó a partir de morder , pero se repelió para evitar una mutación accidental a morder ) .
    System/360 adoptó muchos de los conceptos de Stretch, incluidos los tamaños básicos de bytes y palabras, que son potencias de 2. Sin embargo, por motivos de economía, el tamaño de bytes se fijó en el máximo de 8 bits y el direccionamiento a nivel de bits se reemplazó por direccionamiento de bytes.
    Desde entonces, el término byte significa generalmente 8 bits y, por tanto, ha pasado al vocabulario general.
    ¿Existen otros términos acuñados especialmente para el campo de la informática que hayan aparecido en los diccionarios generales del idioma inglés?
^ ab "Cronología de la era IBM Stretch/Harvest (1956-1961)". Museo de Historia de la Computación . Junio de 1956. Archivado desde el original el 29 de abril de 2016 . Consultado el 3 de abril de 2017 .
    Verano de 1956: Gerrit Blaauw , Fred Brooks , Werner Buchholz , John Cocke y Jim Pomerene se unen al equipo de Stretch . Lloyd Hunter proporciona liderazgo en transistores .
    Julio de 1956 [ sic ]: Werner Buchholz enumera en un informe las ventajas de una longitud de palabra de 64 bits para Stretch. También admite el requisito de la NSA de bytes de 8 bits. El término "Byte" de Werner se popularizó por primera vez en este memorando.
    NÓTESE BIEN. Esta línea de tiempo especifica erróneamente la fecha de nacimiento del término "byte" como julio de 1956 , mientras que Buchholz en realidad utilizó el término ya en junio de 1956 .
^ Buchholz, Werner (31 de julio de 1956). «5. Entrada-Salida» (PDF) . Longitud de la palabra de memoria . IBM . pag. 2. Stretch Memo No. 40. Archivado desde el original (PDF) el 2017-04-04 . Consultado el 4 de abril de 2016 .
[…] 60 es un múltiplo de 1, 2, 3, 4, 5 y 6. Por lo tanto, los bytes de longitud de 1 a 6 bits se pueden empaquetar de manera eficiente en una palabra de 60 bits sin tener que dividir un byte entre una palabra y el siguiente. Si se necesitaran bytes más largos, 60 bits, por supuesto, ya no serían ideales. En las aplicaciones actuales, los casos realmente importantes son 1, 4 y 6 bits.
Con palabras de 64 bits, a menudo sería necesario hacer algunos compromisos, como dejar 4 bits sin usar en una palabra cuando se trata de bytes de 6 bits en la entrada y salida. Sin embargo, la computadora LINK puede equiparse para eliminar estos espacios y permitir el manejo de bytes divididos entre palabras. […]
^ ab Buchholz, Werner (19 de septiembre de 1956). "2. Tamaño de bytes de entrada-salida" (PDF) . Longitud e indexación de palabras de memoria . IBM . pag. 1. Stretch Memo No. 45. Archivado desde el original (PDF) el 2017-04-04 . Consultado el 4 de abril de 2016 .
[…] El tamaño máximo de bytes de entrada y salida para el funcionamiento en serie ahora será de 8 bits, sin contar los bits de detección y corrección de errores. Por lo tanto, el Exchange funcionará con bytes de 8 bits, y cualquier unidad de entrada-salida con menos de 8 bits por byte dejará los bits restantes en blanco. Las lagunas resultantes se pueden eliminar más tarde mediante programación […]
^ Raymond, Eric Steven (2017) [2003]. "definición de bytes". Archivado desde el original el 3 de abril de 2017 . Consultado el 3 de abril de 2017 .
^ abcd Bemer, Robert William (8 de agosto de 2000). "¿Por qué un byte tiene 8 bits? ¿O no?". Viñetas de la historia de la informática . Archivado desde el original el 3 de abril de 2017 . Consultado el 3 de abril de 2017 .
Llegué a trabajar para IBM y vi toda la confusión causada por la limitación de 64 caracteres. Especialmente cuando empezamos a pensar en el procesamiento de textos, que requeriría tanto mayúsculas como minúsculas.
    Agregue 26 letras minúsculas a las 47 existentes y obtendrá 73: 9 más de lo que 6 bits podrían representar.
    Incluso hice una propuesta (en vista de STRETCH , la primera computadora que conozco con un byte de 8 bits) que ampliaría el número de códigos de caracteres de tarjetas perforadas a 256 [1].
    Algunas personas se lo tomaron en serio. Lo pensé como una parodia.
    Entonces algunas personas empezaron a pensar en caracteres de 7 bits, pero esto era ridículo. Con la computadora STRETCH de IBM como fondo, manejando palabras de 64 caracteres divisibles en grupos de 8 (diseñé el conjunto de caracteres, bajo la guía del Dr. Werner Buchholz , el hombre que SÍ acuñó el término "byte" para un sistema de 8 bits). agrupamiento). [2] Parecía razonable crear un conjunto de caracteres universal de 8 bits, que pudiera manejar hasta 256. En aquellos días mi mantra era "los poderes de 2 son mágicos". Y así el grupo que yo encabezaba desarrolló y justificó tal propuesta [3].
    Eso fue demasiado progreso cuando se presentó al grupo de estándares que iba a formalizar ASCII, por lo que se detuvieron por el momento con un conjunto de 7 bits, o bien un conjunto de 8 bits y la mitad superior quedó para trabajo futuro.
    El IBM 360 utilizaba caracteres de 8 bits, aunque no ASCII directamente. Así, el "byte" de Buchholz se hizo popular en todas partes. A mí mismo no me gustó el nombre por muchas razones. El diseño tenía 8 bits moviéndose en paralelo. Pero luego apareció una nueva pieza de IBM, con 9 bits para autoverificación, tanto dentro de la CPU como en las unidades de cinta . Expuse este byte de 9 bits a la prensa en 1973. Pero mucho antes de eso, cuando dirigía las operaciones de software para Cie. Bull en Francia en 1965-66, insistí en que 'byte' quedara obsoleto en favor de " octeto ".
    Puedes notar que mi preferencia entonces es ahora el término preferido.
    Se justifica por los nuevos métodos de comunicación que pueden transportar 16, 32, 64 e incluso 128 bits en paralelo. Pero algunos tontos ahora se refieren a un "byte de 16 bits" debido a esta transferencia paralela, que es visible en el conjunto UNICODE . No estoy seguro, pero tal vez debería llamarse " hexteto ".
    Pero notarás que sigo teniendo razón. ¡Las potencias de 2 siguen siendo mágicas!
^ Blaauw, Gerrit Anne ; Brooks, Jr., Federico Phillips ; Buchholz, Werner (junio de 1959). "Procesamiento de datos en bits y piezas". Transacciones IRE en Computadoras Electrónicas : 121.
^ Dooley, Louis G. (febrero de 1995). "Byte: la palabra". BYTE . Ocala, Florida, Estados Unidos. Archivado desde el original el 20 de diciembre de 1996.
La palabra byte fue acuñada alrededor de 1956 a 1957 en los Laboratorios Lincoln del MIT dentro de un proyecto llamado SAGE (Sistema de Defensa Aérea de América del Norte), que fue desarrollado conjuntamente por Rand , Lincoln Labs e IBM . En esa época, la estructura de la memoria de la computadora ya estaba definida en términos de tamaño de palabra . Una palabra constaba de x número de bits ; un bit representaba una posición de notación binaria en una palabra. Las operaciones normalmente se realizaban en todos los bits de la palabra completa.
Acuñamos la palabra byte para referirnos a un conjunto lógico de bits menores que el tamaño de una palabra completa. En ese momento, no se definía específicamente como x bits, sino que normalmente se lo denominaba un conjunto de 4 bits , ya que ese era el tamaño de la mayoría de nuestros elementos de datos codificados. Poco después pasé a otras responsabilidades que me sacaron de SAGE. Después de haber pasado muchos años en Asia, regresé a los Estados Unidos y me sorprendió descubrir que la palabra byte se estaba utilizando en la nueva tecnología de microcomputadoras para referirse a la unidad básica de memoria direccionable.
^ ab Ram, Stefan (17 de enero de 2003). "Erklärung des Wortes" Byte "im Rahmen der Lehre binärer Codes" (en alemán). Berlín, Alemania: Freie Universität Berlin . Archivado desde el original el 10 de junio de 2021 . Consultado el 10 de abril de 2017 .
^ Origen del término "byte", 1956, archivado desde el original el 10 de abril de 2017 , consultado el 17 de agosto de 2022
    Una sesión de preguntas y respuestas en una conferencia de ACM sobre la historia de los lenguajes de programación incluyó este intercambio:

    [ John Goodenough :
    Mencionaste que el término "byte" se usa en JOVIAL . ¿De dónde viene el término? ]
    [ Jules Schwartz (inventor de JOVIAL):
    Según recuerdo, el AN/FSQ-31 , un ordenador totalmente diferente al 709 , estaba orientado a bytes. No lo recuerdo con seguridad, pero estoy razonablemente seguro de que la descripción de esa computadora incluía la palabra "byte" y la usamos. ]
    [ Fred Brooks :
    ¿Puedo hablar sobre eso? Werner Buchholz acuñó la palabra como parte de la definición de STRETCH , y el AN/FSQ-31 la tomó de STRETCH, pero Werner es definitivamente el autor de esa palabra. ]
    [ Schwartz:
    Así es. Gracias. ]
^ "Lista de códigos EBCDIC de IBM". ibm.com . 2020-01-02. Archivado desde el original el 3 de julio de 2020 . Consultado el 3 de julio de 2020 .
^ ab Knuth, Donald (1997) [1968]. El arte de la programación informática: Volumen 1: Algoritmos fundamentales (3ª ed.). Boston: Addison-Wesley. pag. 125.ISBN _ 9780201896831.
^ Williams, RH (1969). British Commercial Computer Digest: Serie de datos informáticos de Pergamon . Prensa de Pérgamo . ISBN 1483122107. ISBN 978-1483122106 ^{[ se necesita aclaración ]}
^ "Gama de productos de Philips Data Systems" (PDF) . Philips . Abril de 1971. Archivado desde el original (PDF) el 4 de marzo de 2016 . Consultado el 3 de agosto de 2015 .
^ ab
    [
    |*| Acerca de bits y bytes: prefijos para múltiplos binarios - IEC
    |*| v0: https://web.archive.org/web/20090818042050/http://www.iec.ch/online_news/etech/arch_2003/etech_0503/focus.htm
    |*| v1: https://www.iec.ch/prefixes-binary-multiples Archivado el 16 de agosto de 2021 en Wayback Machine ]
^ Prefijos para múltiplos binarios Archivado el 8 de agosto de 2007 en Wayback Machine : la referencia del NIST sobre constantes, unidades e incertidumbre
^ Matsuoka, Satoshi; Sato, Hitoshi; Tatebe, Osamu; Koibuchi, Michihiro; Fujiwara, Ikki; Suzuki, Shuji; Kakuta, Masanori; Ishida, Takashi; Akiyama, Yutaka; Suzumura, Toyotaro; Ueno, Koji (15 de septiembre de 2014). "Extreme Big Data (EBD): tecnologías de infraestructura de Big Data de próxima generación hacia Yottabyte/año". Fronteras e innovaciones de la supercomputación . 1 (2): 89-107. doi : 10.14529/jsfi140206 . ISSN 2313-8734. Archivado desde el original el 13 de marzo de 2022 . Consultado el 27 de mayo de 2022 .
^ "Lista de Resoluciones para la 27ª reunión de la Conferencia General de Pesos y Medidas" (PDF) . 2022-11-18. Archivado (PDF) desde el original el 18 de noviembre de 2022 . Consultado el 18 de noviembre de 2022 .
^ Gibney, Elizabeth (18 de noviembre de 2022). "¿Cuántos yottabytes hay en un quettabyte? Los números extremos reciben nuevos nombres". Naturaleza . doi :10.1038/d41586-022-03747-9. PMID 36400954. S2CID 253671538. Archivado desde el original el 16 de enero de 2023 . Consultado el 21 de noviembre de 2022 .
^ Informe de tendencias y discos de 1977 Unidades de disco rígidas, publicado en junio de 1977
^ Unidad flash USB SanDisk Archivado el 13 de mayo de 2008 en Wayback Machine "Nota: 1 megabyte (MB) = 1 millón de bytes; 1 gigabyte (GB) = mil millones de bytes".
^ abc "Cómo iOS y macOS informan la capacidad de almacenamiento". Soporte de Apple . 27 de febrero de 2018. Archivado desde el original el 9 de abril de 2020 . Consultado el 9 de enero de 2022 .
^ "Política de unidades". Wiki de Ubuntu . Ubuntu. Archivado desde el original el 18 de noviembre de 2021 . Consultado el 9 de enero de 2022 .
^ "Prefijos de unidad consistentes". WikiDebian . Archivado desde el original el 3 de diciembre de 2021 . Consultado el 9 de enero de 2022 .
^ Brown, Richard JC (27 de abril de 2022). "Respuesta a "Ante la escasez de letras latinas para los posibles nuevos símbolos SI: propuesta alternativa para los nuevos prefijos SI"". Acreditación y Garantía de Calidad . 27 (3): 143–144. doi :10.1007/s00769-022-01499-7. S2CID 248397680.
^ Kilobyte: definición y más del diccionario gratuito Merriam-Webster Archivado el 9 de abril de 2010 en Wayback Machine . Merriam-webster.com (13 de agosto de 2010). Recuperado el 7 de enero de 2011.
^ Kilobyte - Definición de Kilobyte en Dictionary.com Archivado el 1 de septiembre de 2010 en Wayback Machine . Diccionario.reference.com (29 de septiembre de 1995). Recuperado el 7 de enero de 2011.
^ Definición de kilobyte de Oxford Dictionaries Online Archivado el 25 de junio de 2006 en Wayback Machine . Askoxford.com. Recuperado el 7 de enero de 2011.
^ Prefijos para múltiplos binarios y decimales: binario versus decimal
^ "Determinación del tamaño real del disco: por qué 1,44 MB debería ser 1,40 MB". Soporte de Microsoft. 2003-05-06. Archivado desde el original el 9 de febrero de 2014 . Consultado el 25 de marzo de 2014 .
^ "Tasas de datos 3G/GPRS". Vodafone Irlanda. Archivado desde el original el 26 de octubre de 2016 . Consultado el 26 de octubre de 2016 .
^ "Escala de medición de datos". AT&T . Consultado el 26 de octubre de 2016 .^{[ enlace muerto permanente ]}
^ "Acceso móvil a Internet". Rumania naranja. Archivado desde el original el 26 de octubre de 2016 . Consultado el 26 de octubre de 2016 .
^ "Nuestras condiciones para el cliente" (PDF) . Telstra. pag. 7. Archivado (PDF) desde el original el 10 de abril de 2017 . Consultado el 26 de octubre de 2016 .
^ "Minidisquete SA400". Swtpc.com. 2013-08-14. Archivado desde el original el 27 de mayo de 2014 . Consultado el 25 de marzo de 2014 .
^ "Unidad de disco Shugart Associates SA 400 minifloppy ™" (PDF) . Archivado desde el original (PDF) el 8 de junio de 2011 . Consultado el 24 de junio de 2011 .
^ "Manual de mantenimiento del sistema de disquete RXS/RX11" (PDF) . Maynard, Massachusetts: Corporación de equipos digitales. Mayo de 1975. Archivado desde el original (PDF) el 23 de abril de 2011 . Consultado el 24 de junio de 2011 .
^ Informe IUCr 1995 - Comité Interdivisional de Nomenclatura y Símbolos (IDCNS) de la IUPAC http://ww1.iucr.org/iucr-top/cexec/rep95/idcns.htm Archivado el 19 de diciembre de 2020 en Wayback Machine.
^ Departamento de Ciencias de la Computación de la Universidad de Auckland "Prefijo binario" https://wiki.cs.auckland.ac.nz/stageonewiki/index.php/Binary_prefix Archivado el 16 de octubre de 2020 en Wayback Machine.
^ Instituto Nacional de Estándares y Tecnología . "Prefijos para múltiplos binarios". Archivado desde el original el 8 de agosto de 2007."En diciembre de 1998, la Comisión Electrotécnica Internacional (IEC) [...] aprobó como norma internacional IEC nombres y símbolos para prefijos de múltiplos binarios para su uso en los campos del procesamiento y la transmisión de datos".
^ "¿Qué es un kilobyte?". Archivado desde el original el 6 de junio de 2011 . Consultado el 20 de mayo de 2010 .
^ NIST "Prefijos para múltiplos binarios" https://physics.nist.gov/cuu/Units/binary.html Archivado el 14 de enero de 2018 en Wayback Machine.
^ Enmienda 2 a la norma internacional IEC IEC 60027-2: Símbolos de letras que se utilizarán en tecnología eléctrica - Parte 2: Telecomunicaciones y electrónica.
^ "Orden que concede la moción de desestimación" (PDF) . Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California . Archivado (PDF) desde el original el 7 de octubre de 2021 . Consultado el 24 de enero de 2020 .
^ abc Mook, Nate (28 de junio de 2006). "Western Digital resuelve demanda de capacidad". noticias beta. Archivado desde el original el 7 de septiembre de 2009 . Consultado el 30 de marzo de 2009 .
^ Baskin, Scott D. (1 de febrero de 2006). "Escrito del demandado Western Digital Corporation en apoyo de la moción de aprobación preliminar del demandante". Orin Safier contra Western Digital Corporation . Corporación Digital Occidental . Archivado desde el original el 2 de enero de 2009 . Consultado el 30 de marzo de 2009 .
^ Juez, Peter (26 de octubre de 2007). "Seagate paga por definición de gigabytes". ZDNet . Archivado desde el original el 3 de septiembre de 2014 . Consultado el 16 de septiembre de 2014 .
^ Allison Dexter, "¿Cuántas palabras hay en Harry Potter?", [1] Archivado el 25 de enero de 2021 en Wayback Machine ; muestra 190.637 palabras
^ "Kilobytes Megabytes Gigabytes Terabytes (Universidad de Stanford)". Archivado desde el original el 8 de noviembre de 2020 . Consultado el 12 de diciembre de 2020 .
^ Perenson, Melissa J. (4 de enero de 2007). "Hitachi presenta el disco duro de 1 terabyte". www.pcworld.com . Archivado desde el original el 24 de octubre de 2012 . Consultado el 5 de diciembre de 2020 .
^ "¿Cómo es un petabyte?". Archivado desde el original el 28 de enero de 2018 . Consultado el 19 de febrero de 2018 .
^ Gross, Grant (24 de noviembre de 2007). "Internet podría alcanzar su máximo en 2 años, según un estudio". Mundo PC . Archivado desde el original el 26 de noviembre de 2007 . Consultado el 28 de noviembre de 2007 .
^ "La era Zettabyte comienza oficialmente (¿cuánto cuesta eso?)". Blogs de Cisco . 2016-09-09. Archivado desde el original el 2021-08-02 . Consultado el 4 de agosto de 2021 .
^ Cline, Marshall. "Me imagino una máquina con bytes de 9 bits. Pero seguramente no con bytes de 16 bits ni con bytes de 32 bits, ¿verdad?". Archivado desde el original el 21 de marzo de 2019 . Consultado el 18 de junio de 2015 .
^ Klein, Jack (2008), Tipos de enteros en C y C++, archivado desde el original el 27 de marzo de 2010 , consultado el 18 de junio de 2015
^ Cline, Marshall. "Preguntas frecuentes sobre C++: las reglas sobre bytes, caracteres y caracteres". Archivado desde el original el 21 de marzo de 2019 . Consultado el 18 de junio de 2015 .
^ "Interfaces externas/API". Northwestern University. Archivado desde el original el 9 de agosto de 2018 . Consultado el 2 de septiembre de 2016 .
^ "Avatar - The Last Airbender: la serie completa Blu-ray". Blu-ray.com . Archivado desde el original el 28 de abril de 2020 . Consultado el 24 de febrero de 2021 .

Otras lecturas

"Manipulación de 2,5 bytes" (PDF) . Programación con el conjunto de instrucciones PDP-10 (PDF) . Manual de referencia del sistema PDP-10. vol. 1. Corporación de Equipos Digitales (DEC). Agosto de 1969. págs. 2-15–2-17. Archivado (PDF) desde el original el 5 de abril de 2017 . Consultado el 5 de abril de 2017 .
Ashley Taylor. "Bits y Bytes". Stanford. https://web.stanford.edu/class/cs101/bits-bytes.html