Byte

El byte es una unidad de información digital que normalmente consta de ocho bits . Históricamente, el byte era el número de bits utilizados para codificar un único carácter de texto en una computadora ^[1]^[2] y por esta razón es la unidad de memoria direccionable más pequeña en muchas arquitecturas de computadoras . Para desambiguar los bytes de tamaño arbitrario de la definición común de 8 bits , los documentos de protocolo de red como el Protocolo de Internet ( RFC 791) se refieren a un byte de 8 bits como un octeto . ^[3] Esos bits en un octeto generalmente se cuentan con numeración de 0 a 7 o de 7 a 0 dependiendo del endianness de bits .

El tamaño del byte ha dependido históricamente del hardware y no existían estándares definitivos que establecieran el tamaño. Se han utilizado tamaños de 1 a 48 bits. ^[4]^[5]^[6]^[7] El código de caracteres de seis bits fue una implementación utilizada a menudo en los primeros sistemas de codificación, y las computadoras que usaban bytes de seis y nueve bits eran comunes en la década de 1960. Estos sistemas a menudo tenían palabras de memoria de 12, 18, 24, 30, 36, 48 o 60 bits, correspondientes a 2, 3, 4, 5, 6, 8 o 10 bytes de seis bits, y persistieron, en sistemas heredados, hasta el siglo XXI. En esta era, las agrupaciones de bits en el flujo de instrucciones a menudo se denominaban sílabas^[a] o slab , antes de que el término byte se volviera común.

El estándar moderno de facto de ocho bits, como se documenta en ISO/IEC 2382-1:1993, es una potencia de dos conveniente que permite los valores codificados en binario de 0 a 255 para un byte, ya que 2 elevado a la octava potencia es 256. ^[8] El estándar internacional IEC 80000-13 codificó este significado común. Muchos tipos de aplicaciones utilizan información representable en ocho bits o menos y los diseñadores de procesadores comúnmente optimizan para este uso. La popularidad de las principales arquitecturas informáticas comerciales ha ayudado a la aceptación ubicua del byte de 8 bits. ^[9] Las arquitecturas modernas suelen utilizar palabras de 32 o 64 bits, construidas de cuatro u ocho bytes, respectivamente.

La Comisión Electrotécnica Internacional (IEC) y el Instituto de Ingenieros Eléctricos y Electrónicos (IEEE) designaron el símbolo de unidad para el byte como la letra B mayúscula . ^[10] A nivel internacional, la unidad octeto define explícitamente una secuencia de ocho bits, eliminando la posible ambigüedad del término "byte". ^[11]^[12] . El símbolo para octeto, 'o', también elimina convenientemente la ambigüedad en el símbolo 'B' entre byte y bel .

Etimología e historia

El término byte fue acuñado por Werner Buchholz en junio de 1956, ^[4]^[13]^[14]^[b] durante la fase inicial de diseño de la computadora IBM Stretch ^[15]^[16]^[1]^{[13] [}^14]^[17]^[18] , que tenía direccionamiento a bits e instrucciones de longitud de campo variable (VFL) con un tamaño de byte codificado en la instrucción. ^[13] Es un cambio de ortografía deliberado de bite para evitar una mutación accidental a bit . ^[1]^[13]^[19]^[c]

Otro origen del término byte para grupos de bits más pequeños que el tamaño de palabra de una computadora, y en particular grupos de cuatro bits , está registrado por Louis G. Dooley, quien afirmó haber acuñado el término mientras trabajaba con Jules Schwartz y Dick Beeler en un sistema de defensa aérea llamado SAGE en el Laboratorio Lincoln del MIT en 1956 o 1957, que fue desarrollado conjuntamente por Rand , MIT e IBM. ^[20]^[21] Más tarde, el lenguaje de Schwartz, JOVIAL, utilizó el término, pero el autor recordó vagamente que se derivó de AN/FSQ-31 . ^[22]^[21]

Las primeras computadoras usaban una variedad de representaciones decimales codificadas en binario (BCD) de cuatro bits y los códigos de seis bits para patrones gráficos imprimibles comunes en el Ejército de los EE. UU. ( FIELDATA ) y la Marina . Estas representaciones incluían caracteres alfanuméricos y símbolos gráficos especiales. Estos conjuntos se ampliaron en 1963 a siete bits de codificación, llamados Código estándar estadounidense para el intercambio de información (ASCII) como Estándar federal de procesamiento de información , que reemplazó a los códigos de teleimpresora incompatibles en uso por diferentes ramas del gobierno de los EE. UU. y universidades durante la década de 1960. ASCII incluía la distinción de alfabetos en mayúsculas y minúsculas y un conjunto de caracteres de control para facilitar la transmisión del lenguaje escrito, así como las funciones de los dispositivos de impresión, como el avance de página y el salto de línea, y el control físico o lógico del flujo de datos sobre el medio de transmisión. ^[18] A principios de los años 1960, mientras también estaba activo en la estandarización ASCII, IBM introdujo simultáneamente en su línea de productos System/360 el Código de Intercambio Decimal Codificado Binario Extendido (EBCDIC) de ocho bits, una expansión de sus representaciones decimales codificadas en binario (BCDIC) de seis bits ^[d] utilizadas en perforadoras de tarjetas anteriores. ^[23] La prominencia del System/360 condujo a la adopción generalizada del tamaño de almacenamiento de ocho bits, ^[18]^[16]^[13] mientras que en detalle los esquemas de codificación EBCDIC y ASCII son diferentes.

A principios de los años 1960, AT&T introdujo la telefonía digital en líneas troncales de larga distancia . Estas utilizaban la codificación de ley μ de ocho bits . Esta gran inversión prometía reducir los costos de transmisión de datos de ocho bits.

En el Volumen 1 de The Art of Computer Programming (publicado por primera vez en 1968), Donald Knuth utiliza el término byte en su hipotético ordenador MIX para designar una unidad que "contiene una cantidad no especificada de información... capaz de albergar al menos 64 valores distintos... como máximo 100 valores distintos. En un ordenador binario, un byte debe estar compuesto por seis bits". ^[24] Señala que "desde 1975 aproximadamente, la palabra byte ha llegado a significar una secuencia de exactamente ocho dígitos binarios... Cuando hablamos de bytes en relación con MIX nos limitaremos al sentido anterior de la palabra, que nos remonta a los días en que los bytes aún no estaban estandarizados". ^[24]

El desarrollo de los microprocesadores de ocho bits en la década de 1970 popularizó este tamaño de almacenamiento. Los microprocesadores como el Intel 8080 , el predecesor directo del 8086 , también podían realizar una pequeña cantidad de operaciones en los pares de cuatro bits de un byte, como la instrucción de suma y ajuste decimal (DAA). Una cantidad de cuatro bits a menudo se denomina nibble , también nybble , que se representa convenientemente mediante un solo dígito hexadecimal .

El término octeto especifica de forma inequívoca un tamaño de ocho bits. ^[18]^[12] Se utiliza ampliamente en las definiciones de protocolos .

Históricamente, el término octad u octade se utilizaba para designar ocho bits, al menos en Europa occidental; ^[25]^[26] sin embargo, este uso ya no es común. El origen exacto del término no está claro, pero se puede encontrar en fuentes británicas, holandesas y alemanas de los años 1960 y 1970, y en toda la documentación de las computadoras mainframe de Philips .

Símbolo de unidad

El símbolo de unidad para el byte se especifica en IEC 80000-13 , IEEE 1541 y el Formato de Intercambio Métrico ^[10] como el carácter mayúscula B.

En el Sistema Internacional de Cantidades (ISQ), B es también el símbolo del bel , una unidad de relación de potencia logarítmica que lleva el nombre de Alexander Graham Bell , lo que crea un conflicto con la especificación IEC. Sin embargo, existe poco peligro de confusión, porque el bel es una unidad que se utiliza raramente. Se utiliza principalmente en su fracción decimal, el decibel (dB), para mediciones de intensidad de señal y nivel de presión sonora , mientras que una unidad para una décima parte de un byte, el decibyte, y otras fracciones, solo se utilizan en unidades derivadas, como las velocidades de transmisión.

La letra minúscula o para octeto se define como el símbolo de octeto en IEC 80000-13 y se utiliza comúnmente en idiomas como el francés ^[27] y el rumano , y también se combina con prefijos métricos para múltiplos, por ejemplo ko y Mo.

Unidades de varios bytes

Existe más de un sistema para definir múltiplos de unidades basados en el byte. Algunos sistemas se basan en potencias de 10 , siguiendo el Sistema Internacional de Unidades (SI), que define por ejemplo el prefijo kilo como 1000 (10 ³ ); otros sistemas se basan en potencias de 2. La nomenclatura de estos sistemas ha llevado a confusión. Los sistemas basados en potencias de 10 utilizan prefijos estándar del SI ( kilo , mega , giga , ...) y sus símbolos correspondientes (k, M, G, ...). Sin embargo, los sistemas basados en potencias de 2 pueden utilizar prefijos binarios ( kibi , mebi , gibi , ...) y sus símbolos correspondientes (Ki, Mi, Gi, ...) o pueden utilizar los prefijos K, M y G, creando ambigüedad cuando se utilizan los prefijos M o G.

Si bien la diferencia entre las interpretaciones decimal y binaria es relativamente pequeña para el kilobyte (aproximadamente un 2 % más pequeña que el kibibyte), los sistemas se desvían cada vez más a medida que las unidades se hacen más grandes (la desviación relativa aumenta un 2,4 % por cada tres órdenes de magnitud). Por ejemplo, un terabyte basado en una potencia de 10 es aproximadamente un 9 % más pequeño que un tebibyte basado en una potencia de 2.

Unidades basadas en potencias de 10

La Comisión Electrotécnica Internacional (CEI) recomienda la definición de prefijos que utilizan potencias de 10 (en las que 1 kilobyte (símbolo kB) equivale a 1000 bytes). ^[28] La norma IEC define ocho de estos múltiplos, hasta 1 yottabyte (YB), equivalente a 1000 ⁸ bytes. ^{[29] La}Oficina Internacional de Pesas y Medidas (BIPM) adoptó los prefijos adicionales ronna- para 1000 ⁹ y quetta- para 1000 ¹⁰ en 2022. ^[30]^[31]

Esta definición se utiliza con mayor frecuencia para unidades de velocidad de datos en redes informáticas , bus interno, velocidades de transferencia de discos duros y medios flash, y para las capacidades de la mayoría de los medios de almacenamiento , en particular discos duros , ^[32] almacenamiento basado en flash , ^[33] y DVD . ^{[ cita requerida ]} Los sistemas operativos que utilizan esta definición incluyen macOS , ^[34] iOS , ^[34] Ubuntu , ^[35] y Debian . ^[36] También es coherente con otros usos de los prefijos SI en informática, como las velocidades de reloj de la CPU o las medidas de rendimiento .

Unidades basadas en potencias de 2

Un sistema de unidades basado en potencias de 2 en el que 1 kibibyte (KiB) es igual a 1.024 (es decir, 2 ¹⁰ ) bytes está definido por la norma internacional IEC 80000-13 y es apoyado por organismos de normalización nacionales e internacionales ( BIPM , IEC , NIST ). La norma IEC define ocho de estos múltiplos, hasta 1 yobibyte (YiB), igual a 1024 ⁸ bytes. Las contrapartes binarias naturales de ronna- y quetta- se dieron en un documento de consulta del Comité Consultivo de Unidades (CCU) del Comité Internacional de Pesos y Medidas como robi- (Ri, 1024 ⁹ ) y quebi- (Qi, 1024 ¹⁰ ), pero aún no han sido adoptadas por la IEC y la ISO. ^[37]

Un sistema alternativo de nomenclatura para las mismas unidades (denominado aquí convención habitual ), en el que 1 kilobyte (KB) es igual a 1.024 bytes, ^[38]^[39]^[40] 1 megabyte (MB) es igual a 1024 ² bytes y 1 gigabyte (GB) es igual a 1024 ³ bytes es mencionado por un estándar JEDEC de los años 1990. Solo los primeros tres múltiplos (hasta GB) son mencionados por el estándar JEDEC, que no hace mención de TB y mayores. Aunque confuso e incorrecto, ^[41] la convención habitual es utilizada por el sistema operativo Microsoft Windows ^[42]^{[ se necesita una mejor fuente ]} y la capacidad de memoria de acceso aleatorio , como la memoria principal y el tamaño de caché de la CPU , y en marketing y facturación por compañías de telecomunicaciones, como Vodafone , ^[43] AT&T , ^[44] Orange ^[45] y Telstra . ^[46]

Para la capacidad de almacenamiento , la convención habitual fue utilizada por macOS e iOS hasta Mac OS X 10.6 Snow Leopard y iOS 10, después de lo cual cambiaron a unidades basadas en potencias de 10. ^[34]

Unidades parroquiales

Varios proveedores de computadoras han acuñado términos para datos de varios tamaños, a veces con diferentes tamaños para el mismo término incluso dentro de un mismo proveedor. Estos términos incluyen palabra doble , media palabra , palabra larga , palabra cuádruple , losa , superpalabra y sílaba . También hay términos informales, por ejemplo, medio byte y nybble para 4 bits, octal K para 1000 ₈ .

Historia de las definiciones conflictivas

La diferencia porcentual entre las interpretaciones decimales y binarias de los prefijos de unidad aumenta con el aumento del tamaño de almacenamiento

La memoria de la computadora contemporánea ^[e] tiene una arquitectura binaria, lo que hace que una definición de unidades de memoria basada en potencias de 2 sea más práctica. El uso del prefijo métrico kilo para múltiplos binarios surgió como una conveniencia, porque 1024 es aproximadamente 1000. ^[27] Esta definición fue popular en las primeras décadas de la informática personal , con productos como el formato de disquete DD de 5 1 ⁄ 4 pulgadas de Tandon (con capacidad para 368 640 bytes) que se anunciaba como "360 KB", siguiendo la convención de 1024 bytes. Sin embargo, no fue universal. El disquete Shugart SA-400 de 5 1 ⁄ 4 pulgadas contenía 109 375 bytes sin formato, ^[47] y se anunciaba como "110 Kbyte", utilizando la convención 1000. ^{[48] De la misma manera, el disquete}DEC RX01 de 8 pulgadas (1975) tenía una capacidad de 256.256 bytes formateados y se anunciaba como "256k". ^[49] Algunos dispositivos se anunciaban utilizando una mezcla de las dos definiciones: en particular, los disquetes anunciados como "1,44 MB" tienen una capacidad real de 1.440 KiB, el equivalente a 1,47 MB o 1,41 MiB.

En 1995, el Comité Interdivisional de Nomenclatura y Símbolos de la Unión Internacional de Química Pura y Aplicada (IUPAC) intentó resolver esta ambigüedad al proponer un conjunto de prefijos binarios para las potencias de 1024, incluidos kibi (kilobinario), mebi (megabinario) y gibi (gigabinario). ^[50]^[51]

En diciembre de 1998, la IEC abordó estos usos y definiciones múltiples adoptando los prefijos propuestos por la IUPAC (kibi, mebi, gibi, etc.) para denotar de forma inequívoca potencias de 1024. ^[52] Por lo tanto, un kibibyte (1 KiB) es 1024 ¹ byte = 1024 bytes, un mebibyte (1 MiB) es 1024 ² bytes =1.048.576 bytes, y así sucesivamente.

En 1999, Donald Knuth sugirió llamar al kibibyte un "kilobyte grande" ( KKB ). ^[53]

Definiciones estándar modernas

La IEC adoptó la propuesta de la IUPAC y publicó la norma en enero de 1999. ^[54]^[55] Los prefijos de la IEC forman parte del Sistema Internacional de Cantidades . La IEC especificó además que el kilobyte sólo debe utilizarse para referirse a 1.000 bytes. ^{[ cita requerida ]}

Demandas por definición

Las demandas judiciales derivadas de la supuesta confusión de los consumidores sobre las definiciones binarias y decimales de los múltiplos del byte han terminado generalmente a favor de los fabricantes, y los tribunales han sostenido que la definición legal de gigabyte o GB es 1 GB = 1.000.000.000 (10 ⁹ ) bytes (la definición decimal), en lugar de la definición binaria (2 ³⁰ , es decir, 1.073.741.824). En concreto, el Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California sostuvo que "el Congreso de los Estados Unidos ha considerado que la definición decimal de gigabyte es la 'preferida' a los efectos del 'comercio y comercio de los Estados Unidos' [...] La Legislatura de California ha adoptado asimismo el sistema decimal para todas las 'transacciones en este estado ' " . ^[56]

Demandas anteriores habían terminado en un acuerdo sin que el tribunal se pronunciara sobre la cuestión, como una demanda contra el fabricante de unidades Western Digital . ^[57]^[58] Western Digital resolvió el desafío y agregó exenciones de responsabilidad explícitas a los productos de que la capacidad utilizable puede diferir de la capacidad publicitada. ^[57] Seagate fue demandada por motivos similares y también llegó a un acuerdo. ^[57]^[59]

Ejemplos prácticos

Usos comunes

Muchos lenguajes de programación definen el tipo de datos byte .

Los lenguajes de programación C y C++ definen byte como una "unidad direccionable de almacenamiento de datos lo suficientemente grande como para albergar cualquier miembro del conjunto de caracteres básicos del entorno de ejecución" (cláusula 3.6 del estándar C). El estándar C requiere que el tipo de datos integral unsigned char debe contener al menos 256 valores diferentes y se representa con al menos ocho bits (cláusula 5.2.4.2.1). Varias implementaciones de C y C++ reservan 8, 9, 16, 32 o 36 bits para el almacenamiento de un byte. ^[66]^[67]^[g] Además, los estándares C y C++ requieren que no haya espacios entre dos bytes. Esto significa que cada bit en la memoria es parte de un byte. ^[68]

El tipo de datos primitivo byte de Java se define como ocho bits. Es un tipo de datos con signo que contiene valores de −128 a 127.

Los lenguajes de programación .NET , como C# , definen byte como un tipo sin signo y sbyte como un tipo de datos con signo, que contienen valores de 0 a 255 y de −128 a 127 , respectivamente.

En los sistemas de transmisión de datos, el byte se utiliza como una secuencia contigua de bits en un flujo de datos en serie, que representa la unidad de datos más pequeña. Para la comunicación asincrónica , una unidad de transmisión completa normalmente incluye además un bit de inicio, 1 o 2 bits de parada y, posiblemente, un bit de paridad , y, por lo tanto, su tamaño puede variar de siete a doce bits para cinco a ocho bits de datos reales. ^[69] Para la comunicación sincrónica, la comprobación de errores suele utilizar bytes al final de una trama .

Véase también

Notas

^ El término sílaba se utilizaba para bytes que contenían instrucciones o constituyentes de instrucciones, no para bytes de datos.
^ Muchas fuentes indican erróneamente que el término byte se acuñó en julio de 1956, pero Werner Buchholz afirmó que el término se habría acuñado en junio de 1956. De hecho, el primer documento que respalda esta idea data del 11 de junio de 1956. Buchholz afirmó que la transición a los bytes de 8 bits se concibió en agosto de 1956, pero el primer documento encontrado que utiliza esta noción data de septiembre de 1956.
^ Algunas máquinas posteriores, por ejemplo, Burroughs B1700 , CDC 3600 , DEC PDP-6, DEC PDP-10 tenían la capacidad de operar con bytes arbitrarios no más grandes que el tamaño de la palabra.
^ Había más de una página de códigos BCD.
^ Durante la década de 1970 hubo máquinas con arquitecturas decimales .
^ El vídeo está codificado a una tasa de bits de 27,8 Mbit/s, con un tiempo de ejecución de 1403 min ^[70] (84 180 segundos), lo que da como resultado un tamaño aproximado de 0,2925 TB (0,2661 TiB).
^ La cantidad real de bits en una implementación particular se documenta tal como CHAR_BITse implementa en el archivo limits.h .

Referencias

^abc Blaauw, Gerrit Anne ; Brooks, Jr., Frederick Phillips ; Buchholz, Werner (1962), "Capítulo 4: Unidades de datos naturales" (PDF) , en Buchholz, Werner (ed.), Planning a Computer System - Project Stretch , McGraw-Hill Book Company, Inc. / The Maple Press Company, York, PA., pp. 39–40, LCCN 61-10466, archivado desde el original (PDF) el 2017-04-03 , consultado el 2017-04-03
    Los términos utilizados aquí para describir la estructura impuesta por el diseño de la máquina, además de bit , se enumeran a continuación.
    Byte denota un grupo de bits utilizados para codificar un carácter, o el número de bits transmitidos en paralelo hacia y desde unidades de entrada-salida. Aquí se utiliza un término distinto de carácter porque un carácter determinado puede representarse en diferentes aplicaciones por más de un código, y diferentes códigos pueden utilizar diferentes números de bits (es decir, diferentes tamaños de byte). En la transmisión de entrada-salida, la agrupación de bits puede ser completamente arbitraria y no tener relación con los caracteres reales. (El término se acuñó de bite , pero se volvió a escribir para evitar una mutación accidental a bit ).
    Una palabra consiste en el número de bits de datos transmitidos en paralelo desde o hacia la memoria en un ciclo de memoria. El tamaño de palabra se define así como una propiedad estructural de la memoria. (El término catena fue acuñado para este propósito por los diseñadores de la computadora Bull GAMMA 60 [fr] ).
    Bloque se refiere al número de palabras transmitidas hacia o desde una unidad de entrada-salida en respuesta a una sola instrucción de entrada-salida. El tamaño del bloque es una propiedad estructural de una unidad de entrada-salida; puede haber sido fijado por el diseño o puede ser modificado por el programa.
^ Bemer, Robert William (1959), "Una propuesta para un código de tarjeta generalizado de 256 caracteres", Communications of the ACM , 2 (9): 19–23, doi : 10.1145/368424.368435 , S2CID 36115735
^ Postel, J. (septiembre de 1981). Protocolo de Internet ESPECIFICACIÓN DEL PROTOCOLO DE PROGRAMA DE INTERNET DE DARPA. p. 43. doi : 10.17487/RFC0791 . RFC 791. Consultado el 28 de agosto de 2020. octeto Byte de ocho bits .
^ desde Buchholz, Werner (11 de junio de 1956). "7. The Shift Matrix" (PDF) . The Link System . IBM . pp. 5–6. Stretch Memo No. 39G. Archivado desde el original (PDF) el 4 de abril de 2017. Consultado el 4 de abril de 2016 .
    […] Lo más importante, desde el punto de vista de la edición, será la capacidad de manejar cualquier carácter o dígito, de 1 a 6 bits de longitud.
    La Figura 2 muestra la Matriz de Desplazamiento que se utilizará para convertir una palabra de 60 bits , procedente de la Memoria en paralelo, en caracteres , o 'bytes' como los hemos llamado, para ser enviados al Sumador en serie. Los 60 bits se vuelcan en núcleos magnéticos en seis niveles diferentes. Así, si un 1 sale de la posición 9, aparece en los seis núcleos de debajo. Al pulsar cualquier línea diagonal se enviarán los seis bits almacenados a lo largo de esa línea al Sumador. El Sumador puede aceptar todos o sólo algunos de los bits.
    Supongamos que se desea operar en dígitos decimales de 4 bits , empezando por la derecha. La diagonal 0 se pulsa primero, enviando los seis bits 0 a 5, de los cuales el Sumador acepta sólo los primeros cuatro (0-3). Los bits 4 y 5 se ignoran. A continuación, se pulsa la diagonal 4. Esto envía los bits 4 a 9, de los cuales los dos últimos se ignoran nuevamente, y así sucesivamente.
    Es igual de fácil utilizar los seis bits en el trabajo alfanumérico , o manejar bytes de solo un bit para el análisis lógico, o desplazar los bytes por cualquier número de bits. Todo esto se puede hacer tirando de las diagonales de desplazamiento adecuadas. Se utiliza una disposición matricial análoga para cambiar de operación en serie a operación en paralelo en la salida del sumador. […]
^ 3600 Computer System - Reference Manual (PDF) . K. St. Paul, Minnesota, EE. UU.: Control Data Corporation (CDC). 1966-10-11 [1965]. 60021300. Archivado desde el original (PDF) el 2017-04-05 . Consultado el 2017-04-05 . Byte: partición de una palabra de computadora.
NB. Se analizan bytes de 12 bits, 24 bits y 48 bits.
^ Rao, Thammavaram RN; Fujiwara, Eiji (1989). McCluskey, Edward J. (ed.). Codificación de control de errores para sistemas informáticos. Serie Prentice Hall en ingeniería informática (1.ª ed.). Englewood Cliffs, NJ, EE. UU.: Prentice Hall . ISBN 0-13-283953-9. Número de serie LCCN 88-17892.
NB. Ejemplo de uso de un código para "bytes de 4 bits".
^ Tafel, Hans Jörg (1971). Einführung in die digitale Datenverarbeitung [ Introducción al procesamiento de información digital ] (en alemán). Múnich: Carl Hanser Verlag . pag. 300.ISBN 3-446-10569-7. Byte = zusammengehörige Folge von ia neun Bits; davon sind acht Datenbits, das neunte ein Prüfbit
NB. Define un byte como un grupo de típicamente 9 bits; 8 bits de datos más 1 bit de paridad.
^ ISO/IEC 2382-1: 1993, Tecnología de la información - Vocabulario - Parte 1: Términos fundamentales . 1993.
    byte:
    cadena que consta de una cantidad de bits, que se considera una unidad y que, por lo general, representa un carácter o parte de un carácter.
    NOTAS:
    1 La cantidad de bits de un byte es fija para un sistema de procesamiento de datos determinado.
    2 La cantidad de bits de un byte suele ser 8.
^ "Historia de Internet de los años 1960 n.º 1964". Museo de Historia de la Computación . 2017 [2015]. Archivado desde el original el 24 de junio de 2022. Consultado el 17 de agosto de 2022 .
^ ab Jaffer, Aubrey (2011) [2008]. "Metric-Interchange-Format". Archivado desde el original el 2017-04-03 . Consultado el 2017-04-03 .
^ Kozierok, Charles M. (2005-09-20) [2001]. "La guía TCP/IP - Información binaria y representación: bits, bytes, nibbles, octetos y caracteres - Byte versus Octeto". 3.0. Archivado desde el original el 2017-04-03 . Consultado el 2017-04-03 .
^ ab ISO 2382-4, Organización de datos (2 ed.). byte, octeto, byte de 8 bits: Una cadena que consta de ocho bits.
^ abcde Buchholz, Werner (febrero de 1977). "La palabra "byte" alcanza la mayoría de edad..." Byte Magazine . 2 (2): 144.
    Recibimos lo siguiente de W Buchholz, una de las personas que trabajaba en el Proyecto Stretch de IBM a mediados de los años 50. Su carta cuenta la historia.

    Como no soy un lector habitual de su revista, me enteré de la pregunta en el número de noviembre de 1976 sobre el origen del término "byte" de un colega que sabía que yo había perpetrado esta pieza de jerga [ver página 77 de BYTE de noviembre de 1976, "Olde Englishe"] . Busqué en mis archivos y no pude encontrar un certificado de nacimiento. Pero estoy seguro de que "byte" está llegando a la mayoría de edad en 1977 con su 21º cumpleaños.
    Muchos han asumido que byte, es decir, 8 bits, se originó con el IBM System/360, que difundió tales bytes por todas partes a mediados de los años 60. El editor tiene razón al señalar que el término se remonta a la computadora Stretch anterior (pero se equivoca en que Stretch fue la primera, no la última, de las computadoras transistorizadas de segunda generación de IBM que se desarrollaron).
    La primera referencia encontrada en los archivos estaba contenida en un memorando interno escrito en junio de 1956 durante los primeros días del desarrollo de Stretch . Un byte se describía como compuesto por cualquier número de bits paralelos de uno a seis. Por lo tanto, se suponía que un byte tenía una longitud apropiada para la ocasión. Su primer uso fue en el contexto del equipo de entrada-salida de la década de 1950, que manejaba seis bits a la vez. La posibilidad de llegar a bytes de 8 bits se consideró en agosto de 1956 y se incorporó en el diseño de Stretch poco después.
    La primera referencia publicada al término ocurrió en 1959 en un artículo 'Processing Data in Bits and Pieces' de GA Blaauw , FP Brooks Jr y W Buchholz en IRE Transactions on Electronic Computers , junio de 1959, página 121. Las nociones de ese artículo se desarrollaron en el Capítulo 4 de Planning a Computer System (Project Stretch), editado por W Buchholz, McGraw-Hill Book Company (1962). La razón de haber acuñado el término se explicó allí en la página 40 de la siguiente manera:
Byte denota un grupo de bits utilizados para codificar un carácter, o el número de bits transmitidos en paralelo hacia y desde unidades de entrada-salida. Aquí se utiliza un término distinto de carácter porque un carácter determinado puede representarse en diferentes aplicaciones mediante más de un código, y diferentes códigos pueden utilizar diferentes cantidades de bits (es decir, diferentes tamaños de byte). En la transmisión de entrada-salida, la agrupación de bits puede ser completamente arbitraria y no tener relación con los caracteres reales. (El término se acuñó a partir de bite , pero se volvió a escribir para evitar una mutación accidental a bit ) .
    El System/360 adoptó muchos de los conceptos de Stretch, incluidos los tamaños básicos de bytes y palabras, que son potencias de 2. Sin embargo, por razones de economía, el tamaño de bytes se fijó en un máximo de 8 bits y el direccionamiento a nivel de bits se reemplazó por el direccionamiento por bytes.
    Desde entonces, el término byte ha significado generalmente 8 bits y, por lo tanto, ha pasado al vocabulario general.
    ¿Existen otros términos acuñados especialmente para el campo de la informática que hayan llegado a los diccionarios generales del idioma inglés?
^ ab "Cronología de la era IBM Stretch/Harvest (1956-1961)". Computer History Museum . Junio de 1956. Archivado desde el original el 29 de abril de 2016. Consultado el 3 de abril de 2017 .
    Verano de 1956: Gerrit Blaauw , Fred Brooks , Werner Buchholz , John Cocke y Jim Pomerene se unen al equipo de Stretch . Lloyd Hunter proporciona liderazgo en transistores
.     Julio de 1956 [ sic ]: En un informe, Werner Buchholz enumera las ventajas de una longitud de palabra de 64 bits para Stretch. También respalda el requisito de la NSA de bytes de 8 bits. El término "Byte" de Werner se popularizó por primera vez en este memorando.
    Nota: Esta cronología especifica erróneamente la fecha de nacimiento del término "byte" como julio de 1956 , mientras que Buchholz en realidad utilizó el término ya en junio de 1956 .
^ Buchholz, Werner (31 de julio de 1956). "5. Entrada-Salida" (PDF) . Longitud de palabra de memoria . IBM . pág. 2. Stretch Memo No. 40. Archivado desde el original (PDF) el 4 de abril de 2017. Consultado el 4 de abril de 2016 .
[…] 60 es un múltiplo de 1, 2, 3, 4, 5 y 6. Por lo tanto, se pueden empaquetar de manera eficiente bytes de longitud de 1 a 6 bits en una palabra de 60 bits sin tener que dividir un byte entre una palabra y la siguiente. Si se necesitaran bytes más largos, 60 bits, por supuesto, ya no serían ideales. Con las aplicaciones actuales, 1, 4 y 6 bits son los casos realmente importantes.
Con palabras de 64 bits, a menudo sería necesario hacer algunos compromisos, como dejar 4 bits sin usar en una palabra cuando se trabaja con bytes de 6 bits en la entrada y la salida. Sin embargo, la computadora LINK puede equiparse para eliminar estos espacios vacíos y permitir el manejo de bytes que se dividen entre palabras. […]
^ desde Buchholz, Werner (1956-09-19). "2. Input-Output Byte Size" (PDF) . Longitud de palabra de memoria e indexación . IBM . p. 1. Stretch Memo No. 45. Archivado desde el original (PDF) el 2017-04-04 . Consultado el 2016-04-04 .
[…] El tamaño máximo de bytes de entrada-salida para la operación en serie será ahora de 8 bits, sin contar los bits de detección y corrección de errores. Por lo tanto, la central funcionará sobre la base de bytes de 8 bits, y cualquier unidad de entrada-salida con menos de 8 bits por byte dejará los bits restantes en blanco. Los espacios resultantes se pueden editar más tarde mediante programación […]
^ Raymond, Eric Steven (2017) [2003]. «byte definition». Archivado desde el original el 3 de abril de 2017. Consultado el 3 de abril de 2017 .
^ abcd Bemer, Robert William (8 de agosto de 2000). "¿Por qué un byte tiene 8 bits? ¿O no?". Viñetas de la historia de la informática . Archivado desde el original el 3 de abril de 2017. Consultado el 3 de abril de 2017 .
Llegué a trabajar para IBM y vi toda la confusión que causaba la limitación de 64 caracteres. Especialmente cuando empezamos a pensar en el procesamiento de textos, que requeriría tanto mayúsculas como minúsculas. Si
    a las 47 existentes añadimos 26 letras minúsculas, obtenemos 73, 9 más de las que pueden representar 6 bits.
    Incluso hice una propuesta (en vista de STRETCH , la primera computadora que conozco con un byte de 8 bits) que ampliaría el número de códigos de caracteres de las tarjetas perforadas a 256 [1].
    Algunas personas se lo tomaron en serio. Yo lo consideraba una parodia.
    Así que algunas personas empezaron a pensar en caracteres de 7 bits, pero esto era ridículo. Con la computadora STRETCH de IBM como fondo, manejando palabras de 64 caracteres divisibles en grupos de 8 (yo diseñé el conjunto de caracteres para ella, bajo la guía del Dr. Werner Buchholz , el hombre que SÍ acuñó el término "byte" para una agrupación de 8 bits). [2] Parecía razonable crear un conjunto de caracteres universal de 8 bits, que pudiera manejar hasta 256. En aquellos días, mi mantra era "las potencias de 2 son mágicas". Y así, el grupo que yo dirigía desarrolló y justificó tal propuesta [3].
    Eso fue un poco demasiado avance cuando se presentó al grupo de estándares que debía formalizar ASCII, por lo que se quedaron cortos por el momento con un conjunto de 7 bits, o bien un conjunto de 8 bits dejando la mitad superior para trabajos futuros.
    El IBM 360 usaba caracteres de 8 bits, aunque no ASCII directamente. Así, el "byte" de Buchholz se hizo popular en todas partes. A mí mismo no me gustaba el nombre por muchas razones. El diseño tenía 8 bits moviéndose en paralelo. Pero luego llegó una nueva parte de IBM, con 9 bits para autocomprobación, tanto dentro de la CPU como en las unidades de cinta . Expuse este byte de 9 bits a la prensa en 1973. Pero mucho antes de eso, cuando dirigía las operaciones de software de Cie. Bull en Francia en 1965-66, insistí en que se dejara de usar el término "byte" en favor de " octeto ".
    Se puede observar que mi preferencia de entonces es ahora el término preferido.
    Se justifica por los nuevos métodos de comunicación que pueden transportar 16, 32, 64 e incluso 128 bits en paralelo. Pero algunas personas tontas ahora se refieren a un "byte de 16 bits" debido a esta transferencia paralela, que es visible en el conjunto UNICODE . No estoy seguro, pero tal vez esto debería llamarse " hexteto ".
    Pero se dará cuenta de que sigo teniendo razón. ¡Las potencias de 2 siguen siendo mágicas!
^ Blaauw, Gerrit Anne ; Brooks, Jr., Frederick Phillips ; Buchholz, Werner (junio de 1959). "Procesamiento de datos en fragmentos". IRE Transactions on Electronic Computers : 121.
^ Dooley, Louis G. (febrero de 1995). "Byte: The Word". BYTE . Ocala, FL, EE. UU. Archivado desde el original el 20 de diciembre de 1996.
La palabra byte fue acuñada alrededor de 1956 a 1957 en los Laboratorios Lincoln del MIT dentro de un proyecto llamado SAGE (Sistema de Defensa Aérea de América del Norte), que fue desarrollado conjuntamente por Rand , Lincoln Labs e IBM . En esa época, la estructura de la memoria de la computadora ya estaba definida en términos de tamaño de palabra . Una palabra consistía en x número de bits ; un bit representaba una posición de notación binaria en una palabra. Las operaciones normalmente operaban en todos los bits de la palabra completa.
Nosotros acuñamos la palabra byte para referirnos a un conjunto lógico de bits menores al tamaño de una palabra completa. En ese momento, no se definía específicamente como x bits, sino que normalmente se hacía referencia a un conjunto de 4 bits , ya que ese era el tamaño de la mayoría de nuestros elementos de datos codificados. Poco después, pasé a otras responsabilidades que me alejaron de SAGE. Después de haber pasado muchos años en Asia, regresé a los EE. UU. y me quedé perplejo al descubrir que la palabra byte se estaba utilizando en la nueva tecnología de microcomputadoras para referirse a la unidad básica de memoria direccionable.
^ ab Ram, Stefan (17 de enero de 2003). "Erklärung des Wortes" Byte "im Rahmen der Lehre binärer Codes" (en alemán). Berlín, Alemania: Freie Universität Berlin . Archivado desde el original el 10 de junio de 2021 . Consultado el 10 de abril de 2017 .
^ Origen del término "byte", 1956, archivado desde el original el 2017-04-10 , consultado el 2022-08-17
    Una sesión de preguntas y respuestas en una conferencia de la ACM sobre la historia de los lenguajes de programación incluyó este intercambio:

    [ John Goodenough :
    Mencionaste que el término "byte" se usa en JOVIAL . ¿De dónde proviene el término? ]
    [ Jules Schwartz (inventor de JOVIAL):
    Según recuerdo, el AN/FSQ-31 , un ordenador totalmente diferente al 709 , estaba orientado a bytes. No lo recuerdo con seguridad, pero estoy bastante seguro de que la descripción de ese ordenador incluía la palabra "byte", y la usábamos. ]
    [ Fred Brooks :
    ¿Puedo hablar de eso? Werner Buchholz acuñó la palabra como parte de la definición de STRETCH , y el AN/FSQ-31 la tomó de STRETCH, pero Werner es definitivamente el autor de esa palabra. ]
    [ Schwartz:
    Así es. Gracias. ]
^ "Lista de códigos EBCDIC de IBM". ibm.com . 2020-01-02. Archivado desde el original el 2020-07-03 . Consultado el 2020-07-03 .
^ ab Knuth, Donald (1997) [1968]. El arte de la programación informática: volumen 1: algoritmos fundamentales (3.ª ed.). Boston: Addison-Wesley. pág. 125. ISBN 9780201896831.
^ Williams, RH (1969). British Commercial Computer Digest: Serie de datos informáticos de Pergamon . Pergamon Press . ISBN 1483122107. ISBN 978-1483122106 ^{[ aclaración necesaria ]}
^ "Gama de productos de Philips Data Systems" (PDF) . Philips . Abril de 1971. Archivado desde el original (PDF) el 2016-03-04 . Consultado el 2015-08-03 .
^ ab
    [
    |*| Acerca de bits y bytes: prefijos para múltiplos binarios - IEC
    |*| v0: https://web.archive.org/web/20090818042050/http://www.iec.ch/online_news/etech/arch_2003/etech_0503/focus.htm
    |*| v1: https://www.iec.ch/prefixes-binary-multiples Archivado el 16 de agosto de 2021 en Wayback Machine . ]
^ Prefijos para múltiplos binarios Archivado el 8 de agosto de 2007 en Wayback Machine . La referencia del NIST sobre constantes, unidades e incertidumbre
^ Matsuoka, Satoshi; Sato, Hitoshi; Tatebe, Osamu; Koibuchi, Michihiro; Fujiwara, Ikki; Suzuki, Shuji; Kakuta, Masanori; Ishida, Takashi; Akiyama, Yutaka; Suzumura, Toyotaro; Ueno, Koji (15 de septiembre de 2014). "Extreme Big Data (EBD): tecnologías de infraestructura de Big Data de próxima generación hacia Yottabyte/año". Fronteras e innovaciones de la supercomputación . 1 (2): 89-107. doi : 10.14529/jsfi140206 . ISSN 2313-8734. Archivado desde el original el 13 de marzo de 2022 . Consultado el 27 de mayo de 2022 .
^ "Lista de resoluciones para la 27ª reunión de la Conferencia General de Pesas y Medidas" (PDF) . 2022-11-18. Archivado (PDF) desde el original el 2022-11-18 . Consultado el 2022-11-18 .
^ Gibney, Elizabeth (18 de noviembre de 2022). «¿Cuántos yottabytes hay en un quettabyte? Los números extremos reciben nuevos nombres». Nature . doi :10.1038/d41586-022-03747-9. ISSN 0028-0836. PMID 36400954. S2CID 253671538. Archivado desde el original el 16 de enero de 2023. Consultado el 21 de noviembre de 2022 .
^ Informe de tendencias de discos duros de 1977, publicado en junio de 1977
^ Unidad Flash USB SanDisk Archivado el 13 de mayo de 2008 en Wayback Machine. "Nota: 1 megabyte (MB) = 1 millón de bytes; 1 gigabyte (GB) = 1 mil millones de bytes".
^ abc «Cómo informan iOS y macOS sobre la capacidad de almacenamiento». Soporte técnico de Apple . 27 de febrero de 2018. Archivado desde el original el 9 de abril de 2020 . Consultado el 9 de enero de 2022 .
^ "UnitsPolicy". Wiki de Ubuntu . Ubuntu. Archivado desde el original el 18 de noviembre de 2021 . Consultado el 9 de enero de 2022 .
^ "ConsistentUnitPrefixes". Wiki de Debian . Archivado desde el original el 3 de diciembre de 2021. Consultado el 9 de enero de 2022 .
^ Brown, Richard JC (27 de abril de 2022). "Respuesta a "Ante la escasez de letras latinas para los nuevos símbolos del SI: propuesta alternativa para los nuevos prefijos del SI"". Acreditación y garantía de calidad . 27 (3): 143–144. doi :10.1007/s00769-022-01499-7. S2CID 248397680.
^ Kilobyte – Definición y más del diccionario gratuito Merriam-Webster Archivado el 9 de abril de 2010 en Wayback Machine . Merriam-webster.com (13 de agosto de 2010). Consultado el 7 de enero de 2011.
^ Kilobyte – Definición de Kilobyte en Dictionary.com Archivado el 1 de septiembre de 2010 en Wayback Machine . Dictionary.reference.com (29 de septiembre de 1995). Consultado el 7 de enero de 2011.
^ Definición de kilobyte de Oxford Dictionaries Online Archivado el 25 de junio de 2006 en Wayback Machine . Askoxford.com. Consultado el 7 de enero de 2011.
^ Prefijos para múltiplos binarios y decimales: binario versus decimal
^ "Determinación del tamaño real del disco: por qué 1,44 MB debería ser 1,40 MB". Soporte técnico de Microsoft. 6 de mayo de 2003. Archivado desde el original el 9 de febrero de 2014. Consultado el 25 de marzo de 2014 .
^ "Tarifas de datos 3G/GPRS". Vodafone Irlanda. Archivado desde el original el 26 de octubre de 2016 . Consultado el 26 de octubre de 2016 .
^ "Escala de medición de datos". AT&T . Consultado el 26 de octubre de 2016 .^{[ enlace muerto permanente ]}
^ "Acceso a Internet desde el móvil". Orange Rumanía. Archivado desde el original el 26 de octubre de 2016. Consultado el 26 de octubre de 2016 .
^ "Nuestras Condiciones del Cliente" (PDF) . Telstra. p. 7. Archivado (PDF) del original el 10 de abril de 2017 . Consultado el 26 de octubre de 2016 .
^ "SA400 minifloppy". Swtpc.com. 14 de agosto de 2013. Archivado desde el original el 27 de mayo de 2014. Consultado el 25 de marzo de 2014 .
^ "Unidad de disco minifloppy™ SA 400 de Shugart Associates" (PDF) . Archivado desde el original (PDF) el 8 de junio de 2011. Consultado el 24 de junio de 2011 .
^ "Manual de mantenimiento del sistema de disquete RXS/RX11" (PDF) . Maynard, Massachusetts: Digital Equipment Corporation. Mayo de 1975. Archivado desde el original (PDF) el 23 de abril de 2011 . Consultado el 24 de junio de 2011 .
^ Informe de la IUCr de 1995 - Comité Interdivisional de Nomenclatura y Símbolos de la IUPAC (IDCNS) http://ww1.iucr.org/iucr-top/cexec/rep95/idcns.htm Archivado el 19 de diciembre de 2020 en Wayback Machine
^ "Prefijo binario" Departamento de Ciencias de la Computación de la Universidad de Auckland https://wiki.cs.auckland.ac.nz/stageonewiki/index.php/Binary_prefix Archivado el 16 de octubre de 2020 en Wayback Machine.
^ Instituto Nacional de Estándares y Tecnología . «Prefijos para múltiplos binarios». Archivado desde el original el 8 de agosto de 2007."En diciembre de 1998 la Comisión Electrotécnica Internacional (CEI) [...] aprobó como norma internacional IEC los nombres y símbolos para prefijos de múltiplos binarios para su uso en los campos del procesamiento y la transmisión de datos."
^ "¿Qué es un kilobyte?". Archivado desde el original el 6 de junio de 2011. Consultado el 20 de mayo de 2010 .
^ NIST "Prefijos para múltiplos binarios" https://physics.nist.gov/cuu/Units/binary.html Archivado el 14 de enero de 2018 en Wayback Machine
^ Enmienda 2 a la Norma Internacional IEC 60027-2: Símbolos de letras que se utilizarán en tecnología eléctrica – Parte 2: Telecomunicaciones y electrónica.
^ "Orden de concesión de la moción de desestimación" (PDF) . Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California . Archivado (PDF) desde el original el 2021-10-07 . Consultado el 2020-01-24 .
^ abc Mook, Nate (28 de junio de 2006). "Western Digital resuelve demanda por capacidad". betanews. Archivado desde el original el 7 de septiembre de 2009. Consultado el 30 de marzo de 2009 .
^ Baskin, Scott D. (1 de febrero de 2006). "Escrito de la demandada Western Digital Corporation en apoyo de la moción del demandante para la aprobación preliminar". Orin Safier v. Western Digital Corporation . Western Digital Corporation . Archivado desde el original el 2 de enero de 2009 . Consultado el 30 de marzo de 2009 .
^ Judge, Peter (26 de octubre de 2007). "Seagate paga más de lo que se puede pagar por definición de gigabyte". ZDNet . Archivado desde el original el 3 de septiembre de 2014. Consultado el 16 de septiembre de 2014 .
^ Allison Dexter, "¿Cuántas palabras hay en Harry Potter?", [1] Archivado el 25 de enero de 2021 en Wayback Machine ; muestra 190,637 palabras
^ "Kilobytes Megabytes Gigabytes Terabytes (Universidad de Stanford)". Archivado desde el original el 8 de noviembre de 2020. Consultado el 12 de diciembre de 2020 .
^ Perenson, Melissa J. (4 de enero de 2007). "Hitachi presenta un disco duro de 1 terabyte". www.pcworld.com . Archivado desde el original el 24 de octubre de 2012 . Consultado el 5 de diciembre de 2020 .
^ "¿Cómo es un petabyte?". Archivado desde el original el 28 de enero de 2018. Consultado el 19 de febrero de 2018 .
^ Gross, Grant (24 de noviembre de 2007). «Internet podría alcanzar su máximo en dos años, según un estudio». PC World . Archivado desde el original el 26 de noviembre de 2007. Consultado el 28 de noviembre de 2007 .
^ "La era de los zettabytes comienza oficialmente (¿cuánto cuesta?)". Cisco Blogs . 2016-09-09. Archivado desde el original el 2021-08-02 . Consultado el 2021-08-04 .
^ Cline, Marshall. "Podría imaginar una máquina con bytes de 9 bits. Pero seguramente no de 16 o 32 bits, ¿verdad?". Archivado desde el original el 21 de marzo de 2019. Consultado el 18 de junio de 2015 .
^ Klein, Jack (2008), Tipos enteros en C y C++, archivado desde el original el 27 de marzo de 2010 , consultado el 18 de junio de 2015
^ Cline, Marshall. «Preguntas frecuentes sobre C++: reglas sobre bytes, caracteres y caracteres». Archivado desde el original el 21 de marzo de 2019. Consultado el 18 de junio de 2015 .
^ "Interfaces externas/API". Universidad Northwestern. Archivado desde el original el 9 de agosto de 2018. Consultado el 2 de septiembre de 2016 .
^ "Avatar - La leyenda de Aang: La serie completa Blu-ray". Blu-ray.com . Archivado desde el original el 2020-04-28 . Consultado el 2021-02-24 .

Lectura adicional

"2.5 Manipulación de bytes" (PDF) . Programación con el conjunto de instrucciones PDP-10 (PDF) . Manual de referencia del sistema PDP-10. Vol. 1. Digital Equipment Corporation (DEC). Agosto de 1969. págs. 2-15–2-17. Archivado (PDF) desde el original el 2017-04-05 . Consultado el 2017-04-05 .
Ashley Taylor. "Bits y bytes". Stanford. https://web.stanford.edu/class/cs101/bits-bytes.html