Una imagen binaria es una imagen digital que consta de píxeles que pueden tener uno de exactamente dos colores, normalmente blanco y negro. Cada píxel se almacena como un único bit , es decir, un 0 o un 1.
Una imagen binaria se puede almacenar en la memoria como un mapa de bits : una matriz compacta de bits. Una imagen binaria de 640×480 píxeles tiene un tamaño de archivo de solo 37,5 KiB y la mayoría también se comprime bien con una compresión simple de longitud de ejecución . Un formato de imagen binaria se usa a menudo en contextos en los que es importante tener un tamaño de archivo pequeño para transmisión o almacenamiento, o debido a limitaciones de color en pantallas o impresoras.
También tiene aplicaciones técnicas y artísticas, por ejemplo, en el procesamiento de imágenes digitales y el pixel art . Las imágenes binarias pueden interpretarse como subconjuntos de la red entera bidimensional Z 2 ; el campo del procesamiento de imágenes morfológicas se inspiró en gran medida en esta visión. [ aclaración necesaria ]
Las imágenes binarias también se denominan bi-nivel o de dos niveles . El pixel art compuesto por dos colores se suele denominar de 1 bit en referencia al bit único necesario para almacenar cada píxel. [2] Los nombres blanco y negro , B&W , monocromo o monocromático se utilizan a menudo, pero también pueden designar otros tipos de imágenes con solo una muestra por píxel, como las imágenes en escala de grises . En el lenguaje de Photoshop , una imagen binaria es lo mismo que una imagen en modo de color "mapa de bits". [3] [4]
Una clase completa de operaciones [ aclaración necesaria ] sobre imágenes binarias opera sobre una ventana 3×3 de la imagen. Esta contiene nueve píxeles, por lo que hay 29 o 512 valores posibles. Considerando solo el píxel central, es posible definir si permanece fijo o no, en función de los píxeles circundantes. Ejemplos de tales operaciones son el adelgazamiento, la dilatación, la búsqueda de puntos de ramificación y puntos finales, la eliminación de píxeles aislados, el desplazamiento de la imagen un píxel en cualquier dirección y la ruptura de conexiones H. El Juego de la vida de Conway también es un ejemplo de una operación de ventana 3×3.
Otra clase de operaciones se basa en la noción de filtrado con un elemento estructurante. El elemento estructurante es una imagen binaria, normalmente pequeña, que se pasa sobre la imagen de destino, de forma similar a un filtro en el procesamiento de imágenes en escala de grises. Dado que los píxeles solo pueden tener dos valores, las operaciones morfológicas son la erosión (cualquier píxel no definido dentro del elemento estructurante hace que el píxel no definido) y la dilatación (cualquier píxel definido dentro del elemento estructurante hace que el píxel definido). Las operaciones importantes son la apertura morfológica y el cierre morfológico , que consisten en erosión seguida de dilatación y dilatación seguida de erosión, respectivamente, utilizando el mismo elemento estructurante. La apertura tiende a agrandar agujeros pequeños, eliminar objetos pequeños y separar objetos. El cierre retiene objetos pequeños, elimina agujeros y une objetos.
Una característica muy importante de una imagen binaria es la transformada de distancia . Esta proporciona la distancia de cada píxel establecido con respecto al píxel no establecido más cercano. La transformada de distancia se puede calcular de manera eficiente. Permite el cálculo eficiente de diagramas de Voronoi , donde cada píxel de una imagen se asigna al más cercano de un conjunto de puntos. También permite la esqueletización, que se diferencia del adelgazamiento en que los esqueletos permiten recuperar la imagen original. La transformada de distancia también es útil para determinar el centro del objeto y para la coincidencia en el reconocimiento de imágenes.
Otra clase de operaciones es la recopilación de métricas independientes de la orientación. Esto suele ser importante en el reconocimiento de imágenes, donde es necesario eliminar la orientación de la cámara. Las métricas independientes de la orientación de un grupo de píxeles conectados o rodeados incluyen el número de Euler , el perímetro, el área, la compacidad, el área de los agujeros, el radio mínimo y el radio máximo.
Las imágenes binarias se generan a partir de imágenes en color mediante segmentación . La segmentación es el proceso de asignar cada píxel de la imagen de origen a dos o más clases. Si hay más de dos clases, el resultado habitual son varias imágenes binarias. La forma más sencilla de segmentación es probablemente el método de Otsu , que asigna píxeles al primer plano o al fondo en función de la intensidad de la escala de grises. Otro método es el algoritmo de cuenca hidrográfica . La detección de bordes también suele crear una imagen binaria con algunos píxeles asignados a los píxeles de los bordes, y también es un primer paso en una segmentación posterior.
El adelgazamiento o esqueletización produce imágenes binarias que consisten en líneas del ancho de un píxel. Luego se pueden extraer los puntos de ramificación y los puntos finales y convertir la imagen en un gráfico. Esto es importante en el reconocimiento de imágenes, por ejemplo, en el reconocimiento óptico de caracteres .
La interpretación del valor binario del píxel también depende del dispositivo. Algunos sistemas interpretan el valor de bit 0 como negro y 1 como blanco, mientras que otros invierten el significado de los valores. En la interfaz de PC estándar TWAIN para escáneres y cámaras digitales , el primer sabor se llama vainilla y el invertido chocolate .
El tramado se utiliza a menudo para mostrar [ necesita contexto ] imágenes de medios tonos . [5]
El pixelart binario , más conocido como 1-Bit o 1bit art, ha sido un método de visualización de gráficos desde los primeros ordenadores. Si bien los primeros ordenadores como el ZX81 utilizaban la restricción como una necesidad del hardware, los juegos LCD portátiles como Game & Watch y Tamagotchi , junto con los primeros ordenadores con un enfoque en las interfaces gráficas de usuario como el Macintosh, dieron grandes pasos en la promoción de la cultura, la técnica y la estética de las restricciones del arte de 1 bit. [6]
Los ejemplos modernos de arte de 1 bit son visibles en los videojuegos independientes y otro arte digital. [7] Los juegos más vendidos como Gato Roboto , Return of the Obra Dinn , Minit y World of Horror usan 1 bit como estilo para darle a sus juegos un toque retro [8] o simplemente para ahorrarles tiempo a los diseñadores gráficos en el desarrollo. [9] Incluso hay nuevo hardware de 1 bit en desarrollo, como la consola portátil experimental Playdate . [10]
Para los artistas de pixel art, 1 bit se ha convertido en un desafío común para crear arte. El concurso de pixel art Pixtogether requirió que sus participantes usaran solo dos colores para su décimo concurso mensual. [11] No muchos artistas se dedican principalmente a arte de 1 bit, pero muchos de ellos se mantienen en contacto entre sí para intercambiar conocimientos sobre cómo trabajar con la restricción y organizar sus propias colaboraciones. [12]
Brandon James Greer, que hace tutoriales populares en YouTube [13] [14] sobre 1bit y otras ilustraciones de píxeles, dice que "la restricción lleva a algunos enfoques únicos" y que trabajar en 1-Bit es "un desafío muy divertido y único". [15]
Si bien 1bit puede considerarse un estilo artístico en sí mismo, cada pieza también se enmarca en un segundo estilo. Las diferencias obvias en los estilos artísticos de 1bit son, por ejemplo, si se utiliza tramado , en qué cantidad y de qué tipo, la resolución de la imagen , el uso de contornos y el nivel de detalle de la obra de arte.
Algunos dispositivos de entrada/salida, como impresoras láser , máquinas de fax y pantallas de computadora de dos niveles , solo pueden manejar imágenes binarias.
En 1999, el Foro de Protocolo de Aplicaciones Inalámbricas introdujo el estándar para el formato de archivo .wbmp (mapa de bits inalámbrico) como parte de los estándares para mostrar páginas WAP . [16]
En 1994, Moni Naor y Adi Shamir demostraron un esquema de compartición de secretos visuales , en el que una imagen binaria se dividía en n partes de modo que solo alguien con todas las n partes pudiera descifrar la imagen, mientras que las n − 1 partes no revelaban información sobre la imagen original. Cada parte se imprimía en una transparencia separada y el descifrado se realizaba superponiendo las partes. [17] Cuando se superponían las n partes, aparecía la imagen original. Hay varias generalizaciones del esquema básico, incluida la criptografía visual k de n , [18] [19] y el uso de láminas opacas pero iluminándolas con múltiples conjuntos de patrones de iluminación idénticos bajo el registro de un solo detector de un solo píxel. [20]
Las imágenes binarias a menudo surgen en el procesamiento de imágenes digitales de imágenes más complejas, en forma de máscaras , como resultado del umbralizado y para su uso en el tramado .
Un sensor de imagen binario sobremuestreado es un sensor de imagen digital que recuerda a la película fotográfica tradicional. Cada píxel del sensor tiene una respuesta binaria, que proporciona una medición cuantificada de solo un bit de la intensidad de la luz local.