stringtranslate.com

Conversión de datos

La conversión de datos es la conversión de datos informáticos de un formato a otro. En un entorno informático, los datos se codifican de diversas formas. Por ejemplo, el hardware de la computadora se construye sobre la base de ciertos estándares, lo que requiere que los datos contengan, por ejemplo, comprobaciones de bits de paridad . De manera similar, el sistema operativo se basa en ciertos estándares para el manejo de datos y archivos. Además, cada programa informático maneja los datos de forma diferente. Siempre que se cambia cualquiera de estas variables, los datos deben convertirse de alguna manera antes de que puedan ser utilizados por una computadora, sistema operativo o programa diferente. Incluso las diferentes versiones de estos elementos suelen implicar diferentes estructuras de datos. Por ejemplo, el cambio de bits de un formato a otro, normalmente con el fin de interoperabilidad de aplicaciones o de la capacidad de utilizar nuevas funciones, es simplemente una conversión de datos. Las conversiones de datos pueden ser tan simples como la conversión de un archivo de texto de un sistema de codificación de caracteres a otro; o más complejos, como la conversión de formatos de archivos office, o la conversión de formatos de imagen y formatos de archivos de audio .

Hay muchas formas en que se convierten los datos dentro del entorno informático. Esto puede ser sencillo, como en el caso de actualizar a una versión más nueva de un programa informático. Alternativamente, la conversión puede requerir procesamiento mediante el uso de un programa de conversión especial, o puede implicar un proceso complejo que implica pasar por etapas intermedias, o involucrar procedimientos complejos de "exportación" e "importación", que pueden incluir la conversión hacia y desde una pestaña. -Archivo de texto delimitado o separado por comas. En algunos casos, un programa puede reconocer varios formatos de archivos de datos en la etapa de entrada de datos y luego también es capaz de almacenar los datos de salida en varios formatos diferentes. Un programa de este tipo se puede utilizar para convertir un formato de archivo. Si no se reconoce el formato de origen o de destino, en ocasiones puede estar disponible un tercer programa que permite la conversión a un formato intermedio, que luego se puede reformatear con el primer programa. Hay muchos escenarios posibles.

Conceptos básicos de información

Antes de realizar cualquier conversión de datos, el usuario o programador de aplicaciones debe tener en cuenta algunos conceptos básicos de informática y teoría de la información . Éstas incluyen:

Por ejemplo, una imagen en color real se puede convertir fácilmente a escala de grises, mientras que la conversión opuesta es un proceso laborioso. Convertir un archivo de texto Unix a un archivo de texto Microsoft (DOS/Windows) implica agregar caracteres, pero esto no aumenta la entropía ya que está basado en reglas; Mientras que la adición de información de color a una imagen en escala de grises no se puede realizar de manera confiable mediante programación, ya que requiere agregar nueva información, por lo que cualquier intento de agregar color requeriría una estimación por parte de la computadora basada en conocimientos previos. Convertir un PNG de 24 bits a uno de 48 bits no le agrega información, solo rellena los valores de píxeles RGB existentes con ceros [ cita necesaria ] , de modo que un píxel con un valor de FF C3 56, por ejemplo, se convierte en FF00 C300 5600. La conversión permite cambiar un píxel para que tenga un valor de, por ejemplo, FF80 C340 56A0, pero la conversión en sí no hace eso, solo puede realizar una mayor manipulación de la imagen. Convertir una imagen o un archivo de audio en un formato con pérdida (como JPEG o Vorbis ) a un formato sin pérdida (como PNG o FLAC ) o sin comprimir (como BMP o WAV ) sólo desperdicia espacio, ya que la misma imagen con su pérdida de información original (la artefactos de compresión con pérdidas) se convierte en el objetivo. Una imagen JPEG nunca se puede restaurar a la calidad de la imagen original a partir de la cual se creó, sin importar cuánto el usuario pruebe la función " Eliminación de artefactos JPEG " de su programa de manipulación de imágenes.

La restauración automática de información perdida a través de un proceso de compresión con pérdidas probablemente requeriría avances importantes en inteligencia artificial .

Debido a estas realidades de la informática y la teoría de la información, la conversión de datos suele ser un proceso complejo y propenso a errores que requiere la ayuda de expertos.

Conversión fundamental

La conversión de datos puede ocurrir directamente de un formato a otro, pero muchas aplicaciones que convierten entre múltiples formatos utilizan una representación intermedia mediante la cual cualquier formato de origen se convierte a su destino. [1] Por ejemplo, es posible convertir texto cirílico de KOI8-R a Windows-1251 usando una tabla de búsqueda entre las dos codificaciones, pero el enfoque moderno es convertir primero el archivo KOI8-R a Unicode y de ahí a Windows. -1251. Este es un enfoque más manejable; en lugar de necesitar tablas de búsqueda para todos los pares posibles de codificaciones de caracteres, una aplicación solo necesita una tabla de búsqueda para cada conjunto de caracteres, que utiliza para convertir hacia y desde Unicode, reduciendo así el número de tablas de cientos a unas pocas decenas. [ cita necesaria ]

La conversión fundamental se utiliza de manera similar en otras áreas. Las aplicaciones de Office, cuando se emplean para convertir entre formatos de archivos de Office, utilizan su formato de archivo interno predeterminado como pivote. Por ejemplo, un procesador de textos puede convertir un archivo RTF a un archivo WordPerfect convirtiendo el RTF a OpenDocument y luego al formato WordPerfect. Un programa de conversión de imágenes no convierte una imagen PCX a PNG directamente; en cambio, al cargar la imagen PCX, la decodifica en un formato de mapa de bits simple para uso interno en la memoria y, cuando se le ordena convertir a PNG, esa imagen de la memoria se convierte al formato de destino. Un convertidor de audio que convierte de FLAC a AAC decodifica primero el archivo fuente en datos PCM sin procesar en la memoria y luego realiza la compresión AAC con pérdida en esa imagen de memoria para producir el archivo de destino.

Conversión de datos perdida e inexacta

El objetivo de la conversión de datos es mantener todos los datos y la mayor cantidad posible de información incorporada. Esto sólo se puede hacer si el formato de destino admite las mismas características y estructuras de datos presentes en el archivo de origen. La conversión de un documento de procesamiento de textos a un archivo de texto sin formato implica necesariamente la pérdida de información de formato, porque el formato de texto sin formato no admite construcciones de procesamiento de textos como marcar una palabra en negrita. Por este motivo, rara vez se realiza la conversión de un formato a otro que no admita una función importante para el usuario, aunque puede ser necesaria para la interoperabilidad, por ejemplo, convertir un archivo de una versión de Microsoft Word a una versión anterior a otra. permitir la transferencia y el uso por parte de otros usuarios que no tengan la misma versión posterior de Word instalada en su computadora.

La pérdida de información se puede mitigar mediante la aproximación en el formato de destino. No hay forma de convertir un carácter como ä a ASCII , ya que el estándar ASCII carece de él, pero la información se puede conservar aproximando el carácter como ae . Por supuesto, esta no es una solución óptima y puede afectar operaciones como buscar y copiar; y si un idioma hace una distinción entre ä y ae , entonces esa aproximación implica pérdida de información.

La conversión de datos también puede verse afectada por la inexactitud, resultado de la conversión entre formatos que son conceptualmente diferentes. El paradigma WYSIWYG , existente en procesadores de texto y aplicaciones de autoedición , versus el paradigma estructural-descriptivo, que se encuentra en SGML , XML y muchas aplicaciones derivadas de ellos, como HTML y MathML , es un ejemplo. El uso de un editor HTML WYSIWYG combina los dos paradigmas y el resultado son archivos HTML con código subóptimo, si no no estándar. En el paradigma WYSIWYG, un doble salto de línea significa un nuevo párrafo, ya que esa es la señal visual para dicha construcción, pero un editor HTML WYSIWYG generalmente convertirá dicha secuencia a <BR><BR>, que estructuralmente no es ningún párrafo nuevo. . Como otro ejemplo, convertir de PDF a un formato de procesador de texto editable es una tarea difícil, porque PDF registra la información textual como si fuera un grabado en piedra, con cada carácter asignado a una posición fija y saltos de línea codificados, mientras que los formatos de procesador de texto se adaptan al reflujo de texto. PDF no conoce ningún carácter de espacio de palabra: el espacio entre dos letras y el espacio entre dos palabras difieren sólo en la cantidad. Por lo tanto, un título con amplio espacio entre letras para lograr efecto normalmente terminará con espacios en el archivo del procesador de textos, por ejemplo INTRODUCCIÓN con un espacio de 1 em como INTRODUCCIÓN en el procesador de textos.

Especificaciones abiertas versus secretas

La conversión de datos exitosa requiere un conocimiento profundo del funcionamiento de los formatos de origen y de destino. En el caso de que se desconozca la especificación de un formato, será necesaria ingeniería inversa para realizar la conversión. La ingeniería inversa puede lograr una gran aproximación a las especificaciones originales, pero aún así pueden producirse errores y características faltantes.

Electrónica

La conversión de formato de datos también puede ocurrir en la capa física de un sistema de comunicación electrónica. La conversión entre códigos de línea como NRZ y RZ se puede realizar cuando sea necesario.

Ver también

Referencias

  1. ^ Dragos-Anton Manolescu; Markus Völter; James noble (2006). Lenguajes de patrones de diseño de programas 5. Addison-Wesley Professional. págs. 271–. ISBN 978-0-321-32194-7.

Manolescu, Nombre (2006). Lenguajes de patrones de diseño de programas 5 . Upper Saddle River, Nueva Jersey: Addison-Wesley. ISBN 0321321944.