stringtranslate.com

Valores separados por tabulaciones

Los valores separados por tabulaciones ( TSV ) es un formato de archivo simple basado en texto para almacenar datos tabulares . [3] Los registros están separados por nuevas líneas y los valores dentro de un registro están separados por caracteres de tabulación . El formato TSV es, por tanto, un formato de valores separados por delimitadores , similar a los valores separados por comas .

TSV es un formato de archivo simple que cuenta con un amplio soporte, por lo que a menudo se utiliza en el intercambio de datos para mover datos tabulares entre diferentes programas informáticos que admiten el formato. Por ejemplo, un archivo TSV podría usarse para transferir información de una base de datos a una hoja de cálculo .

Ejemplo

El encabezado del conjunto de datos de la flor Iris se puede almacenar como un TSV usando el siguiente texto sin formato (tenga en cuenta que la representación HTML puede convertir tabulaciones en espacios):

Longitud del sépalo Ancho del sépalo Longitud del pétalo Ancho del pétalo Especie5,1 3,5 1,4 0,2 I. setosa4,9 3,0 1,4 0,2 I. setosa4,7 3,2 1,3 0,2 I. setosa4,6 3,1 1,5 0,2 I. setosa5,0 3,6 1,4 0,2 I. setosa

El texto sin formato TSV anterior corresponde a los siguientes datos tabulares:

personaje escapando

El estándar de tipo de medios de la IANA para TSV logra simplicidad al simplemente no permitir pestañas dentro de los campos. [4]

Dado que los valores en formato TSV no pueden contener tabulaciones literales ni caracteres de nueva línea , es necesaria una convención para la conversión sin pérdidas de valores de texto con estos caracteres. Una convención común es realizar los siguientes escapes : [5] [6]

Otra convención común es utilizar la convención CSV de RFC  4180 y encerrar los valores que contienen tabulaciones o nuevas líneas entre comillas dobles. Esto puede dar lugar a ambigüedades. [7] [8]

Finales de línea

Los registros suelen estar separados por un avance de línea, como es típico en las plataformas Unix, o un retorno de carro y un avance de línea, como es típico en las plataformas Microsoft. Algunos programas pueden esperar lo último. La especificación de facto [9] especifica que los registros están separados por un EOL , pero no especifica ninguna nueva línea específica .

Ver también

Referencias

  1. ^ Universidad de Edin. Equipo de soporte de datos de investigación. "Elija los mejores formatos de archivo". Universidad de Edimburgo. § Formatos que recomendamos . Consultado el 23 de mayo de 2023 .
  2. ^ ab "pestañaTextoSeparado". Documentación para desarrolladores de Apple: identificadores de tipo uniforme . Apple Inc . Consultado el 23 de mayo de 2023 .
  3. ^ "Cómo utilizar archivos de valores separados por tabulaciones (TSV)". Fondo Monetario Internacional . Consultado el 1 de febrero de 2023 .
  4. ^ Lindner 1993.
  5. ^ Dusek, Jason (6 de mayo de 2014). "TSV lineal: datos tabulares simples, orientados a líneas". Protocolos de datos: Open Knowledge Foundation (v1.0β ed.).
  6. ^ Dolan, Stephen (1 de noviembre de 2018). "Manual jq". jq . Consultado el 23 de mayo de 2023 .
  7. ^ Miller, Rob (22 de septiembre de 2015). Procesamiento de texto con Ruby: extraiga valor de los datos que le rodean. Estantería pragmática. pag. 94.ISBN 978-1-68050-492-7.
  8. ^ Giuseppini, Gabriele; Burnett, Mark (10 de febrero de 2005). Microsoft Log Parser Toolkit: un conjunto de herramientas completo para la herramienta de análisis de registros no documentados de Microsoft. Elsevier. pag. 311.ISBN 978-0-08-048939-1.
  9. ^ "IANA: texto/valores separados por tabulaciones".

Fuentes

Otras lecturas