Los valores separados por tabulaciones ( TSV ) es un formato de archivo simple basado en texto para almacenar datos tabulares . [3] Los registros están separados por nuevas líneas y los valores dentro de un registro están separados por caracteres de tabulación . El formato TSV es, por tanto, un formato de valores separados por delimitadores , similar a los valores separados por comas .
TSV es un formato de archivo simple que cuenta con un amplio soporte, por lo que a menudo se utiliza en el intercambio de datos para mover datos tabulares entre diferentes programas informáticos que admiten el formato. Por ejemplo, un archivo TSV podría usarse para transferir información de una base de datos a una hoja de cálculo .
El encabezado del conjunto de datos de la flor Iris se puede almacenar como un TSV usando el siguiente texto sin formato (tenga en cuenta que la representación HTML puede convertir tabulaciones en espacios):
Longitud del sépalo Ancho del sépalo Longitud del pétalo Ancho del pétalo Especie5,1 3,5 1,4 0,2 I. setosa4,9 3,0 1,4 0,2 I. setosa4,7 3,2 1,3 0,2 I. setosa4,6 3,1 1,5 0,2 I. setosa5,0 3,6 1,4 0,2 I. setosa
El texto sin formato TSV anterior corresponde a los siguientes datos tabulares:
El estándar de tipo de medios de la IANA para TSV logra simplicidad al simplemente no permitir pestañas dentro de los campos. [4]
Dado que los valores en formato TSV no pueden contener tabulaciones literales ni caracteres de nueva línea , es necesaria una convención para la conversión sin pérdidas de valores de texto con estos caracteres. Una convención común es realizar los siguientes escapes : [5] [6]
Otra convención común es utilizar la convención CSV de RFC 4180 y encerrar los valores que contienen tabulaciones o nuevas líneas entre comillas dobles. Esto puede dar lugar a ambigüedades. [7] [8]
Los registros suelen estar separados por un avance de línea, como es típico en las plataformas Unix, o un retorno de carro y un avance de línea, como es típico en las plataformas Microsoft. Algunos programas pueden esperar lo último. La especificación de facto [9] especifica que los registros están separados por un EOL , pero no especifica ninguna nueva línea específica .
{{cite book}}
: |work=
ignorado ( ayuda )