La transcripción, en el sentido lingüístico , es la representación sistemática del lenguaje hablado en forma escrita . La fuente puede ser un enunciado ( hablado o en lenguaje de señas ) o un texto preexistente en otro sistema de escritura .
La transcripción no debe confundirse con la traducción , que significa representar el significado de un texto de un idioma de origen en un idioma de destino (por ejemplo, Los Ángeles (del español como idioma de origen) significa Los Ángeles en el inglés como idioma de destino); o con la transliteración , que significa representar la ortografía de un texto de una escritura a otra.
En la disciplina académica de la lingüística , la transcripción es una parte esencial de las metodologías de (entre otras) la fonética , el análisis de la conversación , la dialectología y la sociolingüística . También desempeña un papel importante en varios subcampos de la tecnología del habla . Ejemplos comunes de transcripciones fuera del ámbito académico son las actas de una audiencia judicial , como un juicio penal (a cargo de un taquígrafo judicial ) o las notas de voz grabadas de un médico ( transcripción médica ). Este artículo se centra en la transcripción en lingüística.
Existen dos tipos principales de transcripción lingüística. La transcripción fonética se centra en las propiedades fonéticas y fonológicas del lenguaje hablado. Los sistemas de transcripción fonética proporcionan reglas para asignar sonidos individuales o fonemas a símbolos escritos. Los sistemas de transcripción ortográfica , por el contrario, consisten en reglas para asignar palabras habladas a formas escritas según lo prescrito por la ortografía de un idioma determinado. La transcripción fonética opera con conjuntos de caracteres especialmente definidos, normalmente el Alfabeto Fonético Internacional .
El tipo de transcripción elegido depende principalmente del contexto de uso. Dado que la transcripción fonética pone de relieve estrictamente la naturaleza fonética del lenguaje, se utiliza principalmente para análisis fonéticos o fonológicos. Sin embargo, la transcripción ortográfica tiene un componente morfológico y otro léxico junto con el componente fonético (el aspecto que se representa en qué grado depende del idioma y la ortografía en cuestión). Por lo tanto, esta forma de transcripción es más conveniente cuando se transcriben aspectos semánticos del lenguaje hablado. La transcripción fonética es más sistemática en un sentido científico, pero también es más difícil de aprender, requiere más tiempo para realizarla y su aplicación es menos amplia que la transcripción ortográfica.
La conversión del lenguaje hablado en símbolos escritos no es un proceso tan sencillo como puede parecer a primera vista. El lenguaje escrito es una idealización, formada por un conjunto limitado de símbolos claramente diferenciados y discretos. El lenguaje hablado, por otra parte, es un fenómeno continuo (en contraposición a discreto), formado por un número potencialmente ilimitado de componentes. No existe un sistema predeterminado para distinguir y clasificar estos componentes y, en consecuencia, no hay una forma preestablecida de convertirlos en símbolos escritos.
La literatura es relativamente consistente al señalar la no neutralidad de las prácticas de transcripción. No existe ni puede existir un sistema de transcripción neutral. El conocimiento de la cultura social entra directamente en la elaboración de una transcripción y queda plasmado en la textura de la transcripción (Baker, 2005).
Los sistemas de transcripción son conjuntos de reglas que definen cómo debe representarse el lenguaje hablado en símbolos escritos. La mayoría de los sistemas de transcripción fonética se basan en el Alfabeto Fonético Internacional o, especialmente en tecnología del habla, en su derivado SAMPA .
Algunos ejemplos de sistemas de transcripción ortográfica (todos del campo del análisis de conversaciones o campos relacionados) son:
Se podría decir que es el primer sistema de este tipo, originalmente esbozado en (Sacks et al. 1978), posteriormente adaptado para su uso en corpus legibles por computadora como CA-CHAT por (MacWhinney 2000). El campo del análisis de conversaciones en sí incluye una serie de enfoques distintos para la transcripción y conjuntos de convenciones de transcripción. Estos incluyen, entre otros, la notación de Jefferson. Para analizar la conversación, los datos registrados se transcriben típicamente a una forma escrita que sea aceptable para los analistas. Hay dos enfoques comunes. El primero, llamado transcripción restringida, captura los detalles de la interacción conversacional, como qué palabras en particular se enfatizan, qué palabras se dicen con mayor volumen, puntos en los que se superponen los turnos de conversación, cómo se articulan palabras particulares, etc. Si ese detalle es menos importante, tal vez porque el analista está más preocupado por la estructura general bruta de la conversación o la distribución relativa de los turnos de conversación entre los participantes, entonces un segundo tipo de transcripción conocida como transcripción amplia puede ser suficiente (Williamson, 2009).
El sistema de transcripción de Jefferson es un conjunto de símbolos, desarrollado por Gail Jefferson , que se utiliza para transcribir el habla. Habiendo tenido alguna experiencia previa en transcripción cuando fue contratada en 1963 como mecanógrafa en el Departamento de Salud Pública de la UCLA para transcribir sesiones de entrenamiento de sensibilidad para guardias de prisión, Jefferson comenzó a transcribir algunas de las grabaciones que sirvieron como materiales a partir de los cuales se desarrollaron las primeras conferencias de Harvey Sacks. Durante más de cuatro décadas, durante la mayor parte de las cuales no ocupó ningún puesto universitario y no recibió salario, la investigación de Jefferson sobre el habla en interacción ha establecido el estándar para lo que se conoció como análisis de la conversación (AC). Su trabajo ha influido enormemente en el estudio sociológico de la interacción, pero también en disciplinas más allá, especialmente la lingüística, la comunicación y la antropología. [1] Este sistema es empleado universalmente por quienes trabajan desde la perspectiva del AC y se considera que se ha convertido en un conjunto casi globalizado de instrucciones para la transcripción. [2]
Un sistema descrito en (DuBois et al. 1992), utilizado para la transcripción del Corpus de Santa Bárbara del inglés americano hablado (SBCSAE), que posteriormente se desarrolló hasta convertirse en DT2 .
Un sistema descrito en (Selting et al. 1998), desarrollado posteriormente hasta convertirse en GAT2 (Selting et al. 2009), ampliamente utilizado en países de habla alemana para el análisis de conversaciones orientado a la prosodia y la lingüística interaccional. [3] [4]
Podría decirse que es el primer sistema de su tipo, descrito originalmente en (Ehlich y Rehbein 1976) –ver (Ehlich 1992) para una referencia en inglés– adaptado para su uso en corpus legibles por computadora como (Rehbein et al. 2004), y ampliamente utilizado en pragmática funcional . [5] [6] [7]
La transcripción era originalmente un proceso que se llevaba a cabo de forma manual, es decir, con lápiz y papel, utilizando una grabación de sonido analógica almacenada, por ejemplo, en un casete compacto. Hoy en día, la mayor parte de la transcripción se realiza en computadoras. Las grabaciones suelen ser archivos de audio o de vídeo digitales , y las transcripciones son documentos electrónicos . Existe un software informático especializado para ayudar al transcriptor a crear de forma eficiente una transcripción digital a partir de una grabación digital.
Se pueden utilizar dos tipos de software de transcripción para facilitar el proceso de transcripción: uno que facilita la transcripción manual y otro, la transcripción automatizada. En el primero, el trabajo sigue siendo realizado en gran medida por un transcriptor humano que escucha una grabación y escribe lo que se escucha en una computadora; este tipo de software suele ser un reproductor multimedia con funciones como reproducción o cambio de velocidad. En el segundo, la transcripción automatizada se logra mediante un motor de voz a texto que convierte archivos de audio o video en texto electrónico. Algunos de los programas también incluirían la función de anotación . [8]
{{cite web}}
: CS1 maint: unfit URL (link)