stringtranslate.com

Corpus del habla

Un corpus de voz (o corpus hablado ) es una base de datos de archivos de audio de voz y transcripciones de texto . En tecnología del habla , los corpus de voz se utilizan, entre otras cosas, para crear modelos acústicos (que luego pueden usarse con un motor de reconocimiento de voz o de identificación de locutor ). [1] En lingüística , los corpus hablados se utilizan para realizar investigaciones en fonética , análisis de conversaciones , dialectología y otros campos. [2] [3]

Un corpus es una de esas bases de datos. Corpora es el plural de corpus (es decir, hay muchas bases de datos de este tipo).

Hay dos tipos de corpus de habla:

  1. Leer discurso, que incluye:
    • Extractos de libros
    • noticias transmitidas
    • Listas de palabras
    • secuencias de numeros
  2. Habla espontánea – que incluye:
    • Diálogos – entre dos o más personas (incluye reuniones; uno de esos corpus es el KEC);
    • Narrativas: una persona que cuenta una historia (uno de esos corpus es el Buckeye Corpus );
    • Tareas de mapas: una persona explica una ruta en un mapa a otra;
    • Tareas de cita: dos personas intentan encontrar un horario de reunión común basándose en horarios individuales.

Un tipo especial de corpus de voz son las bases de datos de voz no nativas que contienen voz con acento extranjero.

Ver también

Referencias

  1. ^ Sarangi, Susanta; Sahidullah, Maryland; Saha, Goutam (septiembre de 2020). "Optimización del banco de filtros basado en datos para la verificación automática de hablantes". Procesamiento de señales digitales . 104 : 102795. arXiv : 2007.10729 . Código Bib : 2020DSP...10402795S. doi : 10.1016/j.dsp.2020.102795. S2CID  220665533.
  2. ^ Reece, Andrés; Cooney, Gus; Toro, Pedro; Chung, Cristina; Dawson, Bryn; Fitzpatrick, Casey; Glazer, Tamara; Knox, decano; Liebscher, Alex; Marín, Sebastián (01/03/2022). "Avanzando en una ciencia interdisciplinaria de la conversación: conocimientos de un gran corpus multimodal del habla humana". arXiv : 2203.00674 [cs.CL].
  3. ^ "Corpus de inglés americano hablado de Santa Bárbara | Departamento de Lingüística - UC Santa Bárbara". www.linguistics.ucsb.edu . Consultado el 26 de abril de 2023 .

Enlaces externos