El índice de transmisión del habla (STI) es una medida de la calidad de la transmisión del habla. La medición absoluta de la inteligibilidad del habla es una ciencia compleja. El STI mide algunas características físicas de un canal de transmisión (una sala, un equipo electroacústico, una línea telefónica, etc.) y expresa la capacidad del canal para transmitir las características de una señal de voz. El STI es un predictor objetivo de medición bien establecido de cómo las características del canal de transmisión afectan la inteligibilidad del habla.
La influencia [1] que tiene un canal de transmisión sobre la inteligibilidad del habla depende de:
El STI fue introducido por Tammo Houtgast y Herman Steeneken en 1971, [2] y fue aceptado por la Sociedad Acústica de Estados Unidos en 1980. [3] Steeneken y Houtgast decidieron desarrollar el Índice de Transmisión del Habla porque se les había encomendado realizar una serie muy larga de tediosas mediciones de inteligibilidad del habla para las Fuerzas Armadas de los Países Bajos. En lugar de ello, dedicaron tiempo a desarrollar un método objetivo mucho más rápido (que en realidad fue el predecesor del STI). [4]
Houtgast y Steeneken desarrollaron el Índice de Transmisión del Habla mientras trabajaban en la Organización Holandesa de Investigación Científica Aplicada (TNO). Su equipo en TNO siguió apoyando y desarrollando el STI, mejorando el modelo y desarrollando hardware y software para medir el STI, hasta 2010. Ese año, el grupo de investigación de TNO responsable del STI se separó de TNO y continuó su trabajo como una empresa privada llamada Embedded Acoustics. Embedded Acoustics ahora continúa apoyando el desarrollo del STI, con Herman Steeneken (ahora oficialmente retirado de TNO) todavía actuando como consultor senior.
En los primeros años (hasta aproximadamente 1985) el uso del STI se limitaba en gran medida a una comunidad internacional relativamente pequeña de investigadores del habla. La introducción del RASTI (" Room Acoustics STI ") hizo que el método STI estuviera disponible para una población más grande de ingenieros y consultores, especialmente cuando Bruel & Kjaer presentó su dispositivo de medición RASTI (que se basaba en el sistema RASTI anterior desarrollado por Steeneken y Houtgast en TNO). RASTI fue diseñado para ser mucho más rápido que el STI original ("completo"), tomando menos de 30 segundos en lugar de 15 minutos para un punto de medición. Sin embargo, RASTI solo estaba destinado (como lo indica el nombre) para la acústica de salas pura, no para la electroacústica. La aplicación de RASTI a cadenas de transmisión con componentes electroacústicos (como altavoces y micrófonos) se volvió bastante común y dio lugar a quejas sobre resultados inexactos. El uso de RASTI incluso fue especificado por algunas normas de aplicación (como la especificación 15 de la CAA para sistemas de megafonía de cabina de aeronaves) para aplicaciones con electroacústica, simplemente porque era el único método viable en ese momento. Las deficiencias de RASTI a veces simplemente se aceptaron por falta de una mejor alternativa. TNO produjo y vendió instrumentos para medir STI completo y varios otros derivados de STI, pero estos dispositivos eran relativamente caros, grandes y pesados.
Alrededor del año 2000, la necesidad de una alternativa a RASTI que también pudiera aplicarse de forma segura a los sistemas de megafonía (PA) se hizo plenamente evidente. En TNO, Jan Verhave y Herman Steeneken comenzaron a trabajar en un nuevo método STI, que más tarde se conocería como STIPA ( STI for Public Address Systems ). El primer dispositivo que incluía mediciones STIPA disponibles para la venta al público en general fue fabricado por Gold-Line. En ese momento, los instrumentos de medición STIPA están disponibles de varios fabricantes.
La RASTI se estandarizó internacionalmente en 1988, en la norma IEC-60268-16. Desde entonces, la norma IEC-60268-16 se ha revisado tres veces; la última revisión (rev. 4) apareció en 2011. Cada revisión incluía actualizaciones de la metodología STI que se habían aceptado en la comunidad de investigación de STI con el tiempo, como la inclusión de redundancia entre bandas de octavas adyacentes (rev. 2), enmascaramiento auditivo dependiente del nivel (rev. 3) y varios métodos para aplicar la STI a poblaciones específicas, como no nativos y personas con discapacidad auditiva (rev. 4). Un equipo de mantenimiento de IEC está trabajando actualmente en la rev. 5.
La IEC declaró obsoleta la RASTI en junio de 2011, con la aparición de la rev. 4 de la IEC-602682-16. En ese momento, esta derivada simplificada de la STI todavía se estipulaba como método estándar en algunas industrias. Ahora, la STIPA se considera la sucesora de la RASTI para casi todas las aplicaciones.
STI es una medida de representación numérica de las características del canal de comunicación cuyo valor varía de 0 = malo a 1 = excelente. [5] En esta escala, un STI de al menos 0,5 es deseable para la mayoría de las aplicaciones.
Barnett (1995, [6] 1999 [7] ) propuso utilizar una escala de referencia, la Escala de Inteligibilidad Común ( CIS ) , basada en una relación matemática con STI (CIS = 1 + log (STI)).
La STI predice la probabilidad de comprensión de sílabas, palabras y oraciones. Por ejemplo, para hablantes nativos, esta probabilidad viene dada por:
Si están involucrados hablantes no nativos, personas con trastornos del habla o personas con dificultades auditivas, existen otras probabilidades.
Es interesante, pero no sorprendente, que la predicción de STI sea independiente del idioma hablado (lo cual no es sorprendente, ya que se mide la capacidad del canal para transportar patrones del habla física).
Se define otro método para calcular una medida física que está altamente correlacionada con la inteligibilidad del habla, evaluada mediante pruebas de percepción del habla con un grupo de hablantes y oyentes. Esta medida se denomina Índice de inteligibilidad del habla o SII . [ 8]
La norma IEC 60268-16 ed4 2011 define una escala de calificación para brindar flexibilidad a diferentes aplicaciones. Los valores de esta escala alfa van desde “U” hasta “A+”. [9]
El STI ha ganado aceptación internacional como cuantificador de la influencia del canal en la inteligibilidad del habla. La clasificación objetiva de la inteligibilidad del habla por índice de transmisión del habla de la Comisión Electrotécnica Internacional, [9] preparada por el Comité Técnico TC 100 , define el estándar internacional.
Además, las siguientes normas han integrado, como parte de los requisitos que deben cumplirse, la prueba del STI y la realización de un índice mínimo de transmisión de voz:
STIPA ( Índice de transmisión de voz para sistemas de megafonía ) es una versión del STI que utiliza un método simplificado y una señal de prueba. Dentro de la señal STIPA, cada banda de octava se modula simultáneamente con dos frecuencias de modulación. Las frecuencias de modulación se distribuyen entre las bandas de octava de forma equilibrada, lo que permite obtener una medición fiable del STI basada en una matriz de función de transferencia de modulación escasamente muestreada. Aunque inicialmente se diseñó para sistemas de megafonía (e instalaciones similares, como sistemas de evacuación por voz y sistemas de notificación masiva), el STIPA también se puede utilizar para una variedad de otras aplicaciones. La única situación en la que el RASTI se considera actualmente inferior al STI completo es en presencia de ecos fuertes.
Una sola medición STIPA generalmente demora entre 15 y 25 segundos, combinando la velocidad de RASTI con el (casi) amplio alcance de aplicabilidad y confiabilidad del STI completo.
Dado que STIPA se ha vuelto ampliamente disponible, y dado que RASTI tiene varias desventajas y ningún beneficio sobre STIPA, RASTI ahora se considera obsoleto.
Aunque la señal de prueba STIPA no se parece al habla para el oído humano, en términos de contenido de frecuencia así como de fluctuaciones de intensidad es una señal con características similares al habla.
El habla puede describirse como ruido cuya intensidad es modulada por señales de baja frecuencia. La señal STIPA contiene dichas modulaciones de intensidad en 14 frecuencias de modulación diferentes, distribuidas en 7 bandas de octava. En el extremo receptor del sistema de comunicación, se mide la profundidad de modulación de la señal recibida y se compara con la de la señal de prueba en cada una de varias bandas de frecuencia. Las reducciones en la profundidad de modulación están asociadas con la pérdida de inteligibilidad.
Un método alternativo de respuesta al impulso , también conocido como "método indirecto", supone que el canal es lineal y requiere una sincronización más estricta de la fuente de sonido con el instrumento de medición. El principal beneficio del método indirecto sobre el método directo (basado en señales de prueba moduladas) es que se mide la matriz MTF completa, cubriendo todas las frecuencias de modulación relevantes en todas las bandas de octava. En espacios muy grandes (como catedrales), donde es probable que se produzcan ecos, el método indirecto suele preferirse al método directo (por ejemplo, utilizando señales STIPA moduladas). En general, el método indirecto suele ser la mejor opción cuando se estudia la inteligibilidad del habla basándose en la "acústica pura de la sala", cuando no hay componentes electroacústicos presentes dentro de la ruta de transmisión.
Sin embargo, el requisito de que el canal debe ser lineal implica que el método indirecto no se puede utilizar de forma fiable en muchas aplicaciones de la vida real: siempre que la cadena de transmisión incluya componentes que puedan presentar un comportamiento no lineal (como altavoces), las mediciones indirectas pueden arrojar resultados incorrectos. Además, dependiendo del tipo de medición de respuesta al impulso que se utilice, la influencia del ruido de fondo presente durante las mediciones puede no tratarse correctamente. Esto significa que el método indirecto sólo debe utilizarse con mucho cuidado al medir sistemas de megafonía y sistemas de evacuación por voz. La norma IEC-60268-16 rev. 4 no prohíbe el método indirecto para dichas aplicaciones, pero emite las siguientes palabras de advertencia: "Por lo tanto, se requiere un análisis crítico de cómo se obtiene la respuesta al impulso y cómo puede verse influenciada por no linealidades en el sistema de transmisión, especialmente porque en la práctica, los componentes del sistema pueden funcionar en los límites de su rango de rendimiento". En la práctica, la verificación de la validez del supuesto de linealidad suele ser demasiado compleja para el uso diario, lo que hace que el método STIPA (directo) sea el método preferido siempre que se trate de altavoces.
Aunque muchas herramientas de medición basadas en el método indirecto ofrecen opciones STIPA y "STI completo", la matriz de función de transferencia de modulación dispersa inherente a STIPA no ofrece ventajas cuando se utiliza el método indirecto. Las mediciones STIPA basadas en la respuesta al impulso no deben confundirse con las mediciones STIPA directas, ya que la validez del resultado aún depende de si el canal es lineal o no.
Los instrumentos de medición de STI son (y han sido) fabricados por varios fabricantes. A continuación se muestra una lista de marcas bajo las que se han vendido instrumentos de medición de STI, en orden alfabético.
El mercado de soluciones de medición de STI aún está en desarrollo, por lo que la lista anterior está sujeta a cambios a medida que los fabricantes ingresen o abandonen el mercado. La lista no incluye a los productores de software que producen software de medición y simulación acústica con capacidad STI. Las aplicaciones móviles para mediciones STIPA (como las que venden Studio Six Digital [15] y Embedded Acoustics [16]) también están excluidas de la lista.
Jacob, K., McManus, S., Verhave, JA y Steeneken, H., (2002) "Desarrollo de un medidor preciso, portátil y fácil de usar para la predicción de la inteligibilidad del habla", Pasado, presente y futuro del índice de transmisión del habla, Simposio internacional sobre STI