stringtranslate.com

Teoría de detección

La teoría de la detección o teoría de la detección de señales es un medio para medir la capacidad de diferenciar entre patrones portadores de información (llamados estímulo en los organismos vivos, señal en las máquinas) y patrones aleatorios que distraen de la información (llamados ruido , que consiste en estímulos de fondo y actividad aleatoria). de la máquina de detección y del sistema nervioso del operador).

En el campo de la electrónica , la recuperación de señales es la separación de dichos patrones de un fondo disimulado. [1]

Según la teoría, existen varios factores que determinan cómo un sistema de detección detectará una señal y dónde estarán sus niveles de umbral. La teoría puede explicar cómo el cambio del umbral afectará la capacidad de discernir, exponiendo a menudo cuán adaptado está el sistema a la tarea, propósito u objetivo al que apunta. Cuando el sistema de detección es un ser humano, características tales como experiencia, expectativas, estado fisiológico (por ejemplo, fatiga) y otros factores pueden afectar el umbral aplicado. Por ejemplo, es probable que un centinela en tiempos de guerra detecte estímulos más débiles que el mismo centinela en tiempos de paz debido a un criterio más bajo; sin embargo, también es más probable que trate los estímulos inocuos como una amenaza.

Gran parte de los primeros trabajos en teoría de detección fueron realizados por investigadores de radar . [2] En 1954, la teoría estaba completamente desarrollada en el lado teórico como lo describen Peterson , Birdsall y Fox [3] y la base de la teoría psicológica fue hecha por Wilson P. Tanner, David M. Green y John A. Swets , también en 1954. [4] La teoría de la detección fue utilizada en 1966 por John A. Swets y David M. Green para la psicofísica . [5] Green y Swets criticaron los métodos tradicionales de la psicofísica por su incapacidad para discriminar entre la sensibilidad real de los sujetos y sus (potenciales) sesgos de respuesta . [6]

La teoría de la detección tiene aplicaciones en muchos campos como el diagnóstico de cualquier tipo, el control de calidad , las telecomunicaciones y la psicología . El concepto es similar a la relación señal-ruido utilizada en las ciencias y a las matrices de confusión utilizadas en la inteligencia artificial . También se puede utilizar en la gestión de alarmas , donde es importante separar los eventos importantes del ruido de fondo .

Psicología

La teoría de detección de señales (SDT) se utiliza cuando los psicólogos quieren medir la forma en que tomamos decisiones en condiciones de incertidumbre, como cómo percibiríamos distancias en condiciones de niebla o durante la identificación de testigos presenciales . [7] [8] La TDS supone que quien toma las decisiones no es un receptor pasivo de información, sino un tomador de decisiones activo que hace juicios perceptivos difíciles en condiciones de incertidumbre. En circunstancias de niebla, nos vemos obligados a decidir a qué distancia de nosotros está un objeto, basándonos únicamente en el estímulo visual que se ve afectado por la niebla. Dado que el cerebro utiliza el brillo de un objeto, como un semáforo, para discriminar la distancia de un objeto, y la niebla reduce el brillo de los objetos, percibimos que el objeto está mucho más lejos de lo que realmente está (ver también teoría de la decisión ). Según SDT, durante las identificaciones de los testigos presenciales, estos basan su decisión sobre si un sospechoso es el culpable o no en función de su nivel percibido de familiaridad con el sospechoso.

Para aplicar la teoría de detección de señales a un conjunto de datos donde los estímulos estaban presentes o ausentes, y el observador clasificó cada prueba como si tuviera el estímulo presente o ausente, las pruebas se clasifican en una de cuatro categorías:

Con base en las proporciones de este tipo de ensayos, se pueden obtener estimaciones numéricas de la sensibilidad con estadísticas como el índice de sensibilidad d' y A', [9] y el sesgo de respuesta se puede estimar con estadísticas como c y β. [9] β es la medida del sesgo de respuesta. [10]

La teoría de la detección de señales también se puede aplicar a experimentos de memoria, donde los elementos se presentan en una lista de estudio para su posterior prueba. Se crea una lista de prueba combinando estos elementos "antiguos" con elementos novedosos y "nuevos" que no aparecieron en la lista del estudio. En cada prueba, el sujeto responderá "sí, esto estaba en la lista del estudio" o "no, esto no estaba en la lista del estudio". Los elementos presentados en la lista de estudio se denominan Objetivos y los elementos nuevos se denominan Distractores. Decir "Sí" a un objetivo constituye un acierto, mientras que decir "Sí" a un distractor constituye una falsa alarma.

Aplicaciones

La teoría de la detección de señales tiene una amplia aplicación, tanto en humanos como en animales . Los temas incluyen memoria , características de los estímulos, programas de refuerzo, etc.

Sensibilidad o discriminabilidad

Conceptualmente, la sensibilidad se refiere a qué tan difícil o fácil es detectar que un estímulo objetivo está presente a partir de eventos de fondo. Por ejemplo, en un paradigma de memoria de reconocimiento, tener más tiempo para estudiar las palabras que se van a recordar hace que sea más fácil reconocer palabras vistas u escuchadas anteriormente. Por el contrario, tener que recordar 30 palabras en lugar de 5 dificulta la discriminación. Una de las estadísticas más utilizadas para calcular la sensibilidad es el llamado índice de sensibilidad o d' . También existen medidas no paramétricas , como el área bajo la curva ROC . [6]

Inclinación

El sesgo es el grado en que una respuesta es más probable que otra, promediando los casos de estímulo presente y de estímulo ausente. Es decir, es más probable que un receptor responda que un estímulo está presente o que responda que un estímulo no está presente. El sesgo es independiente de la sensibilidad. El sesgo puede ser deseable si las falsas alarmas y los errores generan costos diferentes. Por ejemplo, si el estímulo es un atacante, entonces fallar (no detectar al atacante) puede ser más costoso que una falsa alarma (informar de un atacante cuando no lo hay), lo que hace deseable un sesgo de respuesta liberal. Por el contrario, dar falsas alarmas con demasiada frecuencia ( lobo llorando ) puede hacer que las personas sean menos propensas a responder, un problema que puede reducirse mediante un sesgo de respuesta conservador.

Detección comprimida

Otro campo que está estrechamente relacionado con la teoría de la detección de señales se llama detección comprimida (o detección por compresión). El objetivo de la detección comprimida es recuperar entidades de alta dimensión pero de baja complejidad a partir de unas pocas mediciones. Por tanto, una de las aplicaciones más importantes de la detección comprimida es la recuperación de señales de alta dimensión que se sabe que son escasas (o casi escasas) con sólo unas pocas mediciones lineales. El número de mediciones necesarias para la recuperación de señales es mucho menor que lo que requiere el teorema de muestreo de Nyquist, siempre que la señal sea escasa, lo que significa que solo contiene unos pocos elementos distintos de cero. Existen diferentes métodos de recuperación de señal en detección comprimida, incluida la búsqueda de base , el algoritmo de recuperación del expansor [11] , CoSaMP [12] y también el algoritmo rápido no iterativo . [13] En todos los métodos de recuperación mencionados anteriormente, es de gran importancia elegir una matriz de medición adecuada utilizando construcciones probabilísticas o construcciones deterministas. En otras palabras, las matrices de medición deben satisfacer ciertas condiciones específicas, como RIP (propiedad de isometría restringida) o propiedad de espacio nulo , para lograr una recuperación dispersa sólida.

Matemáticas

P(H1|y) > P(H2|y) / Prueba MAP

En el caso de tomar una decisión entre dos hipótesis , H1 , ausente, y H2 , presente, en el caso de una observación particular , y , un enfoque clásico es elegir H1 cuando p(H1|y) > p(H2|y ) y H2 en el caso inverso. [14] En el caso de que las dos probabilidades a posteriori sean iguales, se podría optar por optar por una única opción (o elegir siempre H1 o elegir siempre H2 ), o seleccionar aleatoriamente H1 o H2 . Las probabilidades a priori de H1 y H2 pueden guiar esta elección, por ejemplo, eligiendo siempre la hipótesis con mayor probabilidad a priori .

Al adoptar este enfoque, normalmente lo que se conoce son las probabilidades condicionales, p(y|H1) y p(y|H2) , y las probabilidades a priori y . En este caso,

,

donde p(y) es la probabilidad total del evento y ,

.

Se elige H2 en caso

y H1 en caso contrario.

A menudo, la razón se llama y se llama razón de verosimilitud .

Usando esta terminología, se elige H2 en el caso . Esto se llama prueba MAP, donde MAP significa "máximo a posteriori ").

Adoptar este enfoque minimiza la cantidad esperada de errores que uno cometerá.

Criterio de Bayes

En algunos casos, es mucho más importante responder apropiadamente a H1 que responder apropiadamente a H2 . Por ejemplo, si suena una alarma que indica H1 (un bombardero que se aproxima porta un arma nuclear ), es mucho más importante derribar el bombardero si H1 = VERDADERO, que evitar enviar un escuadrón de cazas a inspeccionar una alarma falsa. alarma (es decir, H1 = FALSO, H2 = VERDADERO) (suponiendo un gran suministro de escuadrones de cazas). El criterio de Bayes es un enfoque adecuado para tales casos. [14]

Aquí una utilidad está asociada con cada una de cuatro situaciones:

Como se muestra a continuación, lo importante son las diferencias y .

De manera similar, hay cuatro probabilidades, , , etc., para cada uno de los casos (que dependen de la estrategia de decisión de cada uno).

El enfoque del criterio de Bayes consiste en maximizar la utilidad esperada:

Efectivamente, se puede maximizar la suma,

,

y haz las siguientes sustituciones:

donde y son las probabilidades a priori , y , y es la región de eventos de observación, y , a los que se responde como si H1 fuera cierto.

y por lo tanto se maximizan al extenderse sobre la región donde

Esto se logra decidiendo H2 en caso

y H1 en caso contrario, donde L(y) es el coeficiente de verosimilitud así definido .

Modelos de distribución normal

Das y Geisler [15] ampliaron los resultados de la teoría de detección de señales para estímulos normalmente distribuidos y derivaron métodos para calcular la tasa de error y la matriz de confusión para observadores ideales y no ideales para detectar y categorizar señales normales univariadas y multivariadas de dos o más categorías.

Ver también

Referencias

  1. ^ TH Wilmshurst (1990). Recuperación de señal del ruido en instrumentación electrónica (2ª ed.). Prensa CRC. págs.11 y siguientes . ISBN 978-0-7503-0058-2.
  2. ^ Marcum, JI (1947). "Una teoría estadística de la detección de objetivos mediante radar pulsado". El Memorando de Investigación : 90 . Consultado el 28 de junio de 2009 .
  3. ^ Peterson, W.; Birdsall, T.; Fox, W. (septiembre de 1954). "La teoría de la detectabilidad de la señal". Transacciones del Grupo Profesional IRE de Teoría de la Información . 4 (4): 171–212. doi :10.1109/TIT.1954.1057460.
  4. ^ Tanner, Wilson P.; Swets, John A. (1954). "Una teoría de la detección visual para la toma de decisiones". Revisión psicológica . 61 (6): 401–409. doi :10.1037/h0058700. PMID  13215690.
  5. ^ Swets, JA (ed.) (1964) Detección y reconocimiento de señales por parte de observadores humanos . Nueva York: Wiley [ página necesaria ]
  6. ^ ab Green, DM, Swets JA (1966) Teoría y psicofísica de la detección de señales . Nueva York: Wiley. ( ISBN 0-471-32420-5 ) [ página necesaria ] 
  7. ^ Clark, Steven E.; Benjamín, Aaron S.; Wixted, John T.; Mickes, Laura; Gronlund, Scott D. (2015). "Identificación de testigos presenciales y precisión del sistema de justicia penal". Perspectivas políticas de las ciencias del comportamiento y del cerebro . 2 : 175–186. doi :10.1177/2372732215602267. hdl : 11244/49353 . S2CID  18529957.
  8. ^ Haw, Ryann Michelle (enero de 2005). "Un análisis teórico de la identificación de testigos presenciales: teoría del proceso dual, teoría de detección de señales y confianza de los testigos presenciales". Colección ProQuest Etd para Fiu : 1–98.
  9. ^ ab Estanislao, Harold; Todorov, Natasha (marzo de 1999). "Cálculo de medidas de la teoría de detección de señales". Métodos, instrumentos y computadoras de investigación del comportamiento . 31 (1): 137-149. doi : 10.3758/BF03207704 . PMID  10495845.
  10. ^ "Teoría de la detección de señales". elvers.us . Consultado el 14 de julio de 2023 .
  11. ^ Jafarpour, Sina; Xu, Weiyu; Hassibi, Babak; Calderbank, Robert (septiembre de 2009). "Detección comprimida eficiente y robusta mediante gráficos expansores optimizados" (PDF) . Transacciones IEEE sobre teoría de la información . 55 (9): 4299–4308. doi :10.1109/tit.2009.2025528. S2CID  15490427.
  12. ^ Needell, D.; Tropp, JA (2009). "CoSaMP: recuperación iterativa de señales de muestras incompletas e inexactas". Análisis Armónico Aplicado y Computacional . 26 (3): 301–321. arXiv : 0803.2392 . doi :10.1016/j.acha.2008.07.002. S2CID  1642637.
  13. ^ Lotfi, M.; Vidyasagar, M. "Un algoritmo rápido no iterativo para la detección de compresión utilizando matrices de medición binaria".
  14. ^ ab Schonhoff, TA y Giordano, AA (2006) Teoría de detección y estimación y sus aplicaciones . Nueva Jersey: Educación Pearson ( ISBN 0-13-089499-0
  15. ^ Das, Abhranil; Geisler, Wilson (2021). "Un método para integrar y clasificar distribuciones normales". Revista de Visión . 21 (10): 1. arXiv : 2012.14331 . doi :10.1167/jov.21.10.1. PMC 8419883 . PMID  34468706. 

enlaces externos