stringtranslate.com

Fusión de datos

La fusión de los datos de dos fuentes (dimensiones n.° 1 y n.° 2) puede producir un clasificador superior a cualquier clasificador basado únicamente en la dimensión n.° 1 o en la dimensión n.° 2.

La fusión de datos es el proceso de integrar múltiples fuentes de datos para producir información más consistente, precisa y útil que la proporcionada por cualquier fuente de datos individual.

Los procesos de fusión de datos suelen clasificarse como de bajo nivel, intermedio o alto nivel, según la etapa de procesamiento en la que se produce la fusión. [1] La fusión de datos de bajo nivel combina varias fuentes de datos sin procesar para producir nuevos datos sin procesar. La expectativa es que los datos fusionados sean más informativos y sintéticos que las entradas originales.

Por ejemplo, la fusión de sensores también se conoce como fusión de datos (multisensores) y es un subconjunto de la fusión de información .

El concepto de fusión de datos tiene su origen en la capacidad que han desarrollado los seres humanos y los animales para incorporar información de múltiples sentidos a fin de mejorar su capacidad de supervivencia. Por ejemplo, una combinación de la vista, el tacto, el olfato y el gusto puede indicar si una sustancia es comestible. [2]

El modelo JDL/DFIG

Director adjunto del modelo de laboratorios (JDL)/Grupo de información de fusión de datos (DFIG)

A mediados de los años 1980, los Directores Conjuntos de Laboratorios formaron el Subpanel de Fusión de Datos (que más tarde se conocería como el Grupo de Fusión de Datos). Con la llegada de la World Wide Web, la fusión de datos incluía la fusión de datos, sensores e información. El JDL/DFIG introdujo un modelo de fusión de datos que dividía los distintos procesos. En la actualidad, los seis niveles del modelo del Grupo de Información de Fusión de Datos (DFIG) son:

Aunque el modelo JDL (niveles 1 a 4) todavía se utiliza en la actualidad, suele recibir críticas por implicar que los niveles necesariamente se dan en orden y también por su falta de representación adecuada del potencial de una intervención humana. El modelo DFIG (niveles 0 a 5) exploró las implicaciones de la conciencia de la situación, el refinamiento del usuario y la gestión de la misión. [3] A pesar de estas deficiencias, los modelos JDL/DFIG son útiles para visualizar el proceso de fusión de datos, facilitando el debate y la comprensión común, [4] y son importantes para el diseño de la fusión de información a nivel de sistemas. [3] [5]

Aplicaciones geoespaciales

En el ámbito geoespacial ( SIG ), la fusión de datos suele ser sinónimo de integración de datos . En estas aplicaciones, suele existir la necesidad de combinar diversos conjuntos de datos en un conjunto de datos unificado (fusionado) que incluya todos los puntos de datos y pasos de tiempo de los conjuntos de datos de entrada. El conjunto de datos fusionados se diferencia de un superconjunto combinado simple en que los puntos del conjunto de datos fusionados contienen atributos y metadatos que podrían no haberse incluido para estos puntos en el conjunto de datos original.

A continuación se muestra un ejemplo simplificado de este proceso, en el que el conjunto de datos "α" se fusiona con el conjunto de datos β para formar el conjunto de datos fusionados δ. Los puntos de datos del conjunto "α" tienen coordenadas espaciales X e Y y atributos A1 y A2. Los puntos de datos del conjunto β tienen coordenadas espaciales X e Y y atributos B1 y B2. El conjunto de datos fusionados contiene todos los puntos y atributos.

En un caso simple donde todos los atributos son uniformes en todo el dominio de análisis, los atributos pueden asignarse simplemente: M?, N?, Q?, R? a M, N, Q, R. En una aplicación real, los atributos no son uniformes y generalmente se requiere algún tipo de interpolación para asignar correctamente los atributos a los puntos de datos en el conjunto fusionado.

Visualización de conjuntos de datos fusionados de huellas de langostas en el mar de Tasmania. Imagen generada con el software Eonfusion de Myriax Pty. Ltd.

En una aplicación mucho más complicada, los investigadores de animales marinos utilizan la fusión de datos para combinar datos de seguimiento de animales con datos batimétricos , meteorológicos , de temperatura de la superficie del mar (TSM) y del hábitat de los animales para examinar y comprender la utilización del hábitat y el comportamiento de los animales en reacción a fuerzas externas como el clima o la temperatura del agua. Cada uno de estos conjuntos de datos presenta una cuadrícula espacial y una frecuencia de muestreo diferentes, por lo que una combinación simple probablemente crearía suposiciones erróneas y contaminaría los resultados del análisis. Pero mediante el uso de la fusión de datos, todos los datos y atributos se reúnen en una única vista en la que se crea una imagen más completa del entorno. Esto permite a los científicos identificar ubicaciones y momentos clave y formar nuevos conocimientos sobre las interacciones entre el entorno y los comportamientos animales.

En la figura de la derecha, se estudian langostas de roca en la costa de Tasmania. Hugh Pederson, de la Universidad de Tasmania, utilizó un software de fusión de datos para fusionar los datos de seguimiento de langostas de roca del sur (codificados por colores en amarillo y negro para el día y la noche, respectivamente) con datos de batimetría y hábitat para crear una imagen 4D única del comportamiento de las langostas de roca.

Integración de datos

En aplicaciones fuera del ámbito geoespacial, existen diferencias en el uso de los términos integración de datos y fusión de datos. En áreas como la inteligencia empresarial, por ejemplo, la integración de datos se utiliza para describir la combinación de datos, mientras que la fusión de datos es la integración seguida de una reducción o reemplazo. La integración de datos puede verse como una combinación de conjuntos en la que se conserva el conjunto más grande, mientras que la fusión es una técnica de reducción de conjuntos con una mayor confianza.

Áreas de aplicación

Desde múltiples modalidades de detección de tráfico

Los datos de las diferentes tecnologías de detección se pueden combinar de forma inteligente para determinar con precisión el estado del tráfico. Se ha demostrado que un enfoque basado en la fusión de datos que utiliza los datos acústicos, de imágenes y de sensores recopilados en la carretera combina las ventajas de los diferentes métodos individuales. [6]

Fusión de decisiones

En muchos casos, los sensores dispersos geográficamente tienen limitaciones severas de energía y ancho de banda. Por lo tanto, los datos brutos sobre un determinado fenómeno a menudo se resumen en unos pocos bits de cada sensor. Al inferir sobre un evento binario (es decir, o ), en el caso extremo, solo se envían decisiones binarias desde los sensores a un Centro de Fusión de Decisiones (DFC) y se combinan para obtener un mejor rendimiento de clasificación. [7] [8] [9]

Para una mejor conciencia contextual

Con una multitud de sensores integrados, incluidos sensores de movimiento, sensores ambientales y sensores de posición, un dispositivo móvil moderno generalmente brinda a las aplicaciones móviles acceso a una serie de datos sensoriales que podrían aprovecharse para mejorar la conciencia contextual. Mediante el procesamiento de señales y técnicas de fusión de datos, como la generación de características, el estudio de viabilidad y el análisis de componentes principales (PCA), dichos datos sensoriales mejorarán en gran medida la tasa positiva de clasificación del movimiento y el estado relevante contextual del dispositivo. [10] Snidaro et al. proporcionan muchas técnicas de información mejorada por el contexto . [11] [12]

Métodos estadísticos

Procesos gaussianos autorregresivos bayesianos

Los procesos gaussianos son un modelo de aprendizaje automático muy popular. Si se supone que existe una relación autorregresiva entre los datos y que cada fuente de datos es un proceso gaussiano, se trata de un problema de regresión bayesiana no lineal. [13]

Estimación semiparamétrica

Muchos métodos de fusión de datos suponen distribuciones condicionales comunes entre varias fuentes de datos. [14] Recientemente, se han desarrollado métodos para permitir una estimación eficiente dentro del modelo semiparamétrico resultante . [15]

Véase también

Referencias

  1. ^ Klein, Lawrence A. (2004). Fusión de sensores y datos: una herramienta para la evaluación de la información y la toma de decisiones. SPIE Press. p. 51. ISBN 978-0-8194-5435-5.
  2. ^ Hall, David L.; Llinas, James (1997). "Introducción a la fusión de datos multisensoriales". Actas del IEEE . 85 (1): 6–23. doi :10.1109/5.554205. ISSN  0018-9219.
  3. ^ ab Blasch, Erik P.; Bossé, Éloi; Lambert, Dale A. (2012). Gestión de fusión de información de alto nivel y diseño de sistemas . Norwood, MA: Editores de Artech House. ISBN 978-1-6080-7151-7.
  4. ^ Liggins, Martin E.; Hall, David L.; Llinas, James (2008). Fusión de datos multisensoriales, segunda edición: teoría y práctica (Fusión de datos multisensoriales) . CRC. ISBN 978-1-4200-5308-1.
  5. ^ Blasch, E., Steinberg, A., Das, S., Llinas, J., Chong, C.-Y., Kessler, O., Waltz, E., White, F." (2013). Revisando el modelo JDL para la explotación de la información . Conferencia internacional sobre fusión de información.{{cite conference}}: CS1 maint: varios nombres: lista de autores ( enlace )
  6. ^ Joshi, V., Rajamani, N., Takayuki, K., Prathapaneni, Subramaniam, LV (2013). Aprendizaje basado en fusión de información para detección de estados de tráfico frugal . Actas de la vigésimo tercera conferencia conjunta internacional sobre inteligencia artificial.{{cite conference}}: CS1 maint: varios nombres: lista de autores ( enlace )
  7. ^ Ciuonzo, D.; Papa, G.; Romano, G.; Salvo Rossi, P.; Willett, P. (1 de septiembre de 2013). "Detección descentralizada de un bit con una prueba Rao para fusión de múltiples sensores". IEEE Signal Processing Letters . 20 (9): 861–864. arXiv : 1306.6141 . Bibcode :2013ISPL...20..861C. doi :10.1109/LSP.2013.2271847. ISSN  1070-9908. S2CID  6315906.
  8. ^ Ciuonzo, D.; Salvo Rossi, P. (1 de febrero de 2014). "Fusión de decisiones con probabilidad de detección de sensor desconocida". IEEE Signal Processing Letters . 21 (2): 208–212. arXiv : 1312.2227 . Código Bibliográfico :2014ISPL...21..208C. doi :10.1109/LSP.2013.2295054. ISSN  1070-9908. S2CID  8761982.
  9. ^ Ciuonzo, D.; De Maio, A.; Salvo Rossi, P. (1 de septiembre de 2015). "Un marco sistemático para la prueba de hipótesis compuestas de ensayos de Bernoulli independientes". IEEE Signal Processing Letters . 22 (9): 1249–1253. Bibcode :2015ISPL...22.1249C. doi :10.1109/LSP.2015.2395811. ISSN  1070-9908. S2CID  15503268.
  10. ^ Guiry, John J.; van de Ven, Pepijn; Nelson, John (21 de marzo de 2014). "Fusión de múltiples sensores para una mejor conciencia contextual de las actividades cotidianas con dispositivos ubicuos". Sensores . 14 (3): 5687–5701. Bibcode :2014Senso..14.5687G. doi : 10.3390/s140305687 . PMC 4004015 . PMID  24662406. 
  11. ^ Snidaro, Laurao; et, al. (2016). Context-Enhanced Information Fusion:Boosting Real-World Performance with Domain Knowledge [Fusión de información mejorada por el contexto: mejora del rendimiento en el mundo real con conocimiento del dominio ]. Suiza, AG: Springer. ISBN 978-3-319-28971-7.
  12. ^ Haghighat, Mohammad; Abdel-Mottaleb, Mohamed; Alhalabi, Wadee (2016). "Análisis de correlación discriminante: fusión de niveles de características en tiempo real para reconocimiento biométrico multimodal". IEEE Transactions on Information Forensics and Security . 11 (9): 1984–1996. doi :10.1109/TIFS.2016.2569061. S2CID  15624506.
  13. ^ Ranftl, Sascha; Melito, Gian Marco; Badeli, Vahid; Reinbacher-Köstinger, Alice; Ellermann, Katrin; von der Linden, Wolfgang (31 de diciembre de 2019). "Cuantificación de la incertidumbre bayesiana con datos de fidelidad múltiple y procesos gaussianos para cardiografía de impedancia de disección aórtica". Entropy . 22 (1): 58. Bibcode :2019Entrp..22...58R. doi : 10.3390/e22010058 . ISSN  1099-4300. PMC 7516489 . PMID  33285833. 
  14. ^ Bareinboim, Elias; Pearl, Judea (5 de julio de 2016). "Inferencia causal y el problema de la fusión de datos". Actas de la Academia Nacional de Ciencias . 113 (27): 7345–7352. doi :10.1073/pnas.1510507113. ISSN  0027-8424. PMC 4941504 . PMID  27382148. 
  15. ^ Li, Sijia; Luedtke, Alex (15 de noviembre de 2023). "Estimación eficiente bajo fusión de datos". Biometrika . 110 (4): 1041–1054. doi :10.1093/biomet/asad007. ISSN  0006-3444. PMC 10653189 . PMID  37982010. 

Fuentes

Referencias generales

Bibliografía

Enlaces externos