Una red neuronal probabilística ( PNN ) [1] es una red neuronal de propagación hacia adelante , que se utiliza ampliamente en problemas de clasificación y reconocimiento de patrones. En el algoritmo PNN, la función de distribución de probabilidad (PDF) principal de cada clase se aproxima mediante una ventana de Parzen y una función no paramétrica. Luego, utilizando la PDF de cada clase, se estima la probabilidad de clase de un nuevo dato de entrada y luego se emplea la regla de Bayes para asignar la clase con la mayor probabilidad posterior a los nuevos datos de entrada. Con este método, se minimiza la probabilidad de clasificación errónea. [2] Este tipo de red neuronal artificial (ANN) se derivó de la red bayesiana [3] y un algoritmo estadístico llamado análisis discriminante de Kernel Fisher . [4] Fue introducido por DF Specht en 1966. [5] [6] En una PNN, las operaciones se organizan en una red de propagación hacia adelante de múltiples capas con cuatro capas:
- Capa de entrada
- Capa de patrón
- Capa de suma
- Capa de salida
Capas
La PNN se utiliza a menudo en problemas de clasificación. [7] Cuando hay una entrada presente, la primera capa calcula la distancia desde el vector de entrada hasta los vectores de entrada de entrenamiento. Esto produce un vector donde sus elementos indican qué tan cerca está la entrada de la entrada de entrenamiento. La segunda capa suma la contribución para cada clase de entradas y produce su salida neta como un vector de probabilidades. Finalmente, una función de transferencia completa en la salida de la segunda capa elige el máximo de estas probabilidades y produce un 1 (identificación positiva) para esa clase y un 0 (identificación negativa) para las clases no seleccionadas.
Capa de entrada
Cada neurona de la capa de entrada representa una variable predictora. En las variables categóricas, se utilizan N-1 neuronas cuando hay N número de categorías. Estandariza el rango de los valores restando la mediana y dividiendo por el rango intercuartil . Luego, las neuronas de entrada alimentan los valores a cada una de las neuronas de la capa oculta.
Capa de patrón
Esta capa contiene una neurona para cada caso del conjunto de datos de entrenamiento. Almacena los valores de las variables predictoras del caso junto con el valor objetivo. Una neurona oculta calcula la distancia euclidiana del caso de prueba desde el punto central de la neurona y luego aplica el núcleo de la función de base radial utilizando los valores sigma.
Capa de suma
En el caso de PNN, hay una neurona patrón para cada categoría de la variable de destino. La categoría de destino real de cada caso de entrenamiento se almacena con cada neurona oculta; el valor ponderado que sale de una neurona oculta se envía únicamente a la neurona patrón que corresponde a la categoría de la neurona oculta. Las neuronas patrón suman los valores de la clase que representan.
Capa de salida
La capa de salida compara los votos ponderados para cada categoría objetivo acumulados en la capa de patrón y utiliza el voto más grande para predecir la categoría objetivo.
Ventajas
Existen varias ventajas y desventajas al utilizar PNN en lugar de un perceptrón multicapa . [8]
- Las PNN son mucho más rápidas que las redes de perceptrones multicapa.
- Las PNN pueden ser más precisas que las redes de perceptrones multicapa.
- Las redes PNN son relativamente insensibles a los valores atípicos.
- Las redes PNN generan puntuaciones de probabilidad de objetivo previstas con precisión.
- Las PNN se aproximan a la clasificación óptima de Bayes.
Desventajas
- Las PNN son más lentas que las redes de perceptrones multicapa a la hora de clasificar nuevos casos.
- PNN requiere más espacio de memoria para almacenar el modelo.
Aplicaciones basadas en PNN
- Redes neuronales probabilísticas en el modelado del deterioro estructural de tuberías de aguas pluviales. [9]
- Método de redes neuronales probabilísticas para el diagnóstico de muestras de endoscopios gástricos basado en espectroscopia FTIR. [10]
- Aplicación de redes neuronales probabilísticas a la farmacocinética poblacional. [11]
- Redes neuronales probabilísticas para la predicción de clases de leucemia y tumores embrionarios del sistema nervioso central. [12]
- Identificación de barcos mediante redes neuronales probabilísticas. [13]
- Gestión de configuración de sensores basada en redes neuronales probabilísticas en una red ad hoc inalámbrica . [14]
- Red neuronal probabilística en reconocimiento de caracteres.
- Clasificación de imágenes por teledetección. [15]
Referencias
- ^ Mohebali, Behshad; Tahmassebi, Amirhessam; Meyer-Baese, Anke; Gandomi, Amir H. (2020). Redes neuronales probabilísticas: una breve descripción general de la teoría, la implementación y la aplicación . Elsevier. págs. 347–367. doi :10.1016/B978-0-12-816514-0.00014-X. S2CID 208119250.
- ^ Zeinali, Yasha; Story, Brett A. (2017). "Red neuronal probabilística competitiva". Ingeniería asistida por computadora integrada . 24 (2): 105–118. doi :10.3233/ICA-170540.
- ^ "Redes neuronales probabilísticas". Archivado desde el original el 18 de diciembre de 2010. Consultado el 22 de marzo de 2012 .
- ^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 2012-01-31 . Consultado el 2012-03-22 .
{{cite web}}
: CS1 maint: copia archivada como título ( enlace ) - ^ Specht, DF (1 de junio de 1967). "Generación de funciones discriminantes polinómicas para el reconocimiento de patrones". IEEE Transactions on Electronic Computers . EC-16 (3): 308–319. doi :10.1109/PGEC.1967.264667. ISSN 0367-7508.
- ^ Specht, DF (1990). "Redes neuronales probabilísticas". Redes neuronales . 3 : 109–118. doi :10.1016/0893-6080(90)90049-Q.
- ^ "Redes neuronales probabilísticas :: Redes de base radial (Neural Network Toolbox™)" www.mathworks.in . Archivado desde el original el 4 de agosto de 2012 . Consultado el 6 de junio de 2022 .
- ^ "Redes neuronales de regresión general y probabilística". Archivado desde el original el 2012-03-02 . Consultado el 2012-03-22 .
- ^ Tran, DH; Ng, AWM; Perera, BJC; Burn, S.; Davis, P. (septiembre de 2006). "Aplicación de redes neuronales probabilísticas en el modelado del deterioro estructural de tuberías de aguas pluviales" (PDF) . Revista Urbana del Agua . 3 (3): 175–184. doi :10.1080/15730620600961684. S2CID 15220500. Archivado desde el original (PDF) el 8 de agosto de 2017 . Consultado el 27 de febrero de 2023 .
- ^ Li, QB; Li, X.; Zhang, GJ; Xu, YZ; Wu, JG; Sun, XJ (2009). "[Aplicación del método de redes neuronales probabilísticas al diagnóstico de muestras de endoscopio gástrico basado en espectroscopia FTIR]". Guang Pu Xue Yu Guang Pu Fen Xi . 29 (6): 1553–7. PMID 19810529.
- ^ Berno, E.; Brambilla, L.; Canaparo, R.; Casale, F.; Costa, M.; Della Pepa, C.; Eandi, M.; Pasero, E. (2003). "Aplicación de redes neuronales probabilísticas a farmacocinéticas poblacionales". Actas de la Conferencia conjunta internacional sobre redes neuronales, 2003. págs. 2637–2642. doi :10.1109/IJCNN.2003.1223983. ISBN . 0-7803-7898-9.S2CID60477107 .
- ^ Huang, Chenn-Jung; Liao, Wei-Chen (2004). "Aplicación de redes neuronales probabilísticas a la predicción de clases de leucemia y tumores embrionarios del sistema nervioso central". Neural Processing Letters . 19 (3): 211–226. doi :10.1023/B:NEPL.0000035613.51734.48. S2CID 5651402.
- ^ Araghi, Leila Fallah; d Khaloozade, Hami; Arvan, Mohammad Reza (19 de marzo de 2009). "Identificación de buques mediante redes neuronales probabilísticas (PNN)" ( PDF) . Actas de la Multiconferencia Internacional de Ingenieros y Científicos Informáticos . 2. Hong Kong , China . Consultado el 27 de febrero de 2023 .
- ^ "Copia archivada" (PDF) . Archivado desde el original (PDF) el 2010-06-14 . Consultado el 2012-03-22 .
{{cite web}}
: CS1 maint: copia archivada como título ( enlace ) - ^ Zhang, Y. (2009). "Clasificación de imágenes de teledetección basada en una red neuronal probabilística mejorada". Sensores . 9 (9): 7516–7539. Bibcode :2009Senso...9.7516Z. doi : 10.3390/s90907516 . PMC 3290485 . PMID 22400006.