RNA de base radial

Al igual que con los perceptrones multicapa, sirven como aproximadores universales.

y un peso de salida wi.

Cada red de base radial tienen 3 capas diferentes en total: La función Φ(r) siendo r la distancia euclidea, puede ser de varios tipos dependiendo de los patrones a clasificar.

Las elecciones más comunes son las siguientes: El aprendizaje consiste en la determinación de los centros, desviaciones y pesos de la capa oculta a la capa de salida.

De esta forma, los centros y las desviaciones siguen un proceso guiado por una optimización en el espacio de entrada, mientras que los pesos siguen una optimización sobre la base de las salidas que se desean obtener.

A la hora de determinar los centros, se utilizará un algoritmo de clasificación no supervisado que permita dividir el espacio de entrada en clases o clusters.

Los centros se determinan usando la siguiente fórmula: Donde: Además

se puede determinar de la siguiente manera: Dado el número de clases K 1-Se inicializan aleatoriamente los centros de los K clusters (Unidad de capa oculta) 2-Se asignan Ni patrones de entrada a cada clúster i del siguiente modo: El patrón X(n) pertenece al clúster i si : Con lo cual cada unidad tendrá asociado un determinado número de patrones de entrada, aquellos más cercanos a su centro.

3-Se calcula la nueva posición de los centros como la media de todos los patrones que pertenecen al clúster: 4-Se repiten 2 y 3 hasta que las nuevas posiciones de los centros no se modifiquen respecto de la anterior: Las desviaciones se calculan de manera que cada unidad oculta se activa para una determinada región del espacio entrada y además que esta región de esta unidad no se solape con la región de otra unidad oculta.

Existen diversas formas de calular esta desviación, siendo la más común, la media geométrica entre un centro y los centros adyacentes: Donde

para la desviación del clúster i Durante esta fase se determinan pesos y umbrales.

La solución viene dada por la siguiente expresión: Siendo W la matriz de orden

que posee los n pesos y los umbrales en la última fila.

El proceso no se guía para que las amplitudes sean tales que el solapamiento de las gausianas sea lo más suave posible, sino para minimizar el error cuadrático; por tanto, pueden perderse las características locales.