La lógica difusa es una forma de lógica multivaluada en la que el valor de verdad de las variables puede ser cualquier número real entre 0 y 1. Se emplea para manejar el concepto de verdad parcial, donde el valor de verdad puede oscilar entre completamente verdadero y completamente falso. . [1] Por el contrario, en la lógica booleana , los valores de verdad de las variables solo pueden ser los valores enteros 0 o 1.
El término lógica difusa fue introducido con la propuesta de 1965 de la teoría de conjuntos difusos del matemático Lotfi Zadeh . [2] [3] Sin embargo, la lógica difusa se había estudiado desde la década de 1920, como lógica de valores infinitos , especialmente por Łukasiewicz y Tarski . [4]
La lógica difusa se basa en la observación de que las personas toman decisiones basándose en información imprecisa y no numérica. Los modelos difusos o conjuntos difusos son medios matemáticos para representar la vaguedad y la información imprecisa (de ahí el término difuso). Estos modelos tienen la capacidad de reconocer, representar, manipular, interpretar y utilizar datos e información vaga y carente de certeza. [5] [6]
La lógica difusa se ha aplicado a muchos campos, desde la teoría del control hasta la inteligencia artificial .
La lógica clásica sólo permite conclusiones que sean verdaderas o falsas. Sin embargo, también hay proposiciones con respuestas variables, que se pueden encontrar cuando se pide a un grupo de personas que identifiquen un color. En tales casos, la verdad aparece como resultado de un razonamiento a partir de un conocimiento inexacto o parcial en el que las respuestas muestreadas se asignan en un espectro. [7]
Tanto los grados de verdad como las probabilidades oscilan entre 0 y 1 y, por lo tanto, pueden parecer idénticos al principio, pero la lógica difusa utiliza los grados de verdad como un modelo matemático de vaguedad , mientras que la probabilidad es un modelo matemático de ignorancia . [8]
Una aplicación básica podría caracterizar varios subrangos de una variable continua . Por ejemplo, una medición de temperatura para frenos antibloqueo podría tener varias funciones de membresía separadas que definan rangos de temperatura particulares necesarios para controlar los frenos adecuadamente. Cada función asigna el mismo valor de temperatura a un valor de verdad en el rango de 0 a 1. Estos valores de verdad pueden usarse luego para determinar cómo se deben controlar los frenos. [9] La teoría de conjuntos difusos proporciona un medio para representar la incertidumbre.
En aplicaciones de lógica difusa, a menudo se utilizan valores no numéricos para facilitar la expresión de reglas y hechos. [10]
Una variable lingüística como la edad puede aceptar valores como joven y su antónimo viejo . Debido a que los lenguajes naturales no siempre contienen suficientes términos de valor para expresar una escala de valores difusa, es una práctica común modificar los valores lingüísticos con adjetivos o adverbios . Por ejemplo, podemos utilizar las coberturas más bien y algo para construir los valores adicionales bastante viejos o algo jóvenes . [11]
El sistema más conocido es el basado en reglas Mamdani . [12] Utiliza las siguientes reglas:
La fuzzificación es el proceso de asignar la entrada numérica de un sistema a conjuntos difusos con cierto grado de pertenencia. Este grado de membresía puede estar en cualquier lugar dentro del intervalo [0,1]. Si es 0, entonces el valor no pertenece al conjunto difuso dado, y si es 1, entonces el valor pertenece completamente al conjunto difuso. Cualquier valor entre 0 y 1 representa el grado de incertidumbre al que pertenece el valor en el conjunto. Estos conjuntos difusos normalmente se describen mediante palabras, por lo que al asignar la entrada del sistema a conjuntos difusos, podemos razonar con ellos de una manera lingüísticamente natural.
Por ejemplo, en la imagen siguiente, los significados de las expresiones frío , cálido y caliente están representados por funciones que asignan una escala de temperatura. Un punto en esa escala tiene tres "valores de verdad", uno para cada una de las tres funciones. La línea vertical en la imagen representa una temperatura particular que miden las tres flechas (valores de verdad). Dado que la flecha roja apunta a cero, esta temperatura puede interpretarse como "no caliente"; es decir, esta temperatura no tiene pertenencia al conjunto difuso "caliente". La flecha naranja (que apunta a 0,2) puede describirlo como "ligeramente cálido" y la flecha azul (que apunta a 0,8) "bastante frío". Por lo tanto, esta temperatura tiene 0,2 miembros en el conjunto difuso "cálido" y 0,8 miembros en el conjunto difuso "frío". El grado de pertenencia asignado a cada conjunto difuso es el resultado de la fusificación.
Los conjuntos difusos a menudo se definen como curvas en forma de triángulo o trapezoide, ya que cada valor tendrá una pendiente donde el valor aumenta, un pico donde el valor es igual a 1 (que puede tener una longitud de 0 o mayor) y una pendiente donde el valor está disminuyendo. [13] También se pueden definir usando una función sigmoidea . [14] Un caso común es la función logística estándar definida como
que tiene la siguiente propiedad de simetría
De esto se deduce que
La lógica difusa funciona con valores de membresía de una manera que imita la lógica booleana . Para ello, deben estar disponibles reemplazos para operadores básicos ("portones") Y, O, NO. Hay varias formas de hacerlo. Un reemplazo común se llamaOperador de Zadeh :
Para VERDADERO/1 y FALSO/0, las expresiones difusas producen el mismo resultado que las expresiones booleanas.
También existen otros operadores, de carácter más lingüístico, llamados coberturas , que se pueden aplicar. Generalmente se trata de adverbios como muy , o algo , que modifican el significado de un conjunto mediante una fórmula matemática . [15]
Sin embargo, una tabla de elección arbitraria no siempre define una función de lógica difusa. En el artículo (Zaitsev, et al), [16] se ha formulado un criterio para reconocer si una tabla de elección dada define una función de lógica difusa y se ha propuesto un algoritmo simple de síntesis de funciones de lógica difusa basado en conceptos introducidos de constituyentes de mínimo y máximo. Una función de lógica difusa representa una disyunción de constituyentes de mínimo, donde un constituyente de mínimo es una conjunción de variables del área actual mayor o igual al valor de la función en esta área (a la derecha del valor de la función en la desigualdad, incluyendo el valor de la función).
Otro conjunto de operadores Y/O se basa en la multiplicación, donde
xY y = x*yNO x = 1 - xPor eso,x O y = NO( Y( NO(x), NO(y) ) )x O y = NO (Y (1-x, 1-y))x O y = NO( (1-x)*(1-y) )x O y = 1-(1-x)*(1-y)x O y = x+y-xy
Dados dos de Y/O/NO, es posible derivar el tercero. La generalización de AND es un ejemplo de norma t .
Las reglas SI-ENTONCES asignan valores de verdad de entrada o calculados a valores de verdad de salida deseados. Ejemplo:
SI la temperatura ES muy fría ENTONCES fan_speed se detieneSI la temperatura ES fría ENTONCES la velocidad del ventilador es lentaSI la temperatura ES cálida ENTONCES la velocidad del ventilador es moderadaSI la temperatura ES alta ENTONCES la velocidad del ventilador es alta
Dada una determinada temperatura, la variable difusa caliente tiene un determinado valor de verdad, que se copia en la variable alta .
Si una variable de salida ocurre en varias partes ENTONCES, los valores de las partes SI respectivas se combinan usando el operador O.
El objetivo es obtener una variable continua a partir de valores de verdad difusos. [ cita necesaria ]
Esto sería fácil si los valores de verdad de salida fueran exactamente los obtenidos de la difusificación de un número determinado. Sin embargo, dado que todos los valores de verdad de salida se calculan de forma independiente, en la mayoría de los casos no representan dicho conjunto de números. [ cita necesaria ] Luego, uno tiene que decidir por un número que coincida mejor con la "intención" codificada en el valor de verdad. Por ejemplo, para varios valores de verdad de fan_speed, se debe encontrar la velocidad real que mejor se ajuste a los valores de verdad calculados de las variables "lento", "moderado", etc. [ cita necesaria ]
No existe un algoritmo único para este propósito.
Un algoritmo común es
El sistema TSK [17] es similar a Mamdani, pero el proceso de defusificación se incluye en la ejecución de las reglas difusas. Estos también están adaptados, de modo que, en cambio, el consecuente de la regla se representa mediante una función polinómica (normalmente constante o lineal). Un ejemplo de regla con una salida constante sería:
SI la temperatura ES muy fría = 2
En este caso, la salida será igual a la constante del consecuente (por ejemplo, 2). En la mayoría de los escenarios tendríamos una base de reglas completa, con 2 o más reglas. Si este es el caso, la salida de toda la base de reglas será el promedio del consecuente de cada regla i (Y i ), ponderado según el valor de membresía de su antecedente (h i ):
Un ejemplo de una regla con una salida lineal sería:
SI la temperatura ES muy fría Y la humedad ES alta = 2 * temperatura + 1 * humedad
En este caso, la salida de la regla será el resultado de la función en el consecuente. Las variables dentro de la función representan los valores de membresía después de la difusificación, no los valores nítidos. Igual que antes, en caso de que tengamos una base de reglas completa con 2 o más reglas, la salida total será el promedio ponderado entre la salida de cada regla.
La principal ventaja de utilizar TSK sobre Mamdani es que es computacionalmente eficiente y funciona bien con otros algoritmos, como el control PID y con algoritmos de optimización. También puede garantizar la continuidad de la superficie de salida. Sin embargo, Mamdani es más intuitivo y más fácil de trabajar para las personas. Por lo tanto, TSK se suele utilizar dentro de otros métodos complejos, como en los sistemas adaptativos de inferencia neurodifusa .
Dado que la salida del sistema difuso es un consenso de todas las entradas y todas las reglas, los sistemas de lógica difusa pueden comportarse bien cuando los valores de entrada no están disponibles o no son confiables. Opcionalmente, se pueden agregar ponderaciones a cada regla en la base de reglas y se pueden usar ponderaciones para regular el grado en que una regla afecta los valores de salida. Estas ponderaciones de reglas pueden basarse en la prioridad, confiabilidad o coherencia de cada regla. Estas ponderaciones de reglas pueden ser estáticas o pueden cambiarse dinámicamente, incluso en función del resultado de otras reglas.
La lógica difusa se utiliza en los sistemas de control para permitir que los expertos aporten reglas vagas como "si estás cerca de la estación de destino y te mueves rápido, aumenta la presión de los frenos del tren"; Estas reglas vagas pueden luego refinarse numéricamente dentro del sistema.
Muchas de las primeras aplicaciones exitosas de la lógica difusa se implementaron en Japón. Una primera aplicación notable fue en la serie Sendai Subway 1000 , en la que la lógica difusa pudo mejorar la economía, la comodidad y la precisión del viaje. También se ha utilizado para el reconocimiento de escritura a mano en computadoras de bolsillo Sony, ayudas para el vuelo de helicópteros, controles del sistema de metro, mejora de la eficiencia del combustible de los automóviles, controles de lavadoras con un solo botón, controles automáticos de potencia en aspiradoras y reconocimiento temprano de terremotos a través del Instituto de Sismología. Oficina de Meteorología, Japón. [18]
Las redes neuronales basadas en inteligencia artificial y la lógica difusa son, cuando se analizan, la misma cosa: la lógica subyacente de las redes neuronales es confusa. Una red neuronal tomará una variedad de entradas valoradas, les dará diferentes pesos entre sí, combinará valores intermedios un cierto número de veces y llegará a una decisión con un valor determinado. En ningún lugar de ese proceso hay nada parecido a las secuencias de decisiones entre uno u otro que caracterizan las matemáticas no difusas, la programación informática y la electrónica digital . En la década de 1980, los investigadores estaban divididos sobre cuál era el enfoque más eficaz para el aprendizaje automático : el aprendizaje mediante árboles de decisión o las redes neuronales. El primer enfoque utiliza lógica binaria, que coincide con el hardware en el que se ejecuta, pero a pesar de grandes esfuerzos no dio como resultado sistemas inteligentes. Las redes neuronales, por el contrario, dieron como resultado modelos precisos de situaciones complejas y pronto llegaron a una multitud de dispositivos electrónicos. [19] Ahora también se pueden implementar directamente en microchips analógicos, a diferencia de las implementaciones pseudoanalógicas anteriores en chips digitales. La mayor eficiencia de estos compensa la menor precisión intrínseca de los analógicos en diversos casos de uso.
La lógica difusa es un concepto importante en la toma de decisiones médicas . Dado que los datos médicos y sanitarios pueden ser subjetivos o confusos, las aplicaciones en este dominio tienen un gran potencial para beneficiarse mucho mediante el uso de enfoques basados en lógica difusa.
La lógica difusa se puede utilizar en muchos aspectos diferentes dentro del marco de la toma de decisiones médicas. Dichos aspectos incluyen [20] [21] [22] [ aclaración necesaria ] en análisis de imágenes médicas , análisis de señales biomédicas, segmentación de imágenes [23] o señales, y extracción /selección de características de imágenes [23] o señales. [24]
La pregunta más importante en esta área de aplicación es cuánta información útil se puede obtener cuando se utiliza la lógica difusa. Un desafío importante es cómo derivar los datos difusos necesarios. Esto es aún más desafiante cuando uno tiene que obtener dichos datos de humanos (generalmente, pacientes). Como se ha dicho
"La envoltura de lo que se puede lograr y lo que no se puede lograr en el diagnóstico médico, irónicamente, es en sí misma confusa"
— Siete desafíos, 2019. [25]
Cómo obtener datos confusos y cómo validar la precisión de los datos sigue siendo un esfuerzo en curso, fuertemente relacionado con la aplicación de la lógica difusa. El problema de evaluar la calidad de los datos borrosos es difícil. Esta es la razón por la que la lógica difusa es una posibilidad muy prometedora dentro del área de aplicación de la toma de decisiones médicas, pero aún requiere más investigación para alcanzar su máximo potencial. [25] Aunque el concepto de utilizar la lógica difusa en la toma de decisiones médicas es apasionante, todavía existen varios desafíos que enfrentan los enfoques difusos dentro del marco de la toma de decisiones médicas.
Una de las áreas de aplicación comunes de la lógica difusa es el diagnóstico asistido por ordenador basado en imágenes en medicina. [26] El diagnóstico asistido por computadora es un conjunto computarizado de herramientas interrelacionadas que pueden usarse para ayudar a los médicos en la toma de decisiones diagnósticas. Por ejemplo, cuando un médico encuentra una lesión anormal pero aún en una etapa muy temprana de desarrollo, puede utilizar el diagnóstico asistido por computadora para caracterizar la lesión y diagnosticar su naturaleza. La lógica difusa puede ser muy apropiada para describir las características clave de esta lesión.
Una vez definidas las relaciones difusas, es posible desarrollar bases de datos relacionales difusas . La primera base de datos relacional difusa, FRDB, apareció en la disertación de Maria Zemankova (1983). Posteriormente surgieron algunos otros modelos como el modelo Buckles-Petry, el modelo Prade-Testemale, el modelo Umano-Fukami o el modelo GEFRED de JM Medina, MA Vila et al.
Se han definido lenguajes de consulta difusa, como el SQLf de P. Bosc et al. y el FSQL de J. Galindo et al. Estos lenguajes definen algunas estructuras para incluir aspectos difusos en las declaraciones SQL, como condiciones difusas, comparadores difusos, constantes difusas, restricciones difusas, umbrales difusos, etiquetas lingüísticas, etc.
En lógica matemática , existen varios sistemas formales de "lógica difusa", la mayoría de los cuales pertenecen a la familia de las lógicas difusas de norma t .
Las lógicas difusas proposicionales más importantes son:
De manera similar a la forma en que se crea la lógica de predicados a partir de la lógica proposicional , la lógica difusa de predicados extiende los sistemas difusos mediante cuantificadores universales y existenciales . La semántica del cuantificador universal en lógicas difusas de norma t es el mínimo de los grados de verdad de las instancias de la subfórmula cuantificada, mientras que la semántica del cuantificador existencial es el supremo de la misma.
Las nociones de "subconjunto decidible" y " subconjunto recursivamente enumerable " son básicas para las matemáticas clásicas y la lógica clásica . Por tanto, la cuestión de una extensión adecuada de ellos a la teoría de conjuntos difusos es crucial. La primera propuesta en esta dirección fue hecha por ES Santos mediante las nociones de máquina de Turing difusa , algoritmo difuso normal de Markov y programa difuso (ver Santos 1970). L. Biacino y G. Gerla argumentaron sucesivamente que las definiciones propuestas son bastante cuestionables. Por ejemplo, en [27] se muestra que las máquinas de Turing difusas no son adecuadas para la teoría del lenguaje difuso, ya que existen lenguajes difusos naturales intuitivamente computables que no pueden ser reconocidos por una máquina de Turing difusa. Luego propusieron las siguientes definiciones. Denotemos por Ü el conjunto de números racionales en [0,1]. Entonces un subconjunto difuso s : S [0,1] de un conjunto S es recursivamente enumerable si existe un mapa recursivo h : S × N Ü tal que, para cada x en S , la función h ( x , n ) aumenta con con respecto a n y s ( x ) = lim h ( x , n ). Decimos que s es decidible si tanto s como su complemento – s son recursivamente enumerables. Es posible una extensión de dicha teoría al caso general de los subconjuntos L (ver Gerla 2006). Las definiciones propuestas están bien relacionadas con la lógica difusa. De hecho, el siguiente teorema es válido (siempre que el aparato de deducción de la lógica difusa considerada satisfaga alguna propiedad de efectividad obvia).
Cualquier teoría difusa "axiomatizable" es recursivamente enumerable. En particular, el conjunto difuso de fórmulas lógicamente verdaderas es recursivamente enumerable a pesar de que el conjunto nítido de fórmulas válidas no es recursivamente enumerable, en general. Además, cualquier teoría axiomatizable y completa es decidible.
Es una cuestión abierta dar apoyo a una "tesis de la Iglesia" para las matemáticas difusas , la noción propuesta de enumerabilidad recursiva para subconjuntos difusos es la adecuada. Para solucionar esto es necesaria una ampliación de las nociones de gramática difusa y máquina de Turing difusa. Otra cuestión abierta es partir de esta noción para encontrar una extensión de los teoremas de Gödel a la lógica difusa.
La lógica difusa y la probabilidad abordan diferentes formas de incertidumbre. Si bien tanto la lógica difusa como la teoría de la probabilidad pueden representar grados de ciertos tipos de creencias subjetivas, la teoría de conjuntos difusos utiliza el concepto de pertenencia a conjuntos difusos, es decir, cuánto se encuentra una observación dentro de un conjunto vagamente definido, y la teoría de la probabilidad utiliza el concepto de probabilidad subjetiva. , es decir, frecuencia de ocurrencia o probabilidad de algún evento o condición [ se necesita aclaración ] . El concepto de conjuntos difusos se desarrolló a mediados del siglo XX en Berkeley [28] como respuesta a la falta de una teoría de probabilidad para modelar conjuntamente la incertidumbre y la vaguedad . [29]
Bart Kosko afirma en Fuzziness vs. Probability [30] que la teoría de la probabilidad es una subteoría de la lógica difusa, ya que las cuestiones sobre los grados de creencia en la pertenencia a conjuntos mutuamente excluyentes en la teoría de la probabilidad pueden representarse como ciertos casos de pertenencia graduada no mutuamente excluyente. en teoría difusa. En ese contexto, también deriva el teorema de Bayes del concepto de subconjunto difuso. Lotfi A. Zadeh sostiene que la lógica difusa tiene un carácter diferente a la probabilidad y no la reemplaza. Convirtió la probabilidad en probabilidad difusa y también la generalizó a la teoría de la posibilidad . [31]
De manera más general, la lógica difusa es una de las muchas extensiones diferentes de la lógica clásica destinadas a abordar cuestiones de incertidumbre fuera del alcance de la lógica clásica, la inaplicabilidad de la teoría de la probabilidad en muchos dominios y las paradojas de la teoría de Dempster-Shafer .
La teórica computacional Leslie Valiant utiliza el término ecoritmos para describir cuántos sistemas y técnicas menos exactos, como la lógica difusa (y la lógica "menos robusta"), se pueden aplicar a los algoritmos de aprendizaje . Valiant esencialmente redefine el aprendizaje automático como evolutivo. En uso general, los ecoritmos son algoritmos que aprenden de sus entornos más complejos (de ahí eco- ) para generalizar, aproximar y simplificar la lógica de solución. Al igual que la lógica difusa, son métodos que se utilizan para superar variables continuas o sistemas demasiado complejos para enumerarlos o comprenderlos por completo de manera discreta o exacta. [32] Los ecoritmos y la lógica difusa también tienen la propiedad común de tratar con posibilidades más que con probabilidades, aunque la retroalimentación y la retroalimentación , básicamente pesos estocásticos, son una característica de ambos cuando se trata, por ejemplo, de sistemas dinámicos .
Otro sistema lógico donde los valores de verdad son números reales entre 0 y 1 y donde los operadores AND y OR se reemplazan por MIN y MAX es la lógica G ∞ de Gödel . Esta lógica tiene muchas similitudes con la lógica difusa pero define la negación de manera diferente y tiene una implicación interna. La negación y la implicación se definen de la siguiente manera:
lo que convierte el sistema lógico resultante en un modelo para la lógica intuicionista , haciéndolo particularmente bien comportado entre todas las opciones posibles de sistemas lógicos con números reales entre 0 y 1 como valores de verdad. En este caso, la implicación puede interpretarse como "x es menos verdadera que y" y la negación como "x es menos verdadera que 0" o "x es estrictamente falsa", y para cualquiera y tenemos eso . En particular, en la lógica de Gödel la negación ya no es una involución y la doble negación asigna cualquier valor distinto de cero a 1.
La lógica difusa compensatoria (CFL) es una rama de la lógica difusa con reglas modificadas para conjunción y disyunción. Cuando el valor de verdad de un componente de una conjunción o disyunción aumenta o disminuye, el otro componente disminuye o aumenta para compensar. Este aumento o disminución del valor de verdad puede verse compensado por el aumento o disminución de otro componente. Una compensación puede bloquearse cuando se alcanzan ciertos umbrales. Proponentes [ ¿quién? ] afirman que CFL permite mejores comportamientos semánticos computacionales e imita el lenguaje natural. [ vago ] [33] [34]
Según Jesús Cejas Montero (2011) La lógica difusa compensatoria consta de cuatro operadores continuos: conjunción (c); disyunción (d); orden estricto difuso (o); y negación (n). La conjunción es la media geométrica y su dual como operadores conjuntivos y disyuntivos. [35]
El IEEE 1855 , el ESTÁNDAR IEEE 1855–2016, trata sobre un lenguaje de especificación llamado Fuzzy Markup Language (FML) [36] desarrollado por la IEEE Standards Association . FML permite modelar un sistema de lógica difusa de forma legible por humanos e independiente del hardware. FML se basa en el lenguaje de marcado extensible ( XML ). Los diseñadores de sistemas difusos con FML cuentan con una metodología unificada y de alto nivel para describir sistemas difusos interoperables. IEEE STANDARD 1855–2016 utiliza el lenguaje de definición de esquemas XML del W3C para definir la sintaxis y la semántica de los programas FML.
Antes de la introducción de FML, los profesionales de la lógica difusa podían intercambiar información sobre sus algoritmos difusos agregando a sus funciones de software la capacidad de leer, analizar correctamente y almacenar el resultado de su trabajo en una forma compatible con el lenguaje de control difuso (FCL). descrito y especificado por la Parte 7 de IEC 61131 . [37] [38]
{{cite book}}
: CS1 maint: location missing publisher (link)