stringtranslate.com

conjunto aproximado

En informática , un conjunto aproximado , descrito por primera vez por el informático polaco Zdzisław I. Pawlak , es una aproximación formal de un conjunto nítido (es decir, un conjunto convencional) en términos de un par de conjuntos que dan la aproximación inferior y superior de la conjunto original. En la versión estándar de la teoría aproximada de conjuntos (Pawlak 1991), los conjuntos de aproximación inferior y superior son conjuntos nítidos, pero en otras variaciones, los conjuntos de aproximación pueden ser conjuntos difusos .

Definiciones

La siguiente sección contiene una descripción general del marco básico de la teoría aproximada de conjuntos, tal como lo propuso originalmente Zdzisław I. Pawlak , junto con algunas de las definiciones clave. Se pueden encontrar propiedades más formales y límites de conjuntos aproximados en Pawlak (1991) y en las referencias citadas. La teoría inicial y básica de los conjuntos aproximados a veces se denomina "Conjuntos aproximados de Pawlak" o "conjuntos aproximados clásicos" , como un medio para distinguirla de extensiones y generalizaciones más recientes.

Marco del sistema de información

Sea un sistema de información ( sistema atributo-valor ), donde es un conjunto finito y no vacío de objetos (el universo) y es un conjunto finito y no vacío de atributos tal que para cada . es el conjunto de valores que puede tomar ese atributo. La tabla de información asigna un valor a cada atributo y objeto del universo .

Con cualquiera existe una relación de equivalencia asociada :

La relación se llama relación de indiscernibilidad . La partición de es una familia de todas las clases de equivalencia de y se denota por (o ).

Si , entonces y son indiscernibles (o indistinguibles) por los atributos de .

Se denotan las clases de equivalencia de la relación de indiscernibilidad .

Ejemplo: estructura de clases de equivalencia

Por ejemplo, considere la siguiente tabla de información:

Cuando se considera el conjunto completo de atributos , vemos que tenemos las siguientes siete clases de equivalencia:

Por lo tanto, los dos objetos dentro de la primera clase de equivalencia, no se pueden distinguir entre sí según los atributos disponibles, y los tres objetos dentro de la segunda clase de equivalencia, no se pueden distinguir entre sí según los atributos disponibles. Los cinco objetos restantes son discernibles de todos los demás objetos.

Es evidente que diferentes selecciones de subconjuntos de atributos conducirán en general a diferentes clases de indiscernibilidad. Por ejemplo, si se selecciona el atributo solo, obtenemos la siguiente estructura de clases de equivalencia, mucho más burda:

Definición de un conjunto aproximado

Sea un conjunto de objetivos que deseamos representar utilizando el subconjunto de atributos ; es decir, se nos dice que un conjunto arbitrario de objetos comprende una única clase y deseamos expresar esta clase (es decir, este subconjunto) utilizando las clases de equivalencia inducidas por el atributo subconjunto . En general, no se puede expresar exactamente porque el conjunto puede incluir y excluir objetos que son indistinguibles según sus atributos .

Por ejemplo, considere el conjunto de objetivos y deje que el subconjunto de atributos sea el conjunto completo de funciones disponibles. El conjunto no se puede expresar exactamente, porque en , los objetos son indiscernibles. Por tanto, no hay forma de representar ningún conjunto que incluya pero excluya objetos y .

Sin embargo, el conjunto de objetivos se puede aproximar utilizando solo la información contenida en él mediante la construcción de las aproximaciones inferior y superior de :

Aproximación inferior y región positiva.

La aproximación inferior , o región positiva , es la unión de todas las clases de equivalencia que están contenidas en (es decir, son subconjuntos de) el conjunto objetivo; en el ejemplo, la unión de las dos clases de equivalencia que están contenidas en el conjunto de objetivos. La aproximación inferior es el conjunto completo de objetos que pueden clasificarse positivamente (es decir, sin ambigüedades) como pertenecientes al conjunto objetivo .

Aproximación superior y región negativa.

La aproximación superior es la unión de todas las clases de equivalencia que tienen una intersección no vacía con el conjunto de objetivos; en el ejemplo, la unión de las tres clases de equivalencia que tienen una intersección no vacía con el conjunto de objetivos. La aproximación superior es el conjunto completo de objetos que no pueden clasificarse positivamente (es decir, sin ambigüedades) como pertenecientes al complemento ( ) del conjunto objetivo . En otras palabras, la aproximación superior es el conjunto completo de objetos que posiblemente sean miembros del conjunto objetivo .

Por lo tanto, el conjunto representa la región negativa , que contiene el conjunto de objetos que pueden descartarse definitivamente como miembros del conjunto objetivo.

Región fronteriza

La región límite , dada por la diferencia de conjuntos , consta de aquellos objetos que no pueden incluirse ni descartarse como miembros del conjunto objetivo .

En resumen, la aproximación inferior de un conjunto objetivo es una aproximación conservadora que consta únicamente de aquellos objetos que pueden identificarse positivamente como miembros del conjunto. (Estos objetos no tienen "clones" indiscernibles que estén excluidos del conjunto de objetivos). La aproximación superior es una aproximación liberal que incluye todos los objetos que podrían ser miembros del conjunto de objetivos. (Algunos objetos en la aproximación superior pueden no ser miembros del conjunto objetivo). Desde la perspectiva de , la aproximación inferior contiene objetos que son miembros del conjunto objetivo con certeza (probabilidad = 1), mientras que la aproximación superior contiene objetos que son miembros del conjunto objetivo. miembros del conjunto objetivo con probabilidad distinta de cero (probabilidad > 0).

El conjunto aproximado

La tupla compuesta por la aproximación inferior y superior se denomina conjunto aproximado ; por lo tanto, un conjunto aproximado se compone de dos conjuntos nítidos, uno que representa un límite inferior del conjunto objetivo y el otro que representa un límite superior del conjunto objetivo .

La precisión de la representación aproximada del conjunto puede obtenerse (Pawlak 1991) de la siguiente manera:

Es decir, la precisión de la representación del conjunto aproximado de , , , es la relación entre el número de objetos que se pueden colocar positivamente y el número de objetos que posiblemente se pueden colocar ; esto proporciona una medida de qué tan cerca está el conjunto aproximado. se aproxima al objetivo fijado. Claramente, cuando las aproximaciones superior e inferior son iguales (es decir, la región límite está vacía), entonces , y la aproximación es perfecta; en el otro extremo, siempre que la aproximación inferior esté vacía, la precisión es cero (independientemente del tamaño de la aproximación superior).

Análisis objetivo

La teoría de conjuntos aproximados es uno de los muchos métodos que se pueden emplear para analizar sistemas inciertos (incluidos los vagos), aunque menos común que los métodos más tradicionales de probabilidad , estadística , entropía y teoría de Dempster-Shafer . Sin embargo, una diferencia clave, y una fortaleza única, del uso de la teoría clásica de conjuntos aproximados es que proporciona una forma objetiva de análisis (Pawlak et al. 1995). A diferencia de otros métodos, como los mencionados anteriormente, el análisis de conjuntos aproximado clásico no requiere información adicional, parámetros externos, modelos, funciones, grados o interpretaciones subjetivas para determinar la pertenencia al conjunto; en cambio, sólo utiliza la información presentada dentro de los datos dados (Düntsch y Gediga 1995). ). Adaptaciones más recientes de la teoría de conjuntos aproximados, como los conjuntos aproximados basados ​​en la dominancia, la teoría de la decisión y los conjuntos aproximados difusos, han introducido más subjetividad en el análisis.

Definibilidad

En general, las aproximaciones superior e inferior no son iguales; en tales casos, decimos que el conjunto de objetivos no es definible o se puede definir de manera aproximada en el conjunto de atributos . Cuando las aproximaciones superior e inferior son iguales (es decir, el límite está vacío), entonces el conjunto de objetivos se puede definir en el conjunto de atributos . Podemos distinguir los siguientes casos especiales de indefinibilidad:

Reducir y núcleo

Una pregunta interesante es si hay atributos en el sistema de información (tabla atributo-valor) que sean más importantes que otros atributos para el conocimiento representado en la estructura de clases de equivalencia. A menudo nos preguntamos si existe un subconjunto de atributos que puedan, por sí solos, caracterizar completamente el conocimiento de la base de datos; un conjunto de atributos de este tipo se denomina reducción .

Formalmente, una reducción es un subconjunto de atributos tales que

Se puede considerar una reducción como un conjunto suficiente de características, es decir, suficiente para representar la estructura de categorías. En la tabla de ejemplo anterior, el conjunto de atributos es una reducción: el sistema de información proyectado solo sobre estos atributos posee la misma estructura de clases de equivalencia que la expresada por el conjunto de atributos completo:

El conjunto de atributos es una reducción porque la eliminación de cualquiera de estos atributos provoca un colapso de la estructura de clases de equivalencia, con el resultado de que .

La reducción de un sistema de información no es única : puede haber muchos subconjuntos de atributos que preservan la estructura de clases de equivalencia (es decir, el conocimiento) expresada en el sistema de información. En el sistema de información de ejemplo anterior, otra reducción es , lo que produce la misma estructura de clases de equivalencia que .

El conjunto de atributos que es común a todos los reductos se llama núcleo : el núcleo es el conjunto de atributos que posee cada reducto y, por lo tanto, consta de atributos que no pueden eliminarse del sistema de información sin causar el colapso de la clase de equivalencia. estructura. El núcleo puede considerarse como el conjunto de atributos necesarios , es decir, necesarios para que se represente la estructura de categorías. En el ejemplo, el único atributo de este tipo es ; cualquiera de los otros atributos se puede eliminar individualmente sin dañar la estructura de clases de equivalencia y, por lo tanto, todos ellos son prescindibles . Sin embargo, la eliminación por sí sola cambia la estructura de clases de equivalencia y, por tanto, es el atributo indispensable de este sistema de información y, por tanto, el núcleo.

Es posible que el núcleo esté vacío, lo que significa que no hay ningún atributo indispensable: cualquier atributo individual en dicho sistema de información puede eliminarse sin alterar la estructura de clases de equivalencia. En tales casos, no existe ningún atributo esencial o necesario que se requiera para representar la estructura de clases.

Dependencia de atributos

Uno de los aspectos más importantes del análisis de bases de datos o de la adquisición de datos es el descubrimiento de dependencias de atributos; es decir, deseamos descubrir qué variables están fuertemente relacionadas con qué otras variables. Generalmente, son estas fuertes relaciones las que justificarán una mayor investigación y las que, en última instancia, serán útiles en el modelado predictivo.

En la teoría aproximada de conjuntos, la noción de dependencia se define de manera muy simple. Tomemos dos conjuntos (separados) de atributos, set y set , y preguntemos qué grado de dependencia existe entre ellos. Cada conjunto de atributos induce una estructura de clases de equivalencia (indiscernibilidad), las clases de equivalencia inducidas por dada por y las clases de equivalencia inducidas por dada por .

Sea , ¿dónde está una clase de equivalencia dada a partir de la estructura de clases de equivalencia inducida por el conjunto de atributos ? Entonces, la dependencia del conjunto de atributos respecto del conjunto de atributos , está dada por

Es decir, para cada clase de equivalencia en , sumamos el tamaño de su aproximación inferior por los atributos en , es decir, . Esta aproximación (como arriba, para un conjunto arbitrario ) es el número de objetos que en un conjunto de atributos pueden identificarse positivamente como pertenecientes al conjunto objetivo . Sumado a todas las clases de equivalencia en , el numerador anterior representa el número total de objetos que, según el conjunto de atributos , se pueden categorizar positivamente de acuerdo con la clasificación inducida por los atributos . Por lo tanto, la relación de dependencia expresa la proporción (dentro del universo entero) de tales objetos clasificables. La dependencia "puede interpretarse como una proporción de tales objetos en el sistema de información para los cuales es suficiente conocer los valores de los atributos en para determinar los valores de los atributos en ".

Otra forma intuitiva de considerar la dependencia es tomar la partición inducida por como clase objetivo y considerarla como el conjunto de atributos que deseamos usar para "reconstruir" la clase objetivo . Si se puede reconstruir completamente , entonces depende totalmente de ; si da como resultado una reconstrucción pobre y quizás aleatoria de , entonces no depende en absoluto.

Así, esta medida de dependencia expresa el grado de dependencia funcional (es decir, determinista) de un conjunto de atributos entre sí ; no es simétrico. La relación de esta noción de dependencia de atributos con nociones más tradicionales de teoría de la información (es decir, entrópicas) de dependencia de atributos se ha discutido en varias fuentes (p. ej., Pawlak, Wong y Ziarko 1988; Yao y Yao 2002; Wong, Ziarko , y Ye 1986, Quafafou y Boussouf 2000).

Extracción de reglas

Las representaciones de categorías analizadas anteriormente son todas de naturaleza extensional ; es decir, una categoría o clase compleja es simplemente la suma de todos sus miembros. Representar una categoría es, entonces, simplemente poder enumerar o identificar todos los objetos pertenecientes a esa categoría. Sin embargo, las representaciones de categorías extensionales tienen un uso práctico muy limitado, porque no proporcionan información para decidir si objetos nuevos (nunca antes vistos) son miembros de la categoría.

Lo que generalmente se desea es una descripción intencional de la categoría, una representación de la categoría basada en un conjunto de reglas que describen el alcance de la categoría. La elección de tales reglas no es única y ahí radica la cuestión del sesgo inductivo . Consulte Espacio de versión y Selección de modelo para obtener más información sobre este tema.

Existen algunos métodos de extracción de reglas. Partiremos de un procedimiento de extracción de reglas basado en Ziarko y Shan (1995).

Matrices de decisión

Digamos que deseamos encontrar el conjunto mínimo de reglas consistentes ( implicaciones lógicas ) que caracterizan nuestro sistema muestral. Para un conjunto de atributos de condición y un atributo de decisión , estas reglas deben tener la forma , o, detalladamente,

donde son valores legítimos de los dominios de sus respectivos atributos. Esta es una forma típica de las reglas de asociación , y el número de elementos en los que coinciden la condición/antecedente se denomina soporte de la regla. El método para extraer tales reglas dado en Ziarko y Shan (1995) es formar una matriz de decisión correspondiente a cada valor individual del atributo de decisión . De manera informal, la matriz de decisión para el valor del atributo de decisión enumera todos los pares atributo-valor que difieren entre los objetos que tienen y .

Esto se explica mejor con un ejemplo (que también evita mucha notación). Considere la tabla anterior, y sean la variable de decisión (es decir, la variable en el lado derecho de las implicaciones) y sean las variables de condición (en el lado izquierdo de las implicaciones). Observamos que la variable de decisión toma dos valores diferentes, a saber . Tratamos cada caso por separado.

Primero, miramos el caso y lo dividimos en objetos que tienen y aquellos que tienen . (Tenga en cuenta que los objetos con en este caso son simplemente los objetos que tienen , pero en general incluirían todos los objetos que tienen cualquier valor distinto de , y puede haber varias clases de objetos de este tipo (por ejemplo, aquellos que tienen ).) En este En este caso, los objetos que tienen son mientras que los objetos que tienen son . La matriz de decisión para enumera todas las diferencias entre los objetos que tienen y los que tienen ; es decir, la matriz de decisión enumera todas las diferencias entre y . Ponemos los objetos "positivos" ( ) como filas y los objetos "negativos" como columnas.

Para leer esta matriz de decisión, observe, por ejemplo, la intersección de fila y columna , que se muestra en la celda. Esto significa que con respecto al valor de decisión , el objeto difiere del objeto en los atributos y , y los valores particulares de estos atributos para el objeto positivo son y . Esto nos dice que la clasificación correcta de como perteneciente a una clase de decisión se basa en atributos y ; aunque uno u otro pueda ser prescindible, sabemos que al menos uno de estos atributos es prescindible .

A continuación, a partir de cada matriz de decisión formamos un conjunto de expresiones booleanas , una expresión para cada fila de la matriz. Los elementos dentro de cada celda se agregan de forma disyuntiva y, luego, las celdas individuales se agregan de forma conjuntiva. Así, para la tabla anterior tenemos las siguientes cinco expresiones booleanas:

Cada afirmación aquí es esencialmente una regla muy específica (probablemente demasiado específica) que rige la pertenencia a una clase del objeto correspondiente. Por ejemplo, la última declaración, correspondiente al objeto , establece que se debe cumplir todo lo siguiente:

  1. Debe tener el valor 2, el valor 0 o ambos.
  2. debe tener valor 0.
  3. Debe tener el valor 2, el valor 0 o ambos.
  4. Debe tener el valor 2, o debe tener el valor 0, o debe tener el valor 0, o cualquier combinación de los mismos.
  5. debe tener valor 0.

Está claro que aquí hay una gran cantidad de redundancia y el siguiente paso es simplificar utilizando el álgebra booleana tradicional . La declaración correspondiente a los objetos se simplifica a , lo que produce la implicación

Asimismo, el enunciado correspondiente a objetos se simplifica a . Esto nos da la implicación

Las implicaciones anteriores también se pueden escribir como el siguiente conjunto de reglas:

Se puede observar que cada una de las dos primeras reglas tiene un soporte de 1 (es decir, el antecedente coincide con dos objetos), mientras que cada una de las dos últimas reglas tiene un soporte de 2. Para terminar de escribir el conjunto de reglas para este sistema de conocimiento, Se debe seguir el mismo procedimiento anterior (comenzando por escribir una nueva matriz de decisión) para el caso de , generando así un nuevo conjunto de implicaciones para ese valor de decisión (es decir, un conjunto de implicaciones con como consecuente). En general, el procedimiento se repetirá para cada valor posible de la variable de decisión.

Sistema de inducción de reglas LERS

El sistema de datos LERS (Aprendizaje a partir de ejemplos basados ​​en conjuntos aproximados) de Grzymala-Busse (1997) puede inducir reglas a partir de datos inconsistentes, es decir, datos con objetos en conflicto. Dos objetos están en conflicto cuando se caracterizan por los mismos valores de todos los atributos, pero pertenecen a conceptos (clases) diferentes. LERS utiliza la teoría aproximada de conjuntos para calcular aproximaciones inferiores y superiores de conceptos involucrados en conflictos con otros conceptos.

Las reglas inducidas a partir de la aproximación inferior del concepto ciertamente describen el concepto, de ahí que tales reglas se llamen ciertas . Por otro lado, las reglas inducidas a partir de la aproximación superior del concepto describen el concepto posiblemente , por lo que estas reglas se denominan posibles . Para la inducción de reglas, LERS utiliza tres algoritmos: LEM1, LEM2 e IRIM.

El algoritmo LEM2 de LERS se utiliza con frecuencia para la inducción de reglas y se utiliza no sólo en LERS sino también en otros sistemas, por ejemplo, en RSES (Bazan et al. (2004). LEM2 explora el espacio de búsqueda de pares atributo-valor . Su entrada El conjunto de datos es una aproximación inferior o superior de un concepto, por lo que su conjunto de datos de entrada siempre es consistente. En general, LEM2 calcula una cobertura local y luego la convierte en un conjunto de reglas. Citaremos algunas definiciones para describir el algoritmo LEM2.

El algoritmo LEM2 se basa en la idea de un bloque de par atributo-valor. Sea una aproximación superior o inferior no vacía de un concepto representado por un par de valor de decisión . El conjunto depende de un conjunto de pares atributo-valor si y sólo si

Set es un complejo mínimo de si y solo si depende de y no existe un subconjunto adecuado de tal que dependa de . Sea una colección no vacía de conjuntos no vacíos de pares atributo-valor. Entonces es una cobertura local de si y sólo si se cumplen las tres condiciones siguientes:

cada miembro de es un complejo mínimo de ,

es mínimo, es decir, tiene el menor número posible de miembros.

Para nuestro sistema de información de muestra, LEM2 inducirá las siguientes reglas:

Se pueden encontrar otros métodos de aprendizaje de reglas, por ejemplo, en Pawlak (1991), Stefanowski (1998), Bazan et al. (2004), etc.

Datos incompletos

La teoría de conjuntos aproximados es útil para la inducción de reglas a partir de conjuntos de datos incompletos. Usando este enfoque podemos distinguir entre tres tipos de valores de atributos faltantes: valores perdidos (los valores que se registraron pero que actualmente no están disponibles), valores de conceptos de atributos (estos valores de atributos faltantes pueden ser reemplazados por cualquier valor de atributo limitado al mismo concepto) y condiciones de "no importa" (los valores originales eran irrelevantes). Un concepto ( clase ) es un conjunto de todos los objetos clasificados (o diagnosticados) de la misma manera.

Se estudiaron exhaustivamente dos conjuntos de datos especiales con valores de atributos faltantes: en el primer caso, se perdieron todos los valores de atributos faltantes (Stefanowski y Tsoukias, 2001), en el segundo caso, todos los valores de atributos faltantes eran condiciones de "no importa" (Kryszkiewicz, 1999).

En la interpretación de valores de concepto-atributo de un valor de atributo faltante, el valor de atributo faltante puede ser reemplazado por cualquier valor del dominio de atributo restringido al concepto al que pertenece el objeto con un valor de atributo faltante (Grzymala-Busse y Grzymala-Busse, 2007 ). Por ejemplo, si para un paciente falta el valor de un atributo Temperatura, este paciente está enfermo con gripe y todos los pacientes restantes enfermos con gripe tienen valores altos o muy altos para Temperatura cuando se utiliza la interpretación del valor del atributo faltante como el valor del concepto de atributo, reemplazaremos el valor del atributo que falta con alto y muy alto. Además, la relación característica (ver, por ejemplo, Grzymala-Busse y Grzymala-Busse, 2007) permite procesar conjuntos de datos con los tres tipos de valores de atributos faltantes al mismo tiempo: pérdida, condiciones de "no me importa" y condiciones de atributo. -Valores conceptuales.

Aplicaciones

Los métodos aproximados se pueden aplicar como componente de soluciones híbridas en aprendizaje automático y minería de datos . Se ha descubierto que son particularmente útiles para la inducción de reglas y la selección de características ( reducción de dimensionalidad que preserva la semántica ). Los métodos de análisis de datos basados ​​en conjuntos aproximados se han aplicado con éxito en bioinformática , economía y finanzas, medicina, multimedia, minería web y de textos , procesamiento de señales e imágenes, ingeniería de software , robótica e ingeniería (por ejemplo, sistemas de energía e ingeniería de control ). Recientemente, las tres regiones de conjuntos aproximados se interpretan como regiones de aceptación, rechazo y aplazamiento. Esto conduce a un enfoque de toma de decisiones de tres vías con el modelo que potencialmente puede conducir a aplicaciones futuras interesantes.

Historia

La idea de conjunto aproximado fue propuesta por Pawlak (1981) como una nueva herramienta matemática para tratar conceptos vagos. Comer, Grzymala-Busse, Iwinski, Nieminen, Novotny, Pawlak, Obtulowicz y Pomykala han estudiado las propiedades algebraicas de conjuntos aproximados. P. Pagliani, I. Duntsch, MK Chakraborty, M. Banerjee y A. Mani han desarrollado diferentes semánticas algebraicas; D. Cattaneo y A. Mani, en particular, los han ampliado a conjuntos aproximados más generalizados. Se pueden utilizar conjuntos aproximados para representar ambigüedad , vaguedad e incertidumbre general .

Extensiones y generalizaciones

Desde el desarrollo de conjuntos aproximados, las extensiones y generalizaciones han seguido evolucionando. Los desarrollos iniciales se centraron en la relación (tanto en similitudes como en diferencias) con los conjuntos difusos . Si bien alguna literatura sostiene que estos conceptos son diferentes, otra literatura considera que los conjuntos aproximados son una generalización de los conjuntos difusos, representados a través de conjuntos aproximados difusos o conjuntos difusos aproximados. Pawlak (1995) consideró que los conjuntos difusos y aproximados deberían tratarse como complementarios entre sí, abordando diferentes aspectos de incertidumbre y vaguedad.

Tres extensiones notables de los conjuntos preliminares clásicos son:

Membresía difícil

Los conjuntos aproximados también se pueden definir, como una generalización, empleando una función de membresía aproximada en lugar de una aproximación objetiva. La función de membresía aproximada expresa una probabilidad condicional que pertenece a determinado . Esto se puede interpretar como un grado que pertenece a en términos de información sobre expresado por .

La membresía aproximada se diferencia principalmente de la membresía difusa en que la membresía de la unión y la intersección de conjuntos no pueden, en general, calcularse a partir de su membresía constituyente como es el caso de los conjuntos difusos. En esto, la membresía aproximada es una generalización de la membresía difusa. Además, la función de membresía aproximada se basa más en la probabilidad que los conceptos convencionales de la función de membresía difusa.

Otras generalizaciones

Se han introducido, estudiado y aplicado varias generalizaciones de conjuntos aproximados para la resolución de problemas. Estas son algunas de estas generalizaciones:

Ver también

Referencias

Otras lecturas

enlaces externos