El análisis booleano fue introducido por Flament (1976). [1] El objetivo de un análisis booleano es detectar dependencias deterministas entre los ítems de un cuestionario o estructuras de datos similares en patrones de respuesta observados. Estas dependencias deterministas tienen la forma de fórmulas lógicas que conectan los ítems. Supongamos, por ejemplo, que un cuestionario contiene los ítems i , j y k . Ejemplos de tales dependencias deterministas son entonces i → j , i ∧ j → k y i ∨ j → k .
Desde el trabajo básico de Flament (1976) se han desarrollado varios métodos diferentes para el análisis booleano. Véase, por ejemplo, Buggenhaut y Degreef (1987), Duquenne (1987), análisis de árbol de ítems de Leeuwe (1974), Schrepp (1999) o Theuns (1998). Estos métodos comparten el objetivo de derivar dependencias deterministas entre los ítems de un cuestionario a partir de los datos, pero difieren en los algoritmos para alcanzar este objetivo.
El análisis booleano es un método exploratorio para detectar dependencias deterministas entre elementos. Las dependencias detectadas deben confirmarse en investigaciones posteriores. Los métodos de análisis booleano no presuponen que las dependencias detectadas describan los datos por completo. También puede haber otras dependencias probabilísticas. Por lo tanto, un análisis booleano intenta detectar estructuras deterministas interesantes en los datos, pero no tiene como objetivo descubrir todos los aspectos estructurales del conjunto de datos. Por lo tanto, tiene sentido utilizar otros métodos, como por ejemplo el análisis de clases latentes , junto con un análisis booleano.
La investigación de las dependencias deterministas tiene cierta tradición en la psicología educativa . Los ítems representan en este ámbito habitualmente habilidades o capacidades cognitivas de los sujetos. Bart y Airasian (1974) utilizan el análisis booleano para establecer implicaciones lógicas sobre un conjunto de tareas piagetianas . Otros ejemplos en esta tradición son las jerarquías de aprendizaje de Gagné (1968) o la teoría del aprendizaje estructural de Scandura (1971).
Existen varios intentos de utilizar el análisis booleano, especialmente el análisis de árboles de ítems , para construir espacios de conocimiento a partir de datos. Se pueden encontrar ejemplos en Held y Korossy (1998) o Schrepp (2002).
Los métodos de análisis booleano se utilizan en diversos estudios de ciencias sociales para comprender mejor la estructura de los datos dicotómicos . Bart y Krus (1973) utilizan, por ejemplo, el análisis booleano para establecer un orden jerárquico en los elementos que describen un comportamiento socialmente inaceptable. Janssens (1999) utilizó un método de análisis booleano para investigar el proceso de integración de las minorías en el sistema de valores de la cultura dominante. Romme (1995a) introdujo el análisis comparativo booleano en las ciencias de la gestión y lo aplicó en un estudio de los procesos de autoorganización en los equipos de gestión (Romme 1995b).
El análisis booleano tiene algunas relaciones con otras áreas de investigación. Existe una conexión estrecha entre el análisis booleano y los espacios de conocimiento . La teoría de los espacios de conocimiento proporciona un marco teórico para la descripción formal del conocimiento humano. En este enfoque, un dominio de conocimiento está representado por un conjunto Q de problemas. El conocimiento de un sujeto en el dominio se describe entonces por el subconjunto de problemas de Q que él o ella es capaz de resolver. Este conjunto se llama estado de conocimiento del sujeto. Debido a las dependencias entre los elementos (por ejemplo, si resolver el elemento j implica resolver el elemento i ), no todos los elementos del conjunto de potencia de Q serán, en general, posibles estados de conocimiento. El conjunto de todos los estados de conocimiento posibles se llama estructura de conocimiento . Se pueden utilizar métodos de análisis booleano para construir una estructura de conocimiento a partir de datos (por ejemplo, Theuns, 1998 o Schrepp, 1999). La principal diferencia entre ambas áreas de investigación es que el análisis booleano se concentra en la extracción de estructuras de los datos, mientras que la teoría del espacio de conocimiento se centra en las propiedades estructurales de la relación entre una estructura de conocimiento y las fórmulas lógicas que la describen.
El análisis formal de conceptos está estrechamente relacionado con la teoría del espacio de conocimiento (Ganter y Wille, 1996). De manera similar a la teoría del espacio de conocimiento, este enfoque se concentra en la descripción formal y la visualización de las dependencias existentes. El análisis formal de conceptos ofrece formas muy efectivas de construir dichas dependencias a partir de datos, con un enfoque en expresiones if-then (" implicaciones "). Incluso existe un método, llamado exploración de atributos , [2] para extraer todas las implicaciones de datos de difícil acceso.
Otro campo relacionado es la minería de datos , que se ocupa de la extracción de conocimiento de grandes bases de datos. Varios algoritmos de minería de datos extraen dependencias de la forma j → i (llamadas reglas de asociación ) de la base de datos.
La principal diferencia entre el análisis booleano y la extracción de reglas de asociación en la minería de datos es la interpretación de las implicaciones extraídas. El objetivo de un análisis booleano es extraer implicaciones de los datos que sean (con excepción de errores aleatorios en el comportamiento de la respuesta) verdaderas para todas las filas del conjunto de datos. Para las aplicaciones de minería de datos, es suficiente detectar implicaciones que cumplan con un nivel de precisión predefinido.
Por ejemplo, en un escenario de marketing, es interesante encontrar implicaciones que sean verdaderas para más del x% de las filas del conjunto de datos. Una librería en línea puede estar interesada, por ejemplo, en buscar implicaciones del tipo Si un cliente pide el libro A, también pide el libro B si se cumplen en más del 10% de los datos de clientes disponibles.