stringtranslate.com

Descubrimiento frecuente de patrones

El descubrimiento de patrones frecuentes (o descubrimiento de FP , minería de FP o minería de conjuntos de elementos frecuentes ) es parte del descubrimiento de conocimiento en bases de datos , análisis masivo en línea y minería de datos ; describe la tarea de encontrar los patrones más frecuentes y relevantes en grandes conjuntos de datos. [1] [2] El concepto se introdujo por primera vez para la minería de bases de datos de transacciones. [3] Los patrones frecuentes se definen como subconjuntos (conjuntos de elementos, subsecuencias o subestructuras) que aparecen en un conjunto de datos con una frecuencia no menor que un umbral especificado por el usuario o autodeterminado. [2] [4]

Técnicas

Las técnicas para la minería FP incluyen:

En su mayor parte, el descubrimiento de FP se puede realizar utilizando el aprendizaje de reglas de asociación con algoritmos particulares Eclat , FP-growth y el algoritmo Apriori .

Otras estrategias incluyen:

y respectivas técnicas específicas.

Existen implementaciones para varios sistemas o módulos de aprendizaje automático como MLlib para Apache Spark . [5]

Referencias

  1. ^ ab Jiawei Han; Hong Cheng; Dong Xin; Xifeng Yan (2007). "Minería de patrones frecuente: estado actual y direcciones futuras" (PDF) . Minería de datos y descubrimiento de conocimiento . 15 : 55–86. doi : 10.1007/s10618-006-0059-1 . S2CID  8085527 . Consultado el 31 de enero de 2019 .
  2. ^ ab "Minería de patrones frecuentes". SIGKDD . 1 de enero de 1980 . Consultado el 31 de enero de 2019 .
  3. ^ ab Agrawal, Rakesh; Imieliński, Tomasz; Swami, Arun (1993-06-01). "Extracción de reglas de asociación entre conjuntos de elementos en bases de datos grandes". ACM SIGMOD Record . 22 (2): 207–216. CiteSeerX 10.1.1.217.4132 . doi :10.1145/170036.170072. ISSN  0163-5808. 
  4. ^ "Minería de patrones frecuentes, conjunto de elementos frecuentes cerrado, conjunto de elementos frecuentes máximo en minería de datos". T4Tutorials . 2018-12-09 . Consultado el 2019-01-31 .
  5. ^ "Minería de patrones frecuentes". Documentación de Spark 2.4.0 . Consultado el 31 de enero de 2019 .