La minería de datos en la agricultura es un tema de investigación relacionado con las técnicas de minería de datos y ciencia de datos dentro del sector agrícola . Los recientes avances en tecnología han hecho posible recopilar una gran cantidad de datos relacionados con las actividades agrícolas . Se analizan para informar una mejor toma de decisiones; [1] por ejemplo, para optimizar el rendimiento de los cultivos, predecir el resultado de los tratamientos o como herramienta de diagnóstico.
La minería de datos se puede utilizar en la agricultura para mejorar los algoritmos de detección de defectos en la fruta, que son importantes para las decisiones relacionadas con la poscosecha, como, por ejemplo, la identificación de mercados potenciales y la mejora de los informes para las compañías de seguros de exportación. El desarrollo de métodos de recopilación de datos en desarrollo se utiliza para generar datos procesables para clasificar la fruta según los defectos de la superficie. [ cita requerida ] .A modo de ejemplo, la minería de datos se ha aplicado a la detección de defectos en frutas debido a la pulverización de productos químicos, ya que la pulverización puede causar diversos defectos en diferentes tipos de fruta. Estos datos son particularmente útiles para cumplir ampliamente con la legislación que requiere documentación como las fechas de aplicación y la información química. Los requisitos de la legislación están justificados ya que las pulverizaciones fungicidas, por ejemplo, se utilizan a menudo para evitar que se desarrolle la podredumbre en las frutas, como el russeting en las manzanas. [2] Actualmente, gran parte de este conocimiento se basa en evidencia anecdótica en lugar de métodos de recopilación de datos cualitativos y cuantitativos, por lo que se están realizando esfuerzos para aplicar prácticas de minería de datos a la investigación en horticultura . [3]
Las transformaciones metabólicas del proceso de fermentación del vino afectan la productividad de las industrias relacionadas con el vino, así como la calidad del vino. Se han utilizado técnicas de ciencia de datos, como el algoritmo k-means [4] y técnicas de clasificación basadas en el concepto de blustering [5] para estudiar estos procesos metabólicos, prediciendo con éxito los resultados de la fermentación incluso después de tres días de fermentación. Estos métodos clasifican el vino según el perfil de metabolitos de las fermentaciones y son diferentes de los sistemas de clasificación de vino tradicionales. Consulte la página wiki Clasificación del vino para obtener más detalles. Con base en datos experimentales, los científicos proponen que esta es una herramienta valiosa para diagnosticar resultados de fermentación no deseados y, por lo tanto, planificar la intervención en las primeras etapas de la fermentación. [6]
Se utilizó una red de tipo Método de Manejo de Datos en Grupo ( GMDH ) combinada con un método evolutivo de algoritmo genético para predecir la energía metabolizable de la harina de plumas y la harina de despojos de aves de corral en función de su contenido de proteínas, grasas y cenizas. Se recopilaron muestras de datos de la literatura publicada y se utilizaron para entrenar un modelo de red de tipo GMDH . El nuevo enfoque de combinar la red de tipo GMDH con un método evolutivo de algoritmo genético se puede utilizar para predecir la energía metabolizable de las muestras de alimento para aves de corral en función de su contenido químico. [7] También se informa que la red de tipo GMDH puede estimar con precisión el rendimiento de las aves de corral a partir de sus nutrientes dietéticos, como la energía metabolizable, las proteínas y los aminoácidos . [8]
La detección de enfermedades en las granjas puede tener un impacto positivo en la productividad de la misma al reducir la contaminación a otros animales. Además, la detección temprana de las enfermedades puede permitir al ganadero tratar y aislar al animal afectado tan pronto como aparezcan los síntomas. Los sonidos emitidos por los cerdos , como la tos, se pueden analizar para la detección de enfermedades. Actualmente se está desarrollando un sistema computacional para monitorear los sonidos de los cerdos a través de micrófonos instalados en la granja, y que también es capaz de diferenciar entre los diversos sonidos que se pueden detectar. [9]
Se utilizó el método PCR -SSCP ( reacción en cadena de la polimerasa : polimorfismo de conformación de cadena simple ) para determinar el polimorfismo de la hormona de crecimiento (GH), leptina , calpaína y calpastatina en ovejas macho balochi iraníes . Se desarrolló un modelo de red neuronal artificial (ANN) para predecir la ganancia diaria promedio (ADG) en corderos utilizando parámetros de entrada de polimorfismo de GH, leptina, calpaína y calpastatina , peso al nacer y tipo de nacimiento. Los resultados revelaron que el modelo ANN es una herramienta apropiada para identificar los patrones de datos para predecir el crecimiento de los corderos en términos de ADG dado el polimorfismo de genes específicos, el peso al nacer y el tipo de nacimiento. La plataforma del enfoque PCR-SSCP y los análisis de modelos basados en ANN se pueden utilizar en programas de selección y cría asistidos por marcadores moleculares para diseñar un esquema para mejorar la eficacia de la producción ovina . [10]
Antes de enviarlas al mercado, las manzanas se revisan y se eliminan aquellas que presentan algún defecto. Sin embargo, también hay defectos invisibles que pueden estropear el sabor y la apariencia de la manzana. Un ejemplo de defecto invisible es un desorden interno de la manzana que puede afectar la longevidad de la fruta, llamado núcleo de agua. Las manzanas con un núcleo de agua leve o leve son más dulces, pero las manzanas con un grado de núcleo de agua moderado a severo no se pueden almacenar durante mucho tiempo. Además, unas pocas frutas con un grado severo de núcleo de agua podrían estropear un lote entero de manzanas. Por esta razón, se está estudiando un sistema computacional que toma fotografías de rayos X de la fruta mientras corren sobre cintas transportadoras y también es capaz de analizar (mediante técnicas de minería de datos) las imágenes tomadas y estimar la probabilidad de que la fruta contenga núcleos de agua. [11]
Estudios recientes realizados por investigadores agrícolas en Pakistán mostraron que los intentos de maximizar el rendimiento del cultivo de algodón mediante políticas estatales a favor de los pesticidas han llevado a un uso peligrosamente alto de pesticidas. Estos estudios han informado de una correlación negativa entre el uso de pesticidas y el rendimiento de los cultivos en Pakistán. Como resultado, el uso excesivo (o abuso) de pesticidas está causando a los agricultores impactos financieros, ambientales y sociales adversos. Mediante la extracción de datos del algodón, los datos de exploración de plagas junto con los registros meteorológicos muestran cómo se puede optimizar (reducir) el uso de pesticidas. La agrupación de datos reveló patrones interesantes en las prácticas agrícolas junto con la dinámica del uso de pesticidas, lo que ayudó a identificar las razones de este abuso de pesticidas. [12]
Para monitorear el crecimiento del algodón, diferentes departamentos y agencias gubernamentales en Pakistán han estado registrando datos de monitoreo de plagas, agrícolas y metrológicos durante décadas. Las estimaciones aproximadas de solo los datos de monitoreo de plagas del algodón registrados ascienden a alrededor de 1,5 millones de registros y siguen aumentando. Los datos agrometeorológicos primarios registrados nunca se han digitalizado, integrado o estandarizado para brindar una imagen completa y, por lo tanto, no pueden respaldar la toma de decisiones. Por lo tanto, se requiere un almacén de datos agrícolas. La creación de un nuevo almacén de datos piloto de extensión agrícola seguido de un análisis mediante consultas y minería de datos, permitió realizar algunos descubrimientos interesantes, como pesticidas rociados en el momento incorrecto, pesticidas incorrectos utilizados por las razones correctas y la relación temporal entre el uso de pesticidas y el día de la semana. [13]
Se utilizó con éxito una plataforma de modelos basados en redes neuronales artificiales combinada con análisis de sensibilidad y algoritmos de optimización para integrar datos publicados sobre las respuestas de los pollos de engorde a la treonina . Los análisis de los modelos de redes neuronales artificiales para el aumento de peso y la eficiencia alimenticia a partir de un conjunto de datos compilados sugirieron que la concentración de proteína en la dieta era más importante que la concentración de treonina . Los resultados revelaron que una dieta que contiene 18,69 % de proteína y 0,73 % de treonina puede producir un aumento de peso óptimo, mientras que la eficiencia alimenticia óptima puede lograrse con una dieta que contiene 18,71 % de proteína y 0,75 % de treonina . [14]
Hay algunas revistas de agricultura de precisión , como Precision Agriculture de Springer o Computers and Electronics in Agriculture de Elsevier, pero no están dedicadas exclusivamente a la minería de datos en la agricultura.