Modelo de Aprendizaje Profundo para identificar plagas en la producción de quinua
Deep Learning Model to identify pests in quinoa production
Modelo de Deep Learning para identificar pragas na produção de quinoa
José Amilcar Cayllante Capia
jose.cayllante@iatec.com
https://orcid.org/0000-0003-2293-5678
Universidad Adventista de Bolivia. Cochabamba, Bolivia
Artículo recibido 14 de noviembre 2023 / Aceptado 13 de diciembre 2023 / Publicado 10 de enero 2024
https://doi.org/10.33996/revistaingenieria.v8i20.116
RESUMEN
La presente investigación aborda la identificación de plagas que afectan los cultivos de quinua en la Asociación de Productores Agropecuarios de Jopopamba (ASPRAJO). Tiene como propósito desarrollar un modelo de aprendizaje profundo y la aplicación móvil desarrollada para identificar plagas en la producción de quinua en la Asociación de Productores Agropecuarios de Jopopamba (ASPRAJO). El artículo se orientó bajo el paradigma positivista y enfoque cuantitativa, tipo proyectiva y evaluativa con diseño no experimental. Se implementó la metodología SEMMA (Sample, Explore, Modify, Model, Assess), el aprendizaje profundo, la transferencia de aprendizaje, y arquitecturas de redes neuronales VGG-19 y ResNet-50. En el preprocesamiento, se realizó agrupación de datos en clases. Como resultado durante el modelado, emplearon redes neuronales profundas mediante la técnica de transferencia de aprendizaje. En conclusión, se implementó con éxito el modelo de aprendizaje diseñado, adaptándolo para su utilización en dispositivos móviles, lo que promete ser una herramienta valiosa en la detección de plagas de quinua en ASPRAJO.
Palabras clave: Aprendizaje profundo; Aprendizaje automático; Agricultura
ABSTRACT
This research addresses the identification of pests that affect quinoa crops in the Association of Agricultural Producers of Jopopamba (ASPRAJO). Its purpose is to develop a deep learning model and the mobile application developed to identify pests in quinoa production in the Association of Agricultural Producers of Jopopamba (ASPRAJO). The article was oriented under the positivist paradigm and a quantitative, projective and evaluative approach with a non-experimental design. The SEMMA (Sample, Explore, Modify, Model, Assess) methodology, deep learning, transfer learning, and VGG-19 and ResNet-50 neural network architectures were implemented. In preprocessing, data grouping into classes was performed. As a result, during modeling, they used deep neural networks using the transfer learning technique. In conclusion, the designed learning model was successfully implemented, adapting it for use on mobile devices, which promises to be a valuable tool in the detection of quinoa pests in ASPRAJO.
Key words: Deep Learning; Machine Learning; Agriculture
RESUMO
Esta pesquisa aborda a identificação de pragas que afetam as culturas de quinoa na Associação dos Produtores Agrícolas de Jopopamba (ASPRAJO). Seu objetivo é desenvolver um modelo de aprendizagem profunda e o aplicativo móvel desenvolvido para identificar pragas na produção de quinoa na Associação dos Produtores Agrícolas de Jopopamba (ASPRAJO). O artigo foi orientado sob o paradigma positivista e uma abordagem quantitativa, projetiva e avaliativa com desenho não experimental. Foram implementadas a metodologia SEMMA (Sample, Explore, Modify, Model, Assess), deep learning, transfer learning e arquiteturas de redes neurais VGG-19 e ResNet-50. No pré-processamento foi realizado o agrupamento dos dados em classes. Como resultado, durante a modelagem, eles usaram redes neurais profundas usando a técnica de aprendizagem por transferência. Concluindo, o modelo de aprendizagem desenhado foi implementado com sucesso, adaptando-o para uso em dispositivos móveis, o que promete ser uma ferramenta valiosa na detecção de pragas de quinoa na ASPRAJO.
Palavras-chave: Aprendizado profundo; Aprendizado de máquina; Agricultura
INTRODUCCIÓN
El aprendizaje automático Machine Learning (ML) y el aprendizaje profundo Deep Learning (DL) son dos de las tecnologías más importantes de la actualidad. Ambas se basan en la idea de que las máquinas pueden aprender a realizar tareas sin ser explícitamente programadas para ello. El aprendizaje automático (Machine Learning) se distingue por su capacidad para discernir patrones y, consecuentemente, generar nuevo conocimiento. El aprendizaje automático (machine learning, en inglés): hace referencia al subcampo dentro de las ciencias de la computación especializado en el reconocimiento de patrones complejos en conjuntos de datos. A diferencia de la programación clásica, en la que un programa ejecuta una y otra vez la misma (más o menos compleja) operación, la principal característica del aprendizaje automático es que sus programas consiguen extraer de forma autónoma (es decir, sin ser programados específicamente para ello) información relevante en los datos que están siendo procesados. Esta información permite que el programa “aprenda”, es decir, que mejore en su ejecución de la tarea para la que había sido programado (González, 2018).
Paralelamente, el aprendizaje profundo (Deep Learning) constituye una categoría del aprendizaje automático, con la aspiración de emular el funcionamiento del cerebro humano, basándose en sofisticados sistemas denominados redes neuronales. Una de sus aplicaciones más destacadas es el reconocimiento de imágenes.
El Aprendizaje Profundo o Deep Learning, es un subcampo de Machine Learning que usa una estructura jerárquica de redes neuronales artificiales, que se construyen de una forma similar a la estructura neuronal del cerebro humano, con los nodos de neuronas conectadas como una tela de araña. Esta arquitectura permite abordar el análisis de datos de forma no lineal. El aprendizaje profundo es una técnica que, al igual que otros algoritmos de aprendizaje, enseña a los ordenadores a hacer lo que es natural para los humanos: aprender con el ejemplo. (Centeno, A. 2019).
Por otra parte, la transferencia de aprendizaje se erige también como un subconjunto del aprendizaje profundo, caracterizándose por la explotación de grandes conjuntos de datos previamente relacionados con la resolución de un problema y su aplicación en contextos distintos, mediante el uso de modelos pre-entrenados.
Algunas de las investigaciones que relacionadas a la temática la presenta Flores (2021) en su trabajo “Clasificación de cultivos de quinua orgánica mediante el uso de imágenes aéreas multiespectrales y técnicas de aprendizaje automático”. La producción mundial de quinua se encuentra liderada primordialmente por los países de Perú y Bolivia, quienes concentran entre el 83% (año 2015) al 67% (año 2016). En ambos países dicha actividad involucra a no menos de 150,000 familias de pequeños productores.
La producción de dicho cultivo es mayoritariamente orgánica con promedios bajos de producción. Como consecuencia del escaso uso de tecnologías productivas, el incremento de plagas, así como de la variabilidad cada vez más impredecible de las condiciones climáticas, los agricultores familiares de ambas regiones continúan presentando niveles de pobreza de 42.9% y extrema pobreza. Este trabajo de investigación contribuye al mapeo de cultivos el cual constituye una herramienta esencial para la gestión agrícola y la seguridad alimentaria. El objetivo del trabajo de investigación es la evaluación de diversos métodos de clasificación del cultivo de la quinua que permitirá realizar el mapeo automático. El estudio se centra en el uso de técnicas de aprendizaje automático para clasificar cultivos de quinua a partir de imágenes aéreas multiespectrales tomadas desde un sistema aéreo no tripulado. La reflectancia espectral de cinco bandas ópticas se utiliza para determinar modelos de clasificación que se evalúan en las diferentes etapas fenológicas de la quinua. Se exploraron estrategias de aprendizaje automático a las imágenes obtenidas, tales como árboles de decisión, análisis discriminatorio, máquinas de vectores de soporte, K vecino más cercano, conjunto de clasificadores, métodos de aprendizaje profundo de Segnet y Unet. Los conjuntos de datos de entrenamiento se obtuvieron de las ubicaciones de los campos de quinua en Cabana en la región Puno de Perú. Los resultados muestran que las técnicas de aprendizaje profundo superan a otras técnicas en la tarea de clasificación.
Como puede observarse, el aporte al presente trabajo es que ambas investigaciones se basan en el uso de técnicas de aprendizaje automático para analizar imágenes de cultivos de quinua. Es de resaltar que la clasificación de cultivos de quinua también puede ayudar a identificar las características visuales más relevantes para la identificación de plagas. Los investigadores utilizaron técnicas de aprendizaje automático para seleccionar las características más importantes de las imágenes para la clasificación de cultivos. Estas características pueden ser utilizadas como punto de partida para el desarrollo del modelo de aprendizaje profundo para identificar plagas.
En otro estudio, realizado por Córdova (2021) “Aplicación de aprendizaje profundo para la detección y clasificación automática de insectos agrícolas en trampas pegantes”. La horticultura es una actividad que da trabajo a peruanos en muchas zonas del país. En la actualidad, un método efectivo para realizar el control de plagas es el uso de trampas pegantes.
Convencionalmente, las trampas pegantes son colocadas de forma que queden distanciadas uniformemente en el campo donde se realiza el cultivo y luego de varios días se realizan observaciones visuales por parte del personal entrenado en reconocimiento de insectos. No obstante, la información recopilada manualmente por el humano puede no ser tan exacta, pues existen diversos factores que pueden influir en la precisión de esta, por ejemplo, la habilidad de cada persona para detectar distintos tipos de insectos y la posible fatiga que puede ser consecuencia de haber realizado un trabajo manual por mucho tiempo y para una muestra grande de insectos.
Las soluciones que se encontraron en la revisión sistemática para tratar problemas de detección de insectos fueron algoritmos de segmentación con cambio de espacio de color, lo cual permite remover el fondo de una imagen y centrarse únicamente en el objeto de interés; también, se encontraron estudios que usaron modelos de detección, los cuales hacen uso de aprendizaje profundo con redes neuronales convolucionales para lograr la identificación de los insectos. Esta última técnica ha dado resultados óptimos en distintos problemas visión computacional, por lo que el presente proyecto de investigación propone usar los modelos de detección pre-entrenados Faster R-CNN y YOLOv4 y aplicarles aprendizaje por transferencia para ajustarlos al problema de detección de tres tipos de plagas de insectos: la mosca blanca, la mosca minadora y el pulgón verde del melocotonero en etapa de adulto alado.
El anterior estudio aporta información de valor al presente trabajo de investigación ya que utiliza técnicas de aprendizaje profundo para el análisis de imágenes en el contexto de la agricultura. Igualmente, el desarrollo de un modelo de detección y clasificación de insectos agrícolas, capaz de detectar y clasificar automáticamente diferentes especies de insectos en imágenes capturadas con trampas pegantes. Este modelo podría ser adaptado para la identificación de plagas en la producción de quinua, utilizando imágenes de las plantas afectadas o de las trampas pegantes colocadas en los cultivos.
Para contextualizar esta investigación, es pertinente describir algunos aspectos del proceso de producción de quinua. Cada parcela de cultivo cuenta con un responsable encargado de supervisar las plantas. Durante estas revisiones, se detecta ocasionalmente la presencia de plagas en las plantas de quinua, entre las que destacan la Kcona kcona según Montiel (2015), llamado también “polilla de la quinua”, es de color ploma que mide de 6 a 8mm y las larvas son de color verde crema de cabeza marrón de 6 a 8 mm de tamaño y la Ticona, Chambilla, et al., (2009) las describen como un grupo complejo, formado por lo menos de cuatro géneros: Copitarsia, Heliothis, Feltia y Spodoptera. Estos insectos se manifiestan en su etapa adulta en las plantas de quinua, donde depositan sus huevos y se alimentan de las hojas. La Ticona, en particular, al percibir la presencia humana a una distancia de aproximadamente dos o tres metros, se oculta bajo las hojas, mientras que otros insectos emprenden el vuelo, a veces siendo confundidos con mariposas debido a su distancia relativa y dificultad de identificación. De ahí la necesidad de una revisión cuidadosa.
La Kcona kcona, por su parte, intenta escapar de planta en planta al detectar la presencia humana, aunque algunos permanecen en su lugar, lo que facilita su detección.
Una vez que la Ticona y la Kcona kcona han depositado sus huevos, inicia el proceso de desarrollo de las larvas, que se ocultan dentro de las panoyas, donde se alimentan y atacan los granos de quinua. Por tanto, es fundamental buscarlas minuciosamente en las plantas de quinua para evitar daños a los frutos. Sin embargo, se observa que durante la búsqueda de la Kcona kcona, algunas panoyas resultan dañadas, lo que provoca que los frutos se sequen sin alcanzar la madurez. Esto se debe a que este insecto es pequeño, oscilando entre 0.6 y 1.1 cm de longitud, y delgado. Por esta razón, se sacude la planta de quinua para que algunos de los insectos caigan. El mismo procedimiento se aplica a la Ticona, aunque estos insectos se identifican con mayor facilidad debido a su tamaño, que oscila entre 1.2 y 2.4 cm de longitud.
Una vez concluida la revisión e identificación de la Kcona kcona y la Ticona, se elabora un registro de las plagas detectadas y en qué etapa se encuentran. Este proceso se repite de una a dos veces por semana.
En resumen, se ha determinado que es imperativo optimizar el proceso de identificación de plagas en la producción de quinua, dado que estos insectos generan alteraciones en el crecimiento de las plantas, provocan daños en las panoyas y ocasionan perjuicios económicos a los miembros de ASPRAJO. En este contexto, en esta primera fase de la investigación, se plantea la creación de un modelo de aprendizaje profundo destinado a facilitar la identificación de estas plagas.
Con base en lo anterior, el propósito de la presente investigación radica en desarrollar un modelo de aprendizaje profundo mediante TensorFlow con el fin de identificar plagas en los cultivos de quinua, ofreciendo así una herramienta útil para la Asociación de Productores Agropecuarios de Jopopamba (ASPRAJO). TensorFlow es una plataforma de código abierto de extremo a extremo para el aprendizaje automático que te permite crear modelos de aprendizaje automático de forma sencilla, incluso si eres principiante. Además, TensorFlow es un sistema de computación numérica de código abierto de Google Cloud, se puede encontrar en numerosos productos de Google Cloud ya que permite desarrollar algoritmos inteligentes. Google Cloud es uno de los pioneros en Inteligencia Artificial (IA), aprendizaje automático y Big Data, entre otros Alonso, (2022). Lo que indica que desarrollar un modelo de aprendizaje profundo para la identificación de plagas en la producción de quinua, basado en imágenes de las plantas y de los insectos, puede mejorar la precisión y eficiencia del proceso de detección, reduciendo el daño a los cultivos y las pérdidas económicas para los productores.
MÉTODO
Para llevar a cabo el presente estudio, el investigador se orientó con el paradigma positivista, con un enfoque cuantitativo, según Landeau, (2007) se pretende establecer el grado de asociación o correlación entre variables, la generalización y objetivación de los resultados por medio de una muestra permite realizar inferencias causales a una población que explican por qué sucede o no determinado hecho o fenómeno, como es el caso de las muestras y tomadas a través de imágenes en los cultivos de quinua. Se clasifica dentro de las del tipo proyectivo, Hurtado (2015), la define como la elaboración de una propuesta y su finalidad, es resolver una necesidad de tipo practico, como es desarrollar un modelo de aprendizaje profundo mediante TensorFlow con el fin de identificar plagas en los cultivos de quinua, ofreciendo así una herramienta útil para la Asociación de Productores Agropecuarios de Jopopamba (ASPRAJO). En cuanto al diseño es no experimental, según, Behar (2008) señala que en ellas el investigador observa los fenómenos tal y como ocurren naturalmente, sin intervenir en su desarrollo. Finalmente es evaluativo, según (Correa, 1996, citado por Mejia, 2017) porque el propósito de este tipo de metodología de es proporcionar información útil para tomar decisiones con respecto a un programa, o como es el caso que ocupa un modelo de aprendizaje profundo para identificar las plagas en la producción de quinua.
A continuación, se detalla la construcción del modelo de aprendizaje profundo y la aplicación móvil desarrollada para este proyecto.
La metodología empleada se basó en SEMMA (Sample, Explore, Modify, Model, Assess). La fase de "Sample" se refiere a la selección de una muestra representativa de la población de datos sobre la cual se llevará a cabo el análisis. Moine et. al. (s/f) se refiere que la metodología SEMMA se encuentra enfocada especialmente en aspectos técnicos, excluyendo actividades de análisis y comprensión del problema que se está abordando.
La metodología SEMMA, SAS Institute Inc, (2017) facilita la aplicación de técnicas estadísticas exploratorias y de visualización; permite la selección y transformación de las más significativas variables predictivas; modela las variables para predecir resultados y confirmar la exactitud de un modelo.
En el mismo orden de ideas, un aporte para esta metodología es el siguiente:
SEMMA cuenta con las fases: Sample, Explore, Modify, Model, and Assess, creada por el Instituto SAS, que la define como una organización lógica del conjunto de herramientas funcionales de SAS Enterprise Miner para llevar a cabo las tareas centrales de la minería de datos. SEMMA ofrece y permite la comprensión, organización, desarrollo y mantenimiento de proyectos de Minería de Datos (Cristancho, 2021).
Para definir la minería de datos Larose et al. (2014) expresa que es el proceso de descubrir nuevas correlaciones, patrones y tendencias significativas a través del análisis de grandes cantidades de datos, utilizando técnicas estadísticas, matemáticas y reconocimiento de patrones. En el contexto de la identificación de plagas, la minería de datos se puede utilizar para analizar datos de imágenes, sensores y otras fuentes para identificar patrones que pueden ser indicativos de la presencia de plagas.
Seguidamente, la fase Sample, “Muestra”, es una etapa opcional. Una parte de un gran conjunto de datos se toma lo suficientemente grande como para extraer información significativa y lo suficientemente pequeña como para manipularla rápidamente.
En la fase de "Explore," Exploración, según Albarrán y Salgado (2016) dice que es la búsqueda de tendencias no previstas y anomalías para entender el contenido y las ideas, se exploraron los conjuntos de datos tanto de manera estadística como visual. El objetivo era determinar las variables explicativas que se utilizarían como entradas para el modelo. Se realizó un análisis exhaustivo de los factores de influencia que podrían afectar los resultados del estudio, haciendo hincapié en la visualización de datos. Además, se llevó a cabo un seguimiento para identificar y eliminar datos anómalos o deficientes en las fases subsiguientes.
Siguiendo con, la fase de "Modify", modificación. Acerca de esta fase consiste en la modificación de los datos mediante la creación, selección y transformación de variables que se adapten al proceso de selección del modelo, por Albarrán y Salgado (2016). Involucró el procesamiento y análisis de datos para darles el formato adecuado requerido por la técnica de modelado. Se realizaron tareas como la selección de variables, la creación de nuevas variables, la transformación de datos, el manejo de valores atípicos, la reducción de variables a las más significativas y la actualización de datos cuando estuvo disponible información nueva.
En la fase de "Model" (Modelado). Esta fase, modela los datos permitiendo que el software busque automáticamente la combinación de datos que permitan predecir de manera confiable la información requerida (Albarrán y Salgado, 2016). En esta investigación, consistió en la creación del modelo que permitiría predecir variables de respuesta a partir de las variables explicativas. Se exploraron diversas técnicas predictivas, como redes neuronales, árboles de decisión, análisis de conglomerados, máquinas de vectores de soporte, modelos logísticos, análisis de series temporales, regresiones, inducción de reglas y métodos estadísticos de agrupamiento.
Finalmente, la fase de "Assess (Evaluación), según, Albarrán y Salgado (2016) dicen que valora los datos mediante la evaluación de la utilidad y confiablidad de los hallazgos del proceso de minería de datos. Representó el último ciclo del proceso, donde se evaluó la utilidad y confiabilidad de la solución desarrollada. El modelo se sometió a pruebas con datos de prueba, y se evaluó su capacidad predictiva. Gavilán (2021) expresa el autor que es necesario evaluar el funcionamiento del modelo en su conjunto en cuanto a fiabilidad, utilidad. (Azevedo y Santos, 2008) asegura que estas cinco etapas permiten un fácil entendimiento del problema, tiene una estructura que permite la concepción, creación y evolución, ayudando a presentar soluciones a los problemas planteados, así como metas a encontrar mediante la minería de datos.
RESULTADOS Y DISCUSIÓN
En el aprendizaje profundo (Deep Learning o DL), se entrenó a una computadora para realizar tareas de manera similar a como lo hacen los seres humanos. Estas tareas incluyeron el reconocimiento del habla, la identificación de imágenes, la realización de predicciones, entre otras. Según, Burns (2021) el aprendizaje profundo (Deep Learning) es un tipo de aprendizaje automático (machine learning, ML) e inteligencia artificial (IA) que imita la forma en que los humanos obtienen ciertos tipos de conocimiento.
Dentro del campo del DL, existen diversas arquitecturas, entre las cuales se destacan las Redes Neuronales Convolucionales (RNC). Las RNC según Hernández (2021) estas son estructuras similares a las redes neuronales tradicionales, compuestas por neuronas con pesos y sesgos que pueden aprender.
Cada neurona en una RNC recibe entradas, realiza una operación de producto escalar y luego aplica una función de activación. Al igual que en un perceptrón multicapa, las RNC tienen una función de pérdida o costo en su última capa, que está completamente conectada.
La característica distintiva de las RNC es su suposición explícita de que las entradas son imágenes, lo que les permite codificar ciertas propiedades en la arquitectura, logrando eficiencia y reducción en la cantidad de parámetros de la red neuronal. En términos generales, las RNC se estructuran con diferentes tipos de capas, incluyendo capas convolucionales, capas de reducción y capas clasificadoras. Esta estructura se ilustra en la Figura 1.
Figura 1. Estructura de las redes neuronales convolucionales
Otro proceso es el Transfer Learning (TL) se erige como una de las técnicas más destacadas dentro del ámbito del Aprendizaje Profundo (Deep Learning). Desde una perspectiva de aprendizaje profundo, el problema de clasificación de imágenes puede resolverse de manera efectiva mediante TL. Esta técnica goza de gran popularidad en el campo de la visión artificial, ya que permite construir modelos de alta precisión ahorrando una significativa cantidad de tiempo y recursos. El TL consiste en evitar iniciar el proceso de aprendizaje desde cero. En cambio, se inicia utilizando patrones o modelos pre-entrenados que han adquirido conocimiento al resolver un problema diferente (Blanco, 2019).
A continuación, se describen los procesos inherentes a TL, como se ilustra en la Figura 2.
Figura 2. Procesos de Transfer Learning
También, se utilizó para procesar imágenes la ResNet-50 es una red neuronal convolucional que se caracteriza por su impresionante profundidad, compuesta por un total de 50 capas. Esta arquitectura es capaz de cargar una versión previamente entrenada de la red, la cual fue entrenada en una vasta colección de más de un millón de imágenes pertenecientes a la base de datos ImageNet. La red, previamente entrenada, demuestra su capacidad para clasificar imágenes en diversas categorías de objetos, abarcando desde elementos cotidianos como teclados y ratones hasta animales y otros objetos (Resnet50, 2021). En consecuencia, la red ha adquirido representaciones de características altamente informativas para una amplia variedad de imágenes. Cabe destacar que esta red opera con imágenes de entrada de 224x224 píxeles.
En cuanto al, modelo VGG-19, concebido por el Grupo de Geometría Visual de la Universidad de Oxford, presenta una profundidad impresionante, compuesta por un total de 19 capas. Esta arquitectura se ha destacado por su alto rendimiento en tareas de clasificación en diversos conjuntos de datos.
el Modelo VGG-19 es una red neuronal convolucional con 19 capas de profundidad. Puede cargar una versión preentrenada de la red entrenada en más de un millón de imágenes desde la base de datos de ImageNet. La red preentrenada puede clasificar imágenes en 1000 categorías de objetos (por ejemplo, teclado, ratón, lápiz y muchos animales). Como resultado, la red ha aprendido representaciones ricas en características para una amplia gama de imágenes. El tamaño de la entrada de imagen de la red es de 224 por 22 MATLAB (2021).
El proceso de empleo de la arquitectura VGG-19 se describe detalladamente a continuación. En primer lugar, se realiza un muestreo y combinación de datos procedentes de 8 canales. Durante este proceso, se recopilan 512 puntos de datos en cada instancia. Estos datos se agrupan para formar una matriz de 8x512, que posteriormente se transforma en una matriz de 64x64. Luego, se emplea una operación de convolución transpuesta para expandir la imagen a una resolución de 256x256 píxeles. Finalmente, esta imagen se introduce en un modelo previamente entrenado, donde se somete a un proceso de ajuste fino y entrenamiento adicional. De esta manera, se logra obtener una clasificación altamente precisa en el contexto de detección de fallos (Zhou et al., 2020).
En consonancia con la fase inicial de la metodología SEMMA, se procedió a seleccionar el conjunto de datos relacionado con las plagas que afectan los cultivos de quinua como muestra representativa. Esta selección se centró en imágenes que capturan la presencia de la Kcona kcona y la Ticona. En total, se recolectaron 2,780 imágenes térmicas para conformar esta muestra representativa.
Cabe destacar que todas estas imágenes se obtuvieron mediante el uso de la cámara térmica FLIR ONE PRO. A continuación, se muestran algunas de las imágenes recopiladas, figura 3:
Figura 3. Conjunto de datos, tomados mediante cámara térmica FLIR ONE PRO.
En la fase de exploración de datos (explore), se llevó a cabo una evaluación visual de las imágenes obtenidas, las cuales representan tanto la etapa larval como la adulta de los insectos en cuestión (Kcona kcona y Ticona). Durante este proceso, se seleccionaron las imágenes que presentaban una calidad superior y mostraban al menos un 70% de la estructura corporal del insecto, como se ilustra en la Figura 4. Estas imágenes conformaron la muestra definitiva.
Figura 4. Imagen de calidad válida, tomados mediante cámara térmica FLIR ONE PRO.
Además, se procedió a descartar las imágenes de mala calidad o incompletas, ya que no contribuirían de manera significativa al desarrollo del proyecto, como se ejemplifica en la Figura 5. En total, se eliminaron 140 imágenes, quedando un total de 2,630 imágenes para su uso en el proyecto. Figura 5:
Figura 5. Ejemplo de imagen con mala calidad, tomados mediante cámara térmica FLIR ONE PRO.
En la etapa de modificación (modify), se realizó un análisis de datos de las imágenes térmicas, con el objetivo de detectar el calor emitido por los insectos, tal como se representa a continuación en la figura 6:
Figura 6. Imagen térmica del insecto, tomados mediante cámara térmica FLIR ONE PRO.
Posteriormente, se aplicó la técnica de análisis de conglomerados para agrupar las imágenes que presentaban similitudes o relaciones entre sí. Para definir el análisis de conglomerados (AC) tenemos que:
es una técnica estadística multivariable, cuya finalidad es dividir un conjunto de objetos en grupos de forma que los objetos en un mismo grupo sean muy similares entre sí (cohesión interna del grupo) y de los objetos de conglomerados diferentes sean distintos (aislamiento externo del grupo); éste permite agrupar los elementos o variables de un archivo de datos en función del parecido o similitud existente entre ellos, buscando agrupar elementos (o variables) y tratando de lograr la máxima homogeneidad entre los grupos y la mayor diferencia entre los ellos, es una técnica descriptiva, teórica y no inferencial (Ruiz, 2019)
Esta técnica se utilizó de manera visual para crear cuatro clases: Kcona kcona, Ticona, Kcona Adulta y Ticona Adulta, como se muestra en la Figura 7. Además, se dividió el conjunto de datos en un 80% para entrenamiento y un 20% para pruebas.
Figura 7. Imágenes agrupadas por clase, tomados mediante cámara térmica FLIR ONE PRO.
Una vez completada la fase de modificación, se procedió a seleccionar la técnica predictiva para la construcción del modelo de aprendizaje (Model). En este caso, se optó por utilizar redes neuronales convolucionales (CNN) debido a su relevancia en el aprendizaje profundo. Se aplicó la transferencia de aprendizaje utilizando el modelo pre-entrenado ResNet-50, como se representa en la Figura 8.
Figura 8. Transferencia de aprendizaje con ResNet-50
Se realizaron configuraciones de parámetros y rutas, y se crearon las imágenes de entrenamiento y validación de acuerdo con las rutas especificadas. Luego, se procedió a cargar el modelo ResNet-50 pre-entrenado, omitiendo la última capa y utilizando los pesos pre-entrenados de ImageNet. Se configuraron las últimas capas según los nuevos parámetros y se congelaron las capas desde el inicio hasta antes de las últimas 6 capas, que no se entrenaron. Las últimas 6 capas fueron entrenadas. Finalmente, el modelo se guardó en formato .h5, como se muestra en la Figura 9.
Figura 9. Modelo ResNert-50 guardado
Tras finalizar la fase de construcción del modelo, se procedió a evaluar (Assess) el modelo entrenado con transferencia de aprendizaje ResNet-50 utilizando una matriz de confusión, como se muestra en la Tabla 1.
Tabla 1. Evaluación del modelo de aprendizaje profundo
A continuación, se presentarán las predicciones individuales, que se pueden observar en las Figuras 10, 11, 12 y 13.
Figura 10. Predicción de Kcona Kcona fase adulta, tomados mediante cámara térmica FLIR ONE PRO.
Figura 11. Predicción de Kcona Kcona fase larva, tomados mediante cámara térmica FLIR ONE PRO.
Figura 12. Predicción de Ticona fase larva, tomados mediante cámara térmica FLIR ONE PRO.
Figura 13. Predicción de Ticona fase adulta, tomados mediante cámara térmica FLIR ONE PRO.
DISCUSIÓN
Después de seguir el procedimiento descrito, los resultados aseguran que se logró construir el modelo deseado con éxito. Se observó que el modelo entrenado con Transferencia de Aprendizaje ResNet-50 alcanza una fiabilidad superior al 80%. Esto significa que el modelo puede identificar con eficiencia las plagas mencionadas anteriormente.
Para obtener las imágenes térmicas necesarias, se utilizó una cámara FLIR ONE PRO adaptada a un teléfono móvil, conectándola a través de la entrada micro USB, como se muestra en la Figura 14. Luego, se utilizó el programa de cámara térmica en el teléfono móvil para capturar las imágenes.
Figura 14. Cámara térmica conectada al móvil
Ejecutar el modelo es tan sencillo como hacer clic en el botón "Identificar", lo que activa el modelo de aprendizaje profundo y muestra un resultado de predicción, que puede ser Ticona adulta, Ticona larva, Kcona Kcona adulta o Kcona kcona larva, tal como se muestra en la Figura 15.
Figura 15. Aplicación móvil identificando a la plaga
De esta manera, se logra la identificación de las plagas de quinua. A pesar de los avances significativos logrados para abordar este problema, aún existen desafíos pendientes. Por ejemplo, encontrar una forma más ágil y rápida de obtener imágenes sin el riesgo de ahuyentar a estas plagas debido a la presencia humana.
CONCLUSIONES
Al finalizar la investigación, se concluye que se han realizado los preparativos de los datos necesarios en formato de imágenes térmicas para ambas plagas en sus etapas de larva y adulta. La cantidad de datos utilizada fue suficiente, ya que se aplicó la Transferencia de Aprendizaje, lo que redujo la necesidad de una gran cantidad de datos. Además, la selección de imágenes con una estructura corporal visible superior al 70% contribuyó al éxito del entrenamiento.
En consecuencia, se evaluó que el entrenamiento con el modelo pre-entrenado VGG19 no fue eficaz, por lo que se optó por una nueva iteración con el entrenamiento de ResNet50, que resultó ser eficiente en su adiestramiento. Ambos modelos se entrenaron mediante la Transferencia de Aprendizaje.
Como resultado, se evaluó la predicción del modelo de aprendizaje profundo con ResNet50 utilizando una matriz de confusión y analizando cada imagen térmica individualmente. Se confirmó que el modelo podía identificar eficientemente las plagas de quinua, con una precisión superior al 80%. Finalmente, se implementó con éxito el modelo de aprendizaje profundo en un dispositivo móvil adaptado a la cámara térmica FLIR ONE, lo que permitió la identificación fiable de las plagas de quinua en sus dos etapas, larva y adulta.
Finalmente, el Modelo de Aprendizaje Profundo para identificar plagas en la producción de quinua, se llevó a cabo a través de la metodología SEMMA de acuerdo a las siguientes fases: (Sample, Explore, Modify, Model, Assess). La fase de "Sample" se refiere a la selección de una muestra representativa de la población de datos sobre la cual se llevará a cabo el análisis.
En la fase de "Explore," se exploraron los conjuntos de datos tanto de manera estadística como visual. El objetivo era determinar las variables explicativas que se utilizarían como entradas para el modelo.
La fase de "Modify" involucró el procesamiento y análisis de datos para darles el formato adecuado requerido por la técnica de modelado.
La fase de "Model" consistió en la creación del modelo que permitiría predecir variables de respuesta a partir de las variables explicativas.
La fase de "Assess" representó el último ciclo del proceso, donde se evaluó la utilidad y confiabilidad de la solución desarrollada. El modelo se sometió a pruebas con datos de prueba, y se evaluó su capacidad predictiva. En conclusión, el proyecto se considera un éxito.
CONFLICTO DE INTERESES. Los autores declaran que no existe conflicto de intereses para la publicación del presente artículo científico.
REFERENCIAS BIBLIOGRÁFICAS
Albarrán y Salgado. (2016). La Inteligencia Analítica y la Competitividad en las Empresas. https://recai.uaemex.mx/article/view/8949/7592
Alonso, J. (2022). ¿Qué es TensorFlow y para qué sirve?. https://www.incentro.com/es-ES/blog/que-es-tensorflow
Azevedo, A., y Santos, M. F. (2008). KDD, SEMMA AND CRISP-DM: A PARALLEL OVERVIEW, IADIS European Conference Data Mining. https://www.researchgate.net/publication/220969845_KDD_semma_and_CRISP-DM_A_parallel_overview
Blanco, E. (2019) “Transfer Learning en modelos profundos - Think Big Empresas”, Think Big. 2019. https://empresas.blogthinkbig.com/transfer-learning-en-modelos-profundos/
Burns, E. (2021) Aprendizaje profundo (Deep Learning). https://www.computerweekly.com/es/definicion/Aprendizaje-profundo-deep-learning
Centeno, A. (2019). DEEP LEARNING. Universidad de Sevilla. https://idus.us.es/bitstream/handle/11441/90004/Centeno%20Franco%20Alba%20TFG.pdf
Chambilla, C., Gonzáles, M., Jarandilla, C. y Baltazar, B. (2009). Estudio de la fluctuacion poblacional del complejo ticonas de la quinua (Chenopodium quinoa Willd.) bajo condiciones actuales de cambio climático https://sanremcrsp.cired.vt.edu/wp-content/uploads/2013/11/0309TiconasdulaQuinua.pdf
Córdova. Claudia (2021). Aplicación de aprendizaje profundo para la detección y clasificación automática de insectos agrícolas en trampas pegantes. https://bit.ly/3udskap
Cook, T.D., Reichardt, Ch. S. (2005). Métodos cualitativos y cuantitativos en Investigación Evaluativa. Madrid: EDICIONES MORATA. [EcuRed. «Modelo Vista Vista Modelo», 2021. http://portal.amelica.org/ameli/jatsRepo/394/3941752008/html/index.html
Mejía, J. (2017). La metodología de investigación evaluativa una alternativa para la valoración de proyectos http://portal.amelica.org/ameli/jatsRepo/394/3941752008/html/index.html#redalyc_3941752008_ref6.
Cristancho, J. (2021). Propuesta de metodología para el desarrollo de proyectos de analítica prescriptiva a partir de un metaanálisis. https://bit.ly/47Jyixa
Flores, D. (2021). Clasificación de cultivos de quinua orgánica mediante el uso de imágenes aéreas multiespectrales y técnicas de aprendizaje automático. https://bit.ly/3OqdpAA
González, C. (2018). En qué Consiste el Aprendizaje Automático (Machine Learning) y Qué está aportando a la Neurociencia Cognitiva. https://www.cienciacognitiva.org/?p=1697
Hernández, J. (2021). Aprendizaje Profundo y Neuroevolución para el Análisis de Sentimientos en Tweets Escritos en Español Mexicano. https://www.uv.mx/personal/emezura/files/2022/01/Tesis-Clemente.pdf
Hernández, R., Fernández, C., y Baptista, M. (2014). Metodología de la investigación. México D.F.: McGraw-Hill.
Hernández, R. (2018). Metodología de la Investigación: Las Rutas Cuantitativa, Cualitativa Y Mixta. https://bit.ly/49fpUqD
Landeau, R. (2007). Elaboración de trabajos de investigación. Caracas: Editorial Alfa. http://repositorio.utmachala.edu.ec/bitstream/48000/14232/1/Cap.4-Investigaci%C3%B3n%20cuantitativa%20y%20cualitativa.pdf
Larose, D. T. (2014). Discovering knowledge in data: an introduction to data mining. John Wiley Sons, 336, Hoboken, New Jersey. https://bit.ly/48LzTny
Moine, J., Silva, A., Gordillo, (s/f) Estudio comparativo de metodologías para minería de datos. https://core.ac.uk/download/pdf/301040544.pdf
Montiel, R. (2015). Kcona Kcona. Hojas volantes para agricultores. Perú. https://plantwiseplusknowledgebank.org/doi/epdf/10.1079/pwkb.20187800297
Gavilán, I. (2021). Metodología para Machinne Learning (III): SEMMA. https://ignaciogavilan.com/metodologia-para-machine-learning-iii-semma/
Grajales, T. (2020). Tipos de Investigación. https://www.academia.edu/9373954/TIPOS_DE_INVESTIGACION_Por_Tevni_Grajales_G
Red neuronal convolucional ResNet-50 - MATLAB resnet50 (2021). https://www.mathworks.com/help/deeplearning/ref/resnet50.html.
Ruiz, G. (2019). Análisis de Conglomerados. https://ojs.umsa.bo/ojs/index.php/revistavarianza/article/download/409/344
SAS Institute Inc. (2017, julio 3). Data Mining and SEMMA. http://documentation.sas.com/?docsetId=emcs&docsetTarget=p0i38iu0h
SAS Institute 2005. Semma Data Mining Methodology. http://www.sas.com/technologies/analytics/datamining/miner/semma.html.
Turing, A. (1950). Computing machinery and intelligence. Mind, 59, 433. https://www.cienciacognitiva.org/?p=1697
Zhou, J., Yang, L. Zhang, S. Shao, y G. Bian, (2020) “Multisignal VGG19 Network with Transposed Convolution for Rotating Machinery Fault Diagnosis Based on Deep Transfer Learning, Shock Vib., vol. 2020. DOI: 10.1155/2020/8863388