Los archivos presentes corresponden a un conjunto de datos utilizado en la tesis de maestría que llevó por nombre TÉCNICAS DE INTELIGENCIA ARTIFICIAL PARA CLASIFICACIÓN Y DETECCIÓN DE PROBLEMAS FITOSANITARIOS EN FRUTOS DE AGUACATE (Persea americana Miller), perteneciente al Colegio de Postgraduados Campus Montecillo, México.
De manera general, se tomó un conjunto de datos de 90 imágenes (Conjunto original), donde se tuvieron 3 clases de interés: Frutos sanos (S), frutos con la enfermedad roña (R) y frutos con la enfermedad antracnosis (A).
A estas imágenes RGB (red, green, blue) se transformaron al espacio de color HSV (hue, saturation, value), y de ahí se obtuvieron dos bases de datos:
-
BD1. Selección por región. Mediante el programa IDENTO (Ambrosio-Ambrosio & González-Camacho, 2023) se seleccionaron áreas de interés dependiendo de la clase. En la ruta BD1, se encuentran los archivos .txt de los valores extraídos para cada una de las imágenes; por otra parte, en el archivo Archivos csv/Datos salida.csv contiene los datos correspondientes a las 90 imágenes.
-
BD2. Selección por submuestreo. Se realizaron recortes de 30 x 30 píxeles a las imágenes, donde se tomaron áreas correspondientes a las clases de interés, estos recortes se observan en el directorio BD2. De igual forma se extrajeron los valores y en el archivo Archivos csv/BD135 ClssInv.csv.
*Todos los códigos y modelos optimizados utilizados a continuación se encuentran en el siguiente enlace de Github.
Se hizo una evaluación para determinar qué método de extracción fue mejor, para eso se utilizó el algoritmo Random Forest, donde el mejor fue BD1 con 98 % de precisión global (ACC).
Posteriormente se hicieron otras evaluaciones para determinar al mejor algoritmo de machine learning:
a) Random Forest
b) Support Vector Machine
c) Multilayer Perceptron
Los mejores modelos fueron tanto Random Forest como Multilayer Perceptron, ambos con una ACC de 98 %.
Con los modelos optimizados, se hizo la predicción utilizando un conjunto de imágenes segmentado, estas imágenes se encuentran en el directorio de Conjunto segmentado. En las carpetas RF, SVM y MLP se encuentran las imágenes detectadas para cada uno de los modelos (Clasificacin CART RF.csv, Clasificacin CART SVM.csv, Clasificacin CART MLP.csv).
Por último, con un árbol de decisión se obtuvieron los umbrales de decisión, así como las predicciones a cada una de las imágenes.