Tesis doctoral de Beatriz Díaz Gómez
En los últimos tiempos se ha puesto de manifiesto la gran importancia del análisis de datos con vistas a la búsqueda de modelos y a la diferencia de información nueva y relevante. En concreto, en ciencias medioambientales estas tareas de análisis son de especial importancia debido a la paulatina degradación ambiental que sufre nuestro entorno y que requiere actuaciones urgentes y de gran precisión. la investigación que se presenta en este trabajo de tesis es el fruto de la integración de dos áreas de conocimiento bien conocidas; las áreas de inteligencia artificial y de ciencias medioambientales, con el objetivo de diseñar y desarrollar métodos de análisis y de inferecnia de modelos que permitan explorar nuevos aspectos de los problemas medioambientales a partir de un conjunto de observaciones. Habitualmente estos problemas presentan una gran complejidad que limita, en muchos casos, la eficacia de las técnicas estadísticas de inferencia para la extracción de información o conocimiento. La metodología propuesta pretende ser una ayuda útil y complementaria a los estudios estadísticos. La memoria presenta otdas las fases del diseño y del desarrollo de un sistema de extracción de conocimiento en bases de datos (knowledge discovery database – kdd) que ha sido implementado teniendo en cuenta características propias de los datos y muestreos medioambientales. Entre las aportaciones principales se encuentra una sistema de inferencia de modelos que utiliza un procedimiento de aprendizaje automático, en concreto aprendizaje basado en ejemplos. El sistema genera modelos fácilmente interpretables ya que el conocimiento viene representado por un conjunto de reglas si-entonces. En este sistema de inferencia de modelos se ha implementado un algoritmo genético como método de búsqueda de los mejores conjuntos de reglas que permite evitar la explotación sesgada del espacio de posibles soluciones (modelos) que presentan otros procedimientos de búsqueda. Además como parte del sistema kdd desarrollado, se ha implementado una herramienta de ayuda a la recogida georeferenciada de datos en tiempo que los almacena, en tiempo real, en una base de datos relacional con un formato que permite el tratamiento posterior de la información almacenada con un sistema de información geográfica. el conjunto de herramientas desarrolladas se aplican a un problema medioambiental; el control de malas hierbas en sistemas agrícolas, unade las líneas centrales de la denominada agricultura de precisión, área que desde las perspectivas ecológica y económica busca una gestión óptima de los productos agroquímicos empleados en los tratamientos fitosanitarios. En concreto el análisis que se presenta en la memoria va encaminado a la obtención, a partir de un conjunto de datos, de modelos basados en reglas que expliquen, en función de parámetros ambientales y para un mismo campo, la existencia de una mayor cantidad de malas hierbas en unas zonas del cultivo frente a otras. El conocimiento incluido en los modelos extraídos aporta información de utilidad que puede plasmarse en un mapa de riesgo que permita asesorar en la aplicación precisa de herbicida sólo en las zonas del cultivo que lo requieran y en una dosis ajustada a cada situación de infestación. Los datos utilizados para la obtención de los modelos provienen de varias parcelas de cereal de invierno situadas en la comunidad de Madrid y en la provincia de barcelona y de dos tipos de mala hierba (avena sterilis l. Y lolium rigidum g.). Asimismo, los conjuntos de reglas obtenidos con la metodología propuesta se han contrastado con los modelos genarados, para el mismo conjunto de datos, con algoritmos comerciales como c&rt y c5.0, dando como resultado una mejora en la calidad de los modelos inducidos con los métodos desarrollados, es decir que nuestros modelos describen con mayor exactitud y confianza las observaciones de partida.
Datos académicos de la tesis doctoral «Generación de métodos basados en inteligencia artificial para el análisis de datos meioambientales. aplicaciones prácticas«
- Título de la tesis: Generación de métodos basados en inteligencia artificial para el análisis de datos meioambientales. aplicaciones prácticas
- Autor: Beatriz Díaz Gómez
- Universidad: Alcalá
- Fecha de lectura de la tesis: 16/12/2005
Dirección y tribunal
- Director de la tesis
- ángela Ribeiro Seijas
- Tribunal
- Presidente del tribunal: césar Férnandez quintanilla gallastegui
- María c. García-alegre sánchez (vocal)
- Francisco Javier Sans serra (vocal)
- (vocal)