Tesis doctoral de Albert Orriols Puig
Durante la última década, los sistemas clasificadores (lcs) de estilo michigan # sistemas de aprendizaje automático que combinan técnicas de repartición de crédito y algoritmos genéticos (ag) para evolucionar una población de clasificadores online # han renacido. Juntamente con la formulación de los sistemas de primera generación, se han producido avances importantes en (1) el diseño sistemático de nuevos lcs competentes, (2) su aplicación en dominios relevantes y (3) el desarrollo de análisis teóricos. Pese a eso, aún existen retos complejos que deben ser abordados para comprender mejor el funcionamiento de los lcs y para solucionar problemas del mundo real escalable y eficientemente. esta tesis trata dos retos importantes # compartidos por la comunidad de aprendizaje automático # con lcs de estilo michigan: (1) aprendizaje en dominios con clases raras y (2) evolución de modelos comprensibles donde se utilicen métodos de razonamiento similares a los humanos. El aprendizaje de modelos precisos de clases raras es crítico pues el conocimiento clave suele estar escondido en ejemplos de estas clases, y la mayoría de técnicas de aprendizaje no son capaces de modelar la rareza con precisión. El modelado de las rarezas acostumbra a ser más complejo en entornos de aprendizaje online, pues el sistema de aprendizaje recibe un flujo de ejemplos y debe detectar las rarezas al vuelo. La evolución de modelos comprensibles es crucial en ciertos dominios como el médico, donde el experto está más interesado en obtener una explicación inteligible de la predicción que en la predicción en sí misma. el trabajo presente considera dos lcs de estilo michigan como punto de partida: el xcs y el ucs. Se toma xcs como primera referencia debido a que es el lcs que ha tenido más influencia hasta el momento. Ucs es un diseño reciente de lcs que hereda los componentes principales de xcs y los especializa para aprendizaje supervisado. Dado que esta tesis está especialmente centrada en problemas de clasificación automática, también se considera ucs en el estudio. La inclusión de ucs marca el primer objetivo de la tesis, bajo el cual se revisan un conjunto de aspectos que quedaron abiertos durante el diseño del sistema. Además, para ilustrar las diferencias claves entre xcs y ucs, se comparan ambos sistemas sobre una batería de problemas artificiales de complejidad acotada. el estudio de cómo los lcs aprenden en dominios con clases raras empieza con un estudio analítico que descompone el problema en cinco elementos críticos y deriva modelos por facetas para cada uno de ellos. Este análisis se usa como herramienta para diseñar guías de configuración que permiten que xcs y ucs solucionen problemas que previamente no eran resolubles. A continuación, se comparan los dos lcs con algunos de los sistemas de aprendizaje de mayor influencia en la comunidad de aprendizaje automático sobre una colección de problemas del mundo real que contienen clases raras. los resultados indican que los dos lcs son los métodos más robustos de la comparativa. Además, se demuestra experimentalmente que remuestrear los conjuntos de entrenamiento con el objetivo de eliminar la presencia de clases raras beneficia, en promedio, el rendimiento de los métodos de aprendizaje automático incluidos en la comparativa. el reto de crear modelos más comprensibles y usar mecanismos de razonamiento que sean similares a los humanos se aborda mediante el diseño de un nuevo lcs para aprendizaje supervisado que combina las capacidades de evaluación de reglas online, la robustez mostrada por los ag en problemas complejos y la representación comprensible y métodos de razonamiento proporcionados por la lógica difusa. El sistema que resulta de la combinación de estas ideas, llamado fuzzy- ucs, se estudia en detalle y se compara con una batería de métodos de aprendizaje altamente reconocidos en el campo de aprendizaje automático. Los resultados de la comparativa demuestran la competitividad de fuzzy-ucs en referencia a la precisión e inteligibilidad de los modelos evolucionados. Adicionalmente, se usa fuzzy-ucs para extraer modelos de clasificación precisos de grandes volúmenes de datos, ejemplificando las ventajas de la arquitectura de aprendizaje online de fuzzy-ucs. en general, los avances y observaciones proporcionados en la tesis presente contribuyen a aumentar la comprensión del funcionamiento de los lcs y a preparar estos tipos de sistemas para afrontar problemas del mundo real de gran complejidad. Además, los resultados experimentales resaltan la robustez y competitividad de los lcs respecto a otros métodos de aprendizaje, alentando su uso para tratar nuevos problemas del mundo real.
Datos académicos de la tesis doctoral «New challenges in learning classifier systems: mining rarities and evolving fuzzy models«
- Título de la tesis: New challenges in learning classifier systems: mining rarities and evolving fuzzy models
- Autor: Albert Orriols Puig
- Universidad: Ramón llull
- Fecha de lectura de la tesis: 12/12/2008
Dirección y tribunal
- Director de la tesis
- Ester Bernadó Mansilla
- Tribunal
- Presidente del tribunal: david e. Goldberg
- martin v. Butz (vocal)
- xavier Llor? f?brega (vocal)
- Francisco Herrera triguero (vocal)