Combinación de sistemas mediante aprendizaje automático en tareas de procesamiento de lenguaje natural

Tesis doctoral de Fernando Enriquez De Salamanca Ros

En el área del procesamiento del lenguaje natural (pln) existen muchas tareas basadas en la clasificación de diferentes elementos como palabras, frases y documentos. La utilización de algoritmos de aprendizaje automático es muy común para la resolución de estas tareas, aunque las diferencias entre estas y entre los diferentes recursos utilizados hacen que no exista una solución óptima para cualquier situación. La aplicación de los métodos de combinación de clasificadores intenta aprovechar las virtudes de los diferentes tipos de clasificadores que tengamos a nuestra disposición para obtener mejores resultados que los conseguidos individualmente por estos clasificadores base. En este trabajo se realiza en primer lugar un análisis bibliográfico sobre la utilización que se ha hecho de los métodos de combinación existentes dentro del área del pln. A continuación se muestran algunos experimentos iniciales que muestran los beneficios que pueden aportar estos métodos en tareas de pln como el reconocimiento de entidades y la generación de recursos lingí¼ísticos. Más allá de estos experimentos se lleva a cabo un estudio comparativo que muestra los resultados obtenidos por una gran cantidad de métodos de combinación, aplicados sobre un gran número de recursos diferentes. Aparte de la mera aplicación de estos métodos también se estudia en profundidad los efectos de ciertas circunstancias bastante frecuentes, como la baja calidad de los clasificadores base o los datos de entrenamiento, en los resultados de la combinación. Los estudios demuestran que además de aportar mayor robustez al sistema de clasificación, los métodos de combinación también permiten combinar diferentes valores de los parámetros de ejecución de las herramientas base, además de aprovechar diferentes formas de crear la diversidad necesaria. La creación de diferentes versiones de los clasificadores o de los datos de entrenamiento son ejemplos de cómo utilizar la combinación cuando no se dispone inicialmente de la diversidad necesaria para aplicar estos métodos. Además existen escenarios más complejos que permiten integrar de forma eficiente información heterogénea con el fin de completar la tarea de clasificación con mejores resultados que utilizando únicamente los recursos preparados para dicha tarea. Tanto el análisis del estado del arte como la exhaustiva y variada parte experimental que aquí se desarrolla puede servir de guía para todos aquellos que se enfrenten a tareas de clasificación , especialmente las relacionadas con el área del pln.

 

Datos académicos de la tesis doctoral «Combinación de sistemas mediante aprendizaje automático en tareas de procesamiento de lenguaje natural«

  • Título de la tesis:  Combinación de sistemas mediante aprendizaje automático en tareas de procesamiento de lenguaje natural
  • Autor:  Fernando Enriquez De Salamanca Ros
  • Universidad:  Sevilla
  • Fecha de lectura de la tesis:  14/07/2011

 

Dirección y tribunal

  • Director de la tesis
  • Tribunal
    • Presidente del tribunal: Horacio Rodríguez Hontoria
    • María Teresa Martin Valdivia (vocal)
    • Luis Alfonso Ureña López (vocal)
    • Victor Jesús Diaz Madrigal (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio