Desambiguación en procesamiento del lenguaje natural mediante técnicas de aprendizaje automático

Tesis doctoral de Antonio Molina Marco

Este trabajo aborda la resolución de diversos problemas de ambigí¼edad en procesamiento del lenguaje natural mediante un méotodo de aprendizaje estadístico: los modelos de markov espacializados (mme). Se ha propuesto una formulación unificada que permite abordar distintas tareas de desambiguación mediante el formalismo de modelos de markov (mm). La técnica propuesta permite incorporar en un mm información relevante disponible en los datos de entrenamiento de una forma sistemática e independiente de la tarea de desambiguación. estos modelos se han denominado modelos de markov especializados. esta técnica se fundamenta en la definición del alfabeto de símbolos utilizado en un mm, mediante la selección de las características de entrada relevantes y la redefinición de los estados del modelo a partir de la información disponible en los datos de entrenamiento. éSte es un proceso totalmente independiente de la fase de aprendizaje del modelo y de la fase de análisis o etiquetando. Por ello, es posible aplicar los eficientes alforitmos desarrollados para trabajar con mm básicos. Para determinar las características relevantes que maximizan las prestaciones del modelo se ha definido una estrategia de búsqueda que guía el proceso de aprendizaje del mismo. los mme se han evaluado y contrastado experimentalmente sobre distintas tareas de desambiguación, alcanzando en todas ellas prestaciones similares a las ofrecidas por las aproximaciones más relevantes descritas en la literatura. las tareas abordadas han sido el etiquetado morfosintáctico, el análisis sintáctico superficial, la identificación de cláusulas y la desambiguación de los sentidos de las palabras. La evaluación respecto a otros sistemas han sido en todos los casos rigurosa: utilizando los mismos conjuntos de entrenamiento y de prueba que el resto de sistemas y, cuando ha sido posible, realizando la evaluación con datos proporcionados en competiciones interna

 

Datos académicos de la tesis doctoral «Desambiguación en procesamiento del lenguaje natural mediante técnicas de aprendizaje automático«

  • Título de la tesis:  Desambiguación en procesamiento del lenguaje natural mediante técnicas de aprendizaje automático
  • Autor:  Antonio Molina Marco
  • Universidad:  Politécnica de Valencia
  • Fecha de lectura de la tesis:  16/01/2004

 

Dirección y tribunal

  • Director de la tesis
    • Lidia Moreno Boronat
  • Tribunal
    • Presidente del tribunal: manuel Palomar sanz
    • lluís Márquez villodre (vocal)
    • natividad Prieto sáez (vocal)
    • iñaki Alegria loinaz (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio