Resolución de la ambiguedad léxica mediante aprendizaje por cuantificación vectorial

Tesis doctoral de Manuel García Vega

La desambiguación del sentido de las palabras (word sense disambiguation) es el problema de asignar un sentido determinado a una palabra polisémica, usando su contexto. Este problema ha sido de interés, prácticamente desde el comienzo de la informática, en los años 50. La desambiguación es una tarea intermedia y no un fin en sí misma. En particular, es muy útil, a veces imprescindible, para muchos problemas del pln,como por ejemplo la recuperación de información, la categorización de textos, la traducción automática… el objetivo de esta tesis es implementar un desambiguador del sentido de las palabras basado en el modelo de espacio vectorial optimizando los pesos de los vectores del entrenamiento usando la red neuronal lvq (learning vector quantization) del modelo neuronal supervisado de kohonen y el de proponer un método uniforme de integración de recursos que sirvan para el entrenamiento de la red. Los parámetros de la red lvq han sido optimizados para el problema de la desambiguación. en este trabajo se ha demostrado que las redes neuronales, concretamente los modelos de kohonen, resuelven brillantemente el problema de la resolución de la ambigí¼edad léxica, aportando robustez, porque la red lvq es insensible a pequeños cambios observándose unos resultados homogéneos independientemente del entrenamiento; flexibilidad, porque es fácilmente aplicable a cualquier tarea de pln; escalabilidad, porque pueden introducirse multitud de textos de entrenamiento para ajustarlo a cualquier dominio y efectividad, porque los resultados obtenidos son comparables y en muchos casos superan a los métodos tradicionales utilizados para resolver los mismos problemas. se han integrado el corpus semcor y la base de datos léxica wordnet. Además, se ha aportado un método de integración automática de cualquier corpus. Los experimentos realizados muestran el buen comportamiento de esta red para el problema concreto de la desambiguación.

 

Datos académicos de la tesis doctoral «Resolución de la ambiguedad léxica mediante aprendizaje por cuantificación vectorial«

  • Título de la tesis:  Resolución de la ambiguedad léxica mediante aprendizaje por cuantificación vectorial
  • Autor:  Manuel García Vega
  • Universidad:  Jaén
  • Fecha de lectura de la tesis:  20/12/2006

 

Dirección y tribunal

  • Director de la tesis
    • Ureña López Luis Alfonso
  • Tribunal
    • Presidente del tribunal: Miguel Toro bonilla
    • lidia Moreno boronat (vocal)
    • Manuel Palomar sanz (vocal)
    • Juan Andrés Montoyo guijarro (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio