Un sistema interactivo para la búsqueda de información en idiomas desconocidos por el usuario

Tesis doctoral de Fernando López Ostenero

En este trabajo se presenta un asistente a la búsqueda de información e idiomas desconocidos que utiliza los sintagmas nominales como unidad fundamental de traducción de los documentos y de formulación y refinamiento de la consulta. el sistema: * da soporte a la tarea de selección documental translingí¼e empleando un pseudo-resumen de los documentos basado en sintagmas nominales. * da soporte a la formulación inicial de la consulta y a su posterior refinamiento apoyándose en la información contenida en los pseudo-resúmenes de los documentos. para realizar el proceso de traducción, tanto de la consulta como de los pseudo-resúmenes, se genera previamente un diccionario bilingí¼e de sintagmas, utilizando un algoritmo que alinea sintagmas nominales entre dos idiomas utilizando exclusivamente información sobre los lemas de los términos que los componen, las posibles traducciones que ofrece un diccionario bilingí¼e, y las estadísticas de aparición de los sintagmas en dos corpus comparables. sobre un conjunto de, aproximadamente, 21 millones de sintagmas de dos y tres lemas en castellano e inglés, el algoritmo es capaz de alinear 3.9 millones, con una precisión del 80% para los sintagmas de tres lemas y del 74% para los sintagmas de dos lemas más frecuentes. Los sintagmas nominales no alineados se traduccen mediante un algoritmo que busca iterativamente subsintagma maximales alineados y utiliza la información de las alineaciones para obtener traducciones óptimas de los términos que quedan aislados. la evaluación de los diferentes aspectos individuales del proceso se ha llevado a cabo en el marco de las evaluaciones comparadas iclef (interactive cross-language evaluation forum), donde se comparan las aproximaciones propuestas con dos sistemas de referencia: * los pseudo-resúmenes translingí¼es obtienen una mejora del 25% en la medida oficial del iclef sobre una traducción proporcionada por un sistema de traducció

 

Datos académicos de la tesis doctoral «Un sistema interactivo para la búsqueda de información en idiomas desconocidos por el usuario«

  • Título de la tesis:  Un sistema interactivo para la búsqueda de información en idiomas desconocidos por el usuario
  • Autor:  Fernando López Ostenero
  • Universidad:  Nacional de educación a distancia
  • Fecha de lectura de la tesis:  16/12/2002

 

Dirección y tribunal

  • Director de la tesis
    • Julio Gonzalo Arroyo
  • Tribunal
    • Presidente del tribunal: manuel Palomar sanz
    • Ureña lópez Luis alfonso (vocal)
    • horacio Rodríguez hontoria (vocal)
    • paloma Martínez fernández (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio