El problema de la fusion de colecciones en la recuperación de información multiligue y distribuida: calculo de la relevancia documental en dos pasos

Tesis doctoral de Fernando Martinez Santiago

En esta tesis se propone un nuevo enfoque, cálculo de la relevancia documental en dos pasos, para afrontar el conocido problema de la fusión de colecciones o simplemente mezcla de resultados. En breve, la fusión de colecciones está relacionada con la recuperación de información la cual, frente a una necesidad de información del usuario, debe responder con una lista de documentos relevantes para la consulta dada. En ocasiones, la obtención de tal lista de documentos debe obtenerse a partir de la fusión o mezcla de varias listas obtenidas con independencia las unas de las otras, y es en ese aspecto en el cual se centra el presente trabajo, ilustrando la bondad del método propuesto en dos escenarios: recuperación de información multiligí¼e y recuperación de información distribuida. una hipótesis que se defiende en este texto es que dada una determinada necesidad de información, tanto la puntuación como la posición alcanzada por dos documentos pertenecientes a dos colecciones distintas no es comparable debido principalmente a que la relevancia asignada a un documento no es un valor absoluto, sino muy al contrario, fuertemente dependiente de la colección a la cual pertenece tal documento. Por otra parte, es posible percibir la unión de todos los documentos devueltos par cada motor de búsqueda como una nueva colección de tamaño reducido y pequeño vocabulario, ya que sólo los términos que aparecen en la consulta formulada por el usuario son de interés en esta nueva colección. En virtud de estas dos simplificaciones, tal colección puede ser reindexada y contrastada con la consulta del usuario, obteniendo así una nueva única lista de documentos puntuados en relación con esta nueva colección creada, indexada y contada en tiempo de ejecución. los resultados obtenidos muestran que el método propuesto es estable, consiguiendo simpre una mejora respecto a otros enfoque cifrada entre el 20% y el 40%, con independe

 

Datos académicos de la tesis doctoral «El problema de la fusion de colecciones en la recuperación de información multiligue y distribuida: calculo de la relevancia documental en dos pasos«

  • Título de la tesis:  El problema de la fusion de colecciones en la recuperación de información multiligue y distribuida: calculo de la relevancia documental en dos pasos
  • Autor:  Fernando Martinez Santiago
  • Universidad:  Nacional de educación a distancia
  • Fecha de lectura de la tesis:  23/09/2004

 

Dirección y tribunal

  • Director de la tesis
    • Luis Alfonso Ureña López
  • Tribunal
    • Presidente del tribunal: felisa Verdejo maillo
    • horacio Rodríguez hontoria (vocal)
    • Manuel Palomar sanz (vocal)
    • José Carlos González cristobal (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio