La estructura de los documentos en el ámbito de recuperación de información: propuestas para su compresión, indexación y recuperación

Tesis doctoral de Joaquin Nicolas Adiego Rodriguez

Se presentan diferentes técnicas novedosas para comprimir, indexar y recuperar documentos semiestructurados. Respecto a la compresión se ha propuesto un modelo general, denominado modelo de contextos estructurales, que obtiene importantes mejoras respecto a las técnicas básicas. El modelo de contextos estructurales se puede considerar como una generalización del modelo de alfabetos separados. Por otro lado, se expone una técnica de compresión, inspirada en el esquema de lempel-ziv, que sustituye subárboles repetidos por una referencia a la primera ocurrencia del mismo. Dicha técnica ha obtenido excelentes resultados al comprimir formularios xml (xforms). En el área de indexación se describe un nuevo tipo de índice invertido para documentos semiestructurados cuyas prestaciones se encuentran entre el índice con direccionamiento a caracteres y el índice con direccionamiento a palabras. Finalmente, se ha propuesto un modelo de recuperación que mejora la precisión basándose en el concepto de densidad de información.

 

Datos académicos de la tesis doctoral «La estructura de los documentos en el ámbito de recuperación de información: propuestas para su compresión, indexación y recuperación«

  • Título de la tesis:  La estructura de los documentos en el ámbito de recuperación de información: propuestas para su compresión, indexación y recuperación
  • Autor:  Joaquin Nicolas Adiego Rodriguez
  • Universidad:  Valladolid
  • Fecha de lectura de la tesis:  30/09/2004

 

Dirección y tribunal

  • Director de la tesis
    • Fuente Redondo Pablo De La
  • Tribunal
    • Presidente del tribunal: rafael Carrasco
    • nieves Rodríguez balsaboa (vocal)
    • Silva de moura edleno (vocal)
    • mercedes Martínez (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio