Tesis doctoral de Holger Bilhardt
El creciente volumen de documentos almacenados en ordenadores en formato electrónico promete un cambio importante en la forma de buscar cualquier tipo de información. Este cambio ya se está produciendo, en parte debido a internet, pero también por la existencia de cada vez más sistemas cuyo fin es proporcionar información de diferentes tipos y que se utilizan de forma creciente en prácticamente todas las esferas de la vida diaria. La «sociedad de la información» presenta nuevas posibilidades, pero también nuevos retos para la informática. Es necesario superar las dificultades relacionadas con la búsqueda de información relevante sobre cualquier tema, sea la fuente internet u otro «almacén electrónico» y, sea ésta textual, multimedia o de cualquier otro tipo. La presente tesis tiene por objetivo contribuir superar estas dificultades y para ello analiza nuevos métodos para la recuperación de documento de texto. en la primera parte se presenta un nuevo modelo para la recuperación de información textual: el modelo de vectores de contexto (mvc). Este modelo utiliza una representación semánticamente enriquecida de los documentos y preguntas y, por tanto, la estimación de la relevancia de un documento para una pregunta se basa en una comparación de los contenidos conceptuales de estas entidades. El modelo es evaluado mediante una serie de experimentos con cuatro colecciones de prueba (medlars, cranfield, cisi y cacm) en los que se comparan los resultados de distintas variantes del mvc con el modelo vectorial (mv) clásico. No obstante, una de las principales conclusiones de los experimentos es que, aunque existen variantes del mvc que incrementan la efectividad respecto al mv de forma estadísticamente significativa en las cuatro colecciones, en cada colección hay otra variante que logra los mejores resultados. la segunda parte de esta tesis examina el comportamiento de estrategias de recuperación que combinan o fus
Datos académicos de la tesis doctoral «Fusión de modelos vectoriales y contextuales para la recuperación de información«
- Título de la tesis: Fusión de modelos vectoriales y contextuales para la recuperación de información
- Autor: Holger Bilhardt
- Universidad: Politécnica de Madrid
- Fecha de lectura de la tesis: 22/04/2003
Dirección y tribunal
- Director de la tesis
- Daniel Borrajo Millán
- Tribunal
- Presidente del tribunal: Juan Pazos sierra
- Miguel Delgado calvo-flores (vocal)
- Luis Maté hernández (vocal)
- bernardino Arcay varela (vocal)