Tesis doctoral de Montserrat Mateos Sanchez
En la web los usuarios tienen a su disposición volúmenes ingentes de información. Para buscar y recuperar información de interés, se hace imprescindible la utilización de herramientas, siendo los más utilizados los buscadores. los buscadores son herramientas específicas para la recuperación de información en la web, y se han desarrollado adaptando las tradicionales técnicas de recuperación de información a las características propias del entorno web. A pesar de esta especificidad, cuando una consulta se plantea de forma imprecisa, recuperar información pertinente se convierte en una tarea ardua y difícil, debido principalmente a la gran cantidad de páginas que se obtienen como respuesta, con mucho ruido informativo; por ello, los usuarios necesitan invertir mucho tiempo para seleccionar documentos de interés. Esto puede solucionarse en parte, si dichas páginas devueltas por el buscador, se presentan agrupadas temáticamente, de tal forma que la información de temas relacionados, esté ubicada en un mismo grupo; de este modo, el usuario sólo tendrá que identificar los grupos que pueden contener información que le sea relevante, desechando el resto, lo que implica que deberá revisar menor número de páginas o documentos. para agrupar temáticamente las páginas devueltas por un buscador, se hace necesario el uso de técnicas de clustering que ofrezcan clusters de calidad en un tiempo aceptable. en esta tesis se realiza un estudio de las técnicas de clustering y se aplican a la recuperación de información web. Como resultado, se ofrecen una serie de recomendaciones de interés para su aplicación por los diseñadores de buscadores con la finalidad de mejorar las búsquedas. para llevar a cabo dicho estudio, se propone un sistema para la experimentación de recuperación de información web que incorpora técnicas de clustering, así como un marco de trabajo experimental en el que apoyarnos para realizar el trabajo y obtener resultados adecuados.
Datos académicos de la tesis doctoral «Aparición de técnicas de clustering en la recuperación de información web«
- Título de la tesis: Aparición de técnicas de clustering en la recuperación de información web
- Autor: Montserrat Mateos Sanchez
- Universidad: Salamanca
- Fecha de lectura de la tesis: 27/11/2006
Dirección y tribunal
- Director de la tesis
- Carlos Garcia Figuerola
- Tribunal
- Presidente del tribunal: José Luis Alonso berrocal
- roberto Berjón gallinas (vocal)
- raquel Gomez diaz (vocal)
- vidal Alonso secades (vocal)