Nueva propuesta evolutiva para el agrupamiento de documentos en sistemas de recuperación de información.

Tesis doctoral de José Luis Castillo Sequera

El conocimiento explicito de las organizaciones se encuentra recogido en colecciones documentales controladas, a disposición de sus usuarios. Cuándo el número de documentos es elevado se necesitan herramientas para organizar y mostrar los contenidos de la colección, que permitan y faciliten a los usuarios explorar la colección para conocer mejor su naturaleza y descubrir relaciones, patrones, tendencias, y otras características para poder así «comprender» la información. la necesidad de usar conocimientos en los sistemas de recuperación de información empujó a los investigadores a analizar los sistemas inteligentes que procuran incorporar y usar dichos conocimientos con la finalidad de optimizar el sistema. En la presente tesis, se muestra un sistema evolutivo (sev), y los resultados obtenidos en la construcción de un sistema de esta naturaleza. en este trabajo hacemos una aportación en el área de recuperación de información (ri), proponiendo el desarrollo de un nuevo sistema que, utilizando técnicas evolutivas, implemente un sistema de aprendizaje del tipo no supervisado, para agrupar los documentos de un sistema de recuperación de información (sri); en donde los grupos y el número de ellos son desconocidos a priori por el sistema. El criterio para realizar el agrupamiento de los documentos estará basado por la similitud y distancia de los documentos, formando así de esta manera grupos ó clustering de documentos afines, permitiendo así agrupar los documentos de un sri de una manera aceptable, presentándose como una alternativa válida a los métodos de agrupamiento tradicionales, pudiéndose contrastar sus resultados experimentalmente con algunos de los métodos clásicos. los lexemas más relevantes de cada documento, obtenidos mediante la aplicación de técnicas de ri, permiten enriquecer la información asociada a los documentos de la colección y utilizarlos como valores de metadatos para el algoritmo evolutivo. De esta forma, el sistema funciona mediante una metodología de procesamiento de documentos que selecciona los lexemas de los documentos mediante criterios de recuperación de información. los resultados obtenidos demuestran la viabilidad de la construcción de una aplicación a gran escala de estas características, para integrarla en un sistema de gestión de conocimiento que tenga que manejar grandes colecciones documentales controladas.

 

Datos académicos de la tesis doctoral «Nueva propuesta evolutiva para el agrupamiento de documentos en sistemas de recuperación de información.«

  • Título de la tesis:  Nueva propuesta evolutiva para el agrupamiento de documentos en sistemas de recuperación de información.
  • Autor:  José Luis Castillo Sequera
  • Universidad:  Alcalá
  • Fecha de lectura de la tesis:  17/12/2010

 

Dirección y tribunal

  • Director de la tesis
    • Leon Atilano Gonzalez Sotos
  • Tribunal
    • Presidente del tribunal: pedro Jesús Burillo lopez
    • Miguel angel Patricio guisado (vocal)
    • José Javier Martínez herraíz (vocal)
    • ramón Fuentes gonzález (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio