Método de adquisición de modelos de dominio a partir de corpus textuales y su aplicación en la integración de bases de datos y fuentes de información

Tesis doctoral de Miguel García Remesal

La llamada «sociedad de la información» y el rápido crecimiento de la web han favorecido la aparición de numerosas fuentes «on-line’ que contienen grandes cantidades de datos e información. Es por ello que se hace necesaria la creación de nuevos métodos y herramientas para facilitar el acceso integrado a todos estos recursos a través de internet. En esta tesis doctoral se presentan una serie de métodos y herramientas cuyo propósito es llevar a cabo la integración de fuentes estructuradas (normalmente bases de datos relacionales) con fuentes no estructuradas (como colecciones de documentos de texto «plano’). Para ello, se parte del trabajo previo realizado por el autor de esta tesis en el desarrollo de ontofusion, un sistema que permite llevar a cabo la integración de fuentes estructuradas siguiendo un enfoque basado en repositorios virtuales y el uso de modelos de dominio. A priori, los métodos y herramientas proporcionados por ontofusion no pueden ser utilizados para integrar ambos tipos de fuentes, ya que las fuentes no estructuradas carecen de 1) un modelo de datos físico que las describa, y 2) un mecanismo de recuperación de información que permita ejecutar preguntas formuladas en base al modelo de datos. Para solucionar estos problemas, en este trabajo se propone: 1) crear un método que permita obtener, a partir de una fuente no estructurada, un modelo de dominio que describa su contenido, y 2) definir un modelo de recuperación de información para fuentes no estructuradas que pueda integrarse con la recuperación de datos en fuentes estructuradas. este modelo de recuperación, denominado «modelo de índices ontológicos’ o mio está basado en el modelo de recuperación más utilizado durante las últimas décadas: el modelo del espacio vectorial (mev). La utilización conjunta de estos dos componentes, y de los métodos y herramientas desarrollados en el contexto de infogenmed, sugiere que es posible lograr la int

 

Datos académicos de la tesis doctoral «Método de adquisición de modelos de dominio a partir de corpus textuales y su aplicación en la integración de bases de datos y fuentes de información«

  • Título de la tesis:  Método de adquisición de modelos de dominio a partir de corpus textuales y su aplicación en la integración de bases de datos y fuentes de información
  • Autor:  Miguel García Remesal
  • Universidad:  Politécnica de Madrid
  • Fecha de lectura de la tesis:  22/03/2006

 

Dirección y tribunal

  • Director de la tesis
    • Maojo Garcia Víctor Manuel
  • Tribunal
    • Presidente del tribunal: Juan Pazos sierra
    • anselmo Del moral bueno (vocal)
    • alejandro Pazos sierra (vocal)
    • Crespo del arco José (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio