Tesis doctoral de Juan Raposo Santiago
Una gran parte de la informática contenida en la web tiene una estructura latente. Por ejemplo, muchas fuentes web ofrecen formularios que permiten ejecutar consultas sobre una base de datos subyacente y devuelven los resultados obtenidos, codificándolos en html para su visualización en un navegador de internet. A este tipo de fuentes suele denominárseles fuentes web semi-estructuradas. una tarea de gran interés para multitud de aplicaciones consiste en construir programas envoltorio o interfaz (wrappers) sobre este tipo de fuentes. Un programa envoltorio para una determinada fuente web recibe como entrada una consulta emitida por una aplicación software sobre los datos de la fuente, expresada en algún lenguaje de consulta de información estructurada (e.G. Algún subconjunto de sql) el envoltorio es capaz de ejecutar automáticamente la consulta recibida en la fuente web a través de una serie de secuencias de navegación automatizada y de extraer los resultados deseados de las páginas html para devolver a la aplicación llamante una lista de resultados estructurados como respuesta. en los últimos años se han desarrollado diversas técnicas para generar semi-automáticamente programas envoltorio. Sin embargo, las fuentes web semi-estructuradas presentan un elevado nivel de autonomía, y tanto las interfaces de consulta como la manera de representar los resultados pueden cambiar sin previo aviso. Por lo tanto, sería de gran utilidad que el programa envoltorio fuese capaz de mantenerse automáticamente, detectando el cambio y regenerándose, sin intervención humana. el objetivo principal de esta tesis doctoral es abordar todos los aspectos involucrados en el mantenimiento automático de envoltorios sobre fuentes web semi-estructuradas. Las cuatro contribuciones principales de este trabajo son las siguientes: (1) una arquitectura para la generación y el mantenimiento automático de programas envoltorio para fuentes web, que tiene en cuenta todos los pa
Datos académicos de la tesis doctoral «Tecnicas de mantenimiento automatico de programas envoltorio para fuentes de datos web semiestructuradas«
- Título de la tesis: Tecnicas de mantenimiento automatico de programas envoltorio para fuentes de datos web semiestructuradas
- Autor: Juan Raposo Santiago
- Universidad: A coruña
- Fecha de lectura de la tesis: 20/07/2007
Dirección y tribunal
- Director de la tesis
- Carlos Alberto Pan Bermúdez
- Tribunal
- Presidente del tribunal: iñaki Goirizelaia ordorika
- oscar Díaz García (vocal)
- carmen Costilla rodriguez (vocal)
- vicente Luque centeno (vocal)