Tesis doctoral de Christian Blaschke
A pesar del extendido uso de ordenadores en la investigación biológica, el resultado de todos los experimentos científicos es una publicación, en formato de texto e imagen. Y nada indica que estos vaya a cambiar en los próximos años. Incluso si se genera en el futuro un sistema para la deposición de esta información dentro un formato que pueda ser leído a través de un ordenador, el problema de recobrar todo conocimiento pasado en la biología molecular, seguiría existiendo. Por eso existe un interés considerable en desarrollar métodos que pueden extraer al menos parte de esa información que permanece enterrada en la literatura de modo que pueda ser estructurada. el trabajo presentado aquí tiene un enfoque biológico y los problemas tratados eran los siguientes: * el más inespecífico y general es: «Â¿qué hay publicado sobre x?». Esto indica a un sistema de ie que extraiga todos los artículos publicados sobre el objeto x. Esta pregunda podría ser: extraer todas aquellas frases significativas que aprecen en los resúmenes sobre algún gen o alguna proteína determinada. esto puede hacerse comparando el texto donde aparece «x» con otros textos usando métodos estadísticos. * lo que entendemos por función biológica de una proteína ha cambiado sustancialmente en la última década. Una proteína es parte de una red, y de unas rutas y esta conectada con muchas otras proteínas. Desafortunadamente esta información esta enterrada mayormente en la literatura porque no existen bases de datos especializadas para mantener esta información (en los últimos años algunos proyectos se han desarrollado sobre este problema). Por eso son necesarios métodos que puedan descubrir esta información en la literatura y crear de datos automáticamente o para ayudar al prolongar las bases de datos actuales. Para este objetivo se ha desarrollado el sistema suiseki que usa herramientas lingí¼ísticas (part-of-speech taggers) y heuríst
Datos académicos de la tesis doctoral «Applications of information extraction techniques to molecular biology«
- Título de la tesis: Applications of information extraction techniques to molecular biology
- Autor: Christian Blaschke
- Universidad: Autónoma de Madrid
- Fecha de lectura de la tesis: 11/02/2002
Dirección y tribunal
- Director de la tesis
- Alfonso Valencia Herrera
- Tribunal
- Presidente del tribunal: ricardo Amils pibernat
- anna Tramontano (vocal)
- rolf Apweiler (vocal)
- José María Valpuesta moralejo (vocal)