Uso de grafos semánticos en la generación automática de resúmenes y estudio de su aplicación en distintos dominios: biomedicina, periodismo y turismo

Tesis doctoral de Laura Plaza Morales

«en la sociedad en la que vivimos, la información se ha convertido en un bien necesario, a la vez que altamente cotizado, que nos acompaña en todas y cada una de nuestras actividades sociales, culturales y económicas cotidianas. Sin embargo, el crecim iento exponencial de la información a nuestro alcance se presenta como una amenaza a su uso efectivo para la formación de conocimiento, ya que, si bien la disponibilidad de esta información parece estar garantizada, no ocurre lo mismo con el tiempo n ecesario para procesarla. la generación automática de resúmenes (gar) trata, en cierta medida, de paliar los efectos negativos de la sobrecarga de información sobre la capacidad de los usuarios para obtener aquella que realmente les interesa y tran sformarla en conocimiento. Los resúmenes generados automáticamente pueden utilizarse como sustitutos de los documentos originales o simplemente como referencia en la selección de documentos para una lectura más profunda. Más aún, resultan de gran utilidad como paso intermedio en otras tareas de procesamiento de lenguaje natural (pln). la generación de resúmenes es una de las tareas más complejas de las encuadradas dentro de la más amplia disciplina del pln, debido a la gran cantidad de otras t areas que implícitamente conlleva, como la detección de temas, la desambiguación léxica, la resolución de referencias, la simplificación de oraciones o la eliminación de redundancia. Si bien casi todas ellas han sido ampliamente estudiadas en la lite ratura, en el momento de escribir esta memoria no se conoce ningún trabajo que analice el efecto de la ambigí¼edad en el texto a resumir sobre la calidad de los resúmenes generados automáticamente. Es por ello que en esta tesis doctoral se presta espe cial atención a la resolución de ambigí¼edades como un paso previo a la generación del resumen. Tal y como demuestran los resultados, la ambigí¼edad repercute negativamente en la generación automática de resúmenes, de tal modo que es posible mejorar si gnificativamente la calidad de los resultados mediante el uso de los algoritmos apropiados de desambiguación léxica. el trabajo se completa con tres casos de estudio en los que el método diseñado se configura y utiliza para generar distintos tipos d e resúmenes de textos de diferentes dominios y con unas características de estructura y estilo muy dispares: artículos científicos de biomedicina, noticias periodísticas y páginas web de información turística. Los resúmenes generados son evaluados ut»

 

Datos académicos de la tesis doctoral «Uso de grafos semánticos en la generación automática de resúmenes y estudio de su aplicación en distintos dominios: biomedicina, periodismo y turismo«

  • Título de la tesis:  Uso de grafos semánticos en la generación automática de resúmenes y estudio de su aplicación en distintos dominios: biomedicina, periodismo y turismo
  • Autor:  Laura Plaza Morales
  • Universidad:  Complutense de Madrid
  • Fecha de lectura de la tesis:  18/02/2011

 

Dirección y tribunal

  • Director de la tesis
    • navarro Gervás Gómez
  • Tribunal
    • Presidente del tribunal: Juan Pavon mestras
    • Alberto Pascual montano (vocal)
    • horacio Saggion (vocal)
    • roser Morante vallejo (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio