Sistemas de clasificación de preguntas basados en corpus para la búsqueda de respuestas

Tesis doctoral de David Tomás Díaz

?Quién fue el primer rey de inglaterra? ¿qué efecto tiene un prisma sobre la luz? ¿dónde puedo comer pizza esta noche? Infinidad de preguntas surgen a diario y no siempre encontramos quien nos dé contestación. Los sistemas de búsqueda de respuestas surgen con la intención de satisfacer las necesidades de información de los usuarios, escudriñando para ello enormes cantidades de documentación digital. Estos sistemas han cobrado especial relevancia a raíz de la explosión documental producida en los últimos años en internet. La sobreabundancia de información presente en la red, en lugar de fomentar un mayor conocimiento, consigue en ocasiones todo lo contrario: tenemos acceso a datos y más datos, pero sin ningún criterio. En este gigantesco universo de información digital hecho a la medida de las capacidades de cómputo masivo de los ordenadores, ya no existe catalogador o documentalista humanos que nos pueda ayudar en nuestras búsquedas. un primer paso para contestar a una pregunta es identificar su significado. ¿por qué se nos está preguntando? ¿por un nombre de persona? ¿una descripción? ¿un lugar? ¿es una pregunta fácil o difícil? ¿espera una respuesta corta o una larga explicación? Lo que para un humano puede resultar intuitivo, para un sistema automático supone todo un reto determinar la clase semántica de una pregunta, debiendo afrontar los problemas de la variación y la ambigí¼edad inherentes al lenguaje humano. Los sistemas de clasificación de preguntas son un componente básico en la tarea de búsqueda de respuestas. Su objetivo es asignar de forma automática una clase semántica a una pregunta formulada por el usuario. Esta información se emplea para acotar las posibles respuestas válidas, descartando todas aquellas que no se ajusten a la clase semántica detectada. esta tesis se centra en el desarrollo de sistemas automáticos de clasificación de preguntas fácilmente adaptables a diferentes idiomas y dominios de trabajo. Basamos nuestros desarrollos en técnicas de aprendizaje automático sobre corpus, siguiendo un enfoque estadístico del tatamiento del lenguaje humano. De esta manera evitamos la necesidad de conocimiento humano para construir estos sistemas, así como la dependencia de herramientas y recursos lingí¼ísticos más allá de los propios corpus de aprendizaje, obteniendo sistemas que destacan por su flexibilidad y sus escasos requerimientos.

 

Datos académicos de la tesis doctoral «Sistemas de clasificación de preguntas basados en corpus para la búsqueda de respuestas«

  • Título de la tesis:  Sistemas de clasificación de preguntas basados en corpus para la búsqueda de respuestas
  • Autor:  David Tomás Díaz
  • Universidad:  Alicante
  • Fecha de lectura de la tesis:  21/07/2009

 

Dirección y tribunal

  • Director de la tesis
    • José Luis Vicedo González
  • Tribunal
    • Presidente del tribunal: manuel Palomar sanz
    • horacio Rodríguez hontoria (vocal)
    • gí¼nter Neumann (vocal)
    • paolo Rosso (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio