Tesis doctoral de David Perez-piñar Lopez
Uno de los aspectos más complicados en el diseño e implementación de sistemas de diálogo reales se encuentra en la gestión de los errores que surgen en la interacción hablada con el usuario. Las soluciones tradicionales, que tratan de resolver los errores interactuando con el usuario o robusteciendo el módulo de reconocimiento para conseguir tasas de error menores, tienen grandes limitaciones. Los diálogos de corrección complican enormemente la gestión del diálogo, son habitualmente difíciles y tediosos para el usuario y provocan un enorme rechazo en éste. La mejora del reconocedor, por su parte, reduce el problema sólo en cierta medida, porque no cubre todas las fuentes de error y requiere una íntima coordinación con otros módulos para ser eficaz. esta tesis trata de mostrar que es posible mejorar la calidad de los sistemas prácticos de diálogo en este sentido sin reducir su modularidad y sin aumentar excesivamente su complejidad. Para ello se parte de la hipótesis de que la reducción de los errores de entendimiento entre el usuario y el sistema requiere el uso de fuentes de conocimiento de alto nivel que proporcionen la información necesaria. Este punto de partida se emplea para proponer una arquitectura modificada para mejora notablemente las tasas de reconocimiento y cumple, al mismo tiempo, las condiciones de modularidad y facilita de implementación tan importantes en sistemas reales. para ello el trabajo se inicia con un estudio previo, necesariamente resumido, del estado del arte en el campo de los sistemas de diálogo, al que se añade como ejemplo el sistema telcorreo, de desarrollo propio, que ha permitido centrar el problema y definir los aspectos más problemáticos desde el punto de vista del usuario. la arquitectura modificada del sistema, que constituye la base de las aportaciones de esta tesis, permite introducir las fuentes de conocimiento de alto nivel mediante el uso de medidas de confianza de bajo nivel y mediante la aplicación del análisis semántico latente. Esta arquitectura usa la identificación del tema al que corresponde la locución del usuario para mejorar el reconocimiento. El reconocedor tradicional se sustituye por un módulo de reconocedores adaptados a cada tema que trabajan en paralelo, y que combinan sus salidas para identificar el tema de la frase. De este modo, la información de alto nivel requerida para reducir los errores se introduce en la arquitectura misma del sistema, y al mismo tiempo se permite el uso de reconocedores desarrollados por terceros y se obtiene un sistema completamente dirigido por datos, y por ello, muy fácil de implementar y ajustar a cada aplicación.
Datos académicos de la tesis doctoral «Estudio y aplicacion de medidas de confianza para la mejora de sistemas de dialogo«
- Título de la tesis: Estudio y aplicacion de medidas de confianza para la mejora de sistemas de dialogo
- Autor: David Perez-piñar Lopez
- Universidad: Vigo
- Fecha de lectura de la tesis: 16/04/2007
Dirección y tribunal
- Director de la tesis
- Carmen García Mateo
- Tribunal
- Presidente del tribunal: José bernardo Mariño acebal
- ruben Sansegundo hernandez (vocal)
- Luis alfonso Hernandez gomez (vocal)
- ramón López-cózar delgado (vocal)