Arquitecturas y métodos en sistemas de reconocimiento automático de habla de gran vocabulario

Tesis doctoral de Javier Macías Guarasa

La presente tesis doctoral, se enmarca en el área del reconocimiento automático de habla y específicamente en el diseño de sistemas de reconocimiento de gran vocabulario. En todos los caso, la tecnología de base en lo que se refiere al modelado, la aportan los modelos ocultos de markov que, hoy por hoy, representan el paradigma de modelado dominante. En concreto, se utilizarán técnicas de modelado discreto y semicontinuo, dependiente e independiente del contexto. en primer lugar, y a partir de una clasificación de alternativas arquitecturales en el diseño de sistemas de reconocimiento se hace un estudio teórico de la formulación del comportamiento de arquitecturas multi-módulo, tanto en coste computacional como en tasa de reconocimiento, definiendo una metodología de diseño para determinar la adecuación de módulos particulares de cara a su uso conjunto, que es validada con la experimentación correspondiente. igualmente, se hace énfasis en el estudio y evaluación de algunas de las alternativas de compresión del espacio de búsqueda, estableciendo relaciones de compromiso entre coste y tasa, que es el binomio decisivo a la hora de abordar el diseño de sistemas en tiempo real. Se presentan estudios sobre distintas estrategias de organización del espacio de búsqueda orientadas a exploración y búsqueda con algoritmos de programación dinámica: árboles y grafos, deterministas y no deterministas, proponiendo soluciones prometedoras para incrementar la tasa de inclusión obtenible sobre estructuras de grafo (en las que la compresión del espacio de búsqueda produce peores resultados que con la búsqueda lineal o en árbol). Especialmente importante es el trabajo sobre estimación de listas variables de preselección, analizando métodos paramétricos y no parámetricos, centrándonos en el uso de redes neuronales como mecanismo estimador. Se ha propuesto una metodología de selección de parámetros de entrada, topol

 

Datos académicos de la tesis doctoral «Arquitecturas y métodos en sistemas de reconocimiento automático de habla de gran vocabulario«

  • Título de la tesis:  Arquitecturas y métodos en sistemas de reconocimiento automático de habla de gran vocabulario
  • Autor:  Javier Macías Guarasa
  • Universidad:  Politécnica de Madrid
  • Fecha de lectura de la tesis:  30/11/2001

 

Dirección y tribunal

  • Director de la tesis
    • José Manuel Pardo Muñoz
  • Tribunal
    • Presidente del tribunal: Córdoba herralde ricardo de
    • Antonio Bonafonte cávez (vocal)
    • Antonio José Rubio ayuso (vocal)
    • daniel Tapias merino (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio