Técnicas de mejora de la representación en los sistemas de reconocimiento automático de voz

Tesis doctoral de Angel De La Torre Vega

La presente tesis aborda el problema de la representación en los sistemas de reconocimiento de voz. En este trabajo se presentan y discuten diversas técnicas orientadas a mejorar la representación de la voz para el reconocimiento. las técnicas propuestas se pueden situar en dos grupos: * las primeras tratan de mejorar la capacidad discriminativa de la representación mediante la aplicación de transformaciones. Aunque estas técnicas no están diseñadas explícitamente para mejorar el rendimiento de los reconocedores en ruido, al incrementarse la capacidad discriminativa de la representación tienden a mejorar el rendimiento tanto en condiciones limpias como ruidosas. * las técnicas del segundo grupo están diseñadas para adaptar la voz ruidosa a un entorno limpio de referencia. Dentro de este grupo se han desarrollado tanto técnicas que realizan una adaptación ciega (sin hacer consideraciones relativas al ruido) como técnicas que realizan la adaptación en base a un modelo del ruido. la tesis se ha organizado en tres grandes bloques. El primero de ellos presenta el problema del reconocimiento automático de voz y la representación de la voz. También incluye información general acerca de los experimentos realizados en esta tesis: bases de datos, sistemas de reconocimiento, tareas, etc. El siguiente bloque está dedicado a los métodos propuestos para mejorar la representación de la voz desarrollados en base a criterios discriminativos. el tercer bloque aborda el problema del reconocimiento de voz en ruido. se analiza el problema del reconocimiento de voz contaminada: se propone y estudia un método ciego (sin consideraciones previas relativas al ruido) para compensar el ruido; también se propone un modelo para describir el ruido y se presenta un método para estimarlo; para concluir el bloque, se proponen y estudian varios métodos para compensar el ruido, haciendo uso del modlo. Finalmente, la tesis se cierra con un ca

 

Datos académicos de la tesis doctoral «Técnicas de mejora de la representación en los sistemas de reconocimiento automático de voz«

  • Título de la tesis:  Técnicas de mejora de la representación en los sistemas de reconocimiento automático de voz
  • Autor:  Angel De La Torre Vega
  • Universidad:  Granada
  • Fecha de lectura de la tesis:  28/04/1999

 

Dirección y tribunal

  • Director de la tesis
    • Peinado Herrero Antonio Miguel
  • Tribunal
    • Presidente del tribunal: Francisco Casacuberta nolla
    • eduardo López gonzálo (vocal)
    • enric Mote moreno (vocal)
    • José Luis Alba castro (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio