Reconocimiento robusto del locutor mediante adaptacion jacobiana de los modelos acusticos

Tesis doctoral de Jan Anguita Ortega

El desarrollo de tecnologías capaces de reconocer de forma automática a una persona mediante su voz ha experimentado un creciente interés en los últimos años debido a sus múltiples aplicaciones: controles de acceso, transacciones financieras y comerciales, indexación de audio de reuniones y de programas de radio y televisión, investigación policial, personalización de servicios… Cuando los sistemas de reconocimiento del locutor se enfrentan a aplicaciones reales sus prestaciones se ven severamente degradadas por el desajuste entre las condiciones de la fase de entrenamiento y las de la fase de reconocimiento. Este desajuste está generalmente asociado al ruido ambiental y a la distorsión de canal. La necesidad de reducir estos efectos se ha convertido en un importante desafío para la tecnología del habla. En los últimos años se han propuesto varias técnicas robustas de reconocimiento incluyendo nuevas representaciones de la voz y técnicas de compensación de los parámetros y los modelos acústicos. en esta tesis se han evaluado una serie de técnicas de mejora de la calidad de la señal de voz, de extracción y compensación de parámetros y de adaptación de los modelos acústicos con el objetivo de reducir las tasas de error del sistema en diferentes condiciones de ruido y con diferentes tipos de micrófonos. Se ha prestado especial atención a la adaptación jacobiana (ja), una técnica que permite adaptar los modelos a los cambios de ruido, y se ha mejorado para hacerla más adecuada a los sistemas de reconocimiento del locutor. La adaptación jacobiana adapta los modelos acústicos en función de la diferencia entre las condiciones de ruido en las etapas de entrenamiento y test. Por este motivo es necesario estimar una referencia del ruido en ambas etapas. La nueva propuesta, denominada adaptación jacobiana con referencia del ruido dependiente del modelo (mnrja), consiste en estimar una referencia de ruido para cada modelo en lugar de tene

 

Datos académicos de la tesis doctoral «Reconocimiento robusto del locutor mediante adaptacion jacobiana de los modelos acusticos«

  • Título de la tesis:  Reconocimiento robusto del locutor mediante adaptacion jacobiana de los modelos acusticos
  • Autor:  Jan Anguita Ortega
  • Universidad:  Politécnica de catalunya
  • Fecha de lectura de la tesis:  23/11/2007

 

Dirección y tribunal

  • Director de la tesis
    • Francisco Javier Hernando Pericas
  • Tribunal
    • Presidente del tribunal: Climent Nadeu Camprubi
    • Javier Rodríguez Saeta (vocal)
    • Francisco Javier Caminero Gil (vocal)
    • Laura Docio Fernandez (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio