Modelado predictivo no lineal de la señal de voz aplicado a codificacion y reconocimiento de locutor.

Tesis doctoral de Marcos Faundez Zanuy

La teoría de sistemas lineales permite usar un gran número de herramientas matemáticas, modelos, interpretaciones, etc. Por otra parte existen modelos determinísticos no lineales que pueden describir de forma muy sencilla el comportamiento de un gran número de fenómenos naturales extremadamente complicados. Sin embargo, no existe un conjunto de autofunciones universales en los sistemas no lineales, y por tanto no existe un equivalente del dominio frecuencial. los sistemas no lineales pueden presentar una gran utilidad al modelar algunos sistemas físicos que tengan no linealidades. El uso de estos sistemas no lineales puede proporcionar ganancias marginales respecto a los lineales que justifican la complejidad asociada con su uso. Esta tesis pretende contribuir a la modelización no lineal de la señal de voz, como alternativa al análisis lineal clásico, en el cual se modela el tracto vocal mediante un filtro lineal. entre las motivaciones que han llevado a cabo la realización de este estudio cabe destacar: 1. Múltiples autores han reportado la existencia de no linealidades en la producción de la señal de voz. Por tanto, el uso de un modelo no lineal será más ajustado a la realidad que el análisis lpc clásico. De esta forma se evita el problema de «dejar fuera del análisis» informaciones presentes en la señal de voz, que contienen información útil para la mayoria de aplicaciones. 2. Algunos autores han destacado la mayor ganancia de predicción, menor energía de la señal residual de predicción, etc. Al tratar con un modelo no lineal. sin embargo, el número de aplicaciones en las que se han incorporado los modelos predictivos no lineales, es todavía muy pequeño. Este punto es especialmente importante, ya que de nada sirve tener un buen modelo si cuando se pretende aplicarlo, no se comporta satisfactoriamente. 3. Los modelos no lineales polinómicos (volterra) pueden ser insatisfactorios. Requi

 

Datos académicos de la tesis doctoral «Modelado predictivo no lineal de la señal de voz aplicado a codificacion y reconocimiento de locutor.«

  • Título de la tesis:  Modelado predictivo no lineal de la señal de voz aplicado a codificacion y reconocimiento de locutor.
  • Autor:  Marcos Faundez Zanuy
  • Universidad:  Politécnica de catalunya
  • Fecha de lectura de la tesis:  01/01/1999

 

Dirección y tribunal

  • Director de la tesis
    • Francesc Vallverdú Bayes
  • Tribunal
    • Presidente del tribunal: josep Martí roca
    • Javier Ortega garcia (vocal)
    • carmen García mateo (vocal)
    • Valdes ramos julio José (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio