Transformada wavelet aplicada a la extraccion de informacion en señales de voz.

Tesis doctoral de Leonard Janer Garcia

En este trabajo se ha desarrollado una herramienta de análisis de señales de voz mediante transformada wavelet. Para ello, se han estudiado las principales formas de llevarla a cabo, y finalmente, se ha diseñado una solución siguiendo la escala bark: que responde a la forma de actuar de las neuronas auditivas. el esquema propuesto basado sigue un análisis híbrido: multivoces-multiescalas. Para mantener la distribución lineal de las primeras cinco bandas de la escala bark, hemos ajustado las primeras cinco bandas del sistema a un trabajo a escala fija, mediante cinco voces diferentes de la misma función wavelet madre: una gausiana modulada. el resto de bandas del sistema, con distribución logarítmica, se construyen por variaciones de escala. el modelo de análisis busca llevar a cabo una extracción de la energía de las señales a 17 bandas. con este escalograma auditivo, se han desarrollado dos aplicaciones. La primera realiza una estimación de la frecuencia fundamental de manera síncrona con la evolución del período de pitch en señales limpias de ruido. El objeto de dicha aplicación es el seguimiento de la velocidad de vibración de las cuerdas vocales en los sonidos sonoros. Para ello se lleva a cabo un análisis con las 6 primeras bandas del escalograma previamente presentado en un esquema de estimación de pitch híbrido. Empezamos trabajando en el dominio temporal con las 6 bandas en forma paralela extrayendo la posición de sus máximos de energía: se ha probado que dichos máximos mantienen la información de los instantes de cierre glótico. para mejorar la detección de dichos instantes, se trabaja con un umbral de energía adaptativo y un algoritmo de confirmación de máximos que eliminará los errores de pérdidas accidentales de máximos relevantes o la inclusión de falsos máximos intermedios. Con la información de salida de las 6 bandas (6 estimaciones de la frecuencia de pitch), se junta

 

Datos académicos de la tesis doctoral «Transformada wavelet aplicada a la extraccion de informacion en señales de voz.«

  • Título de la tesis:  Transformada wavelet aplicada a la extraccion de informacion en señales de voz.
  • Autor:  Leonard Janer Garcia
  • Universidad:  Politécnica de catalunya
  • Fecha de lectura de la tesis:  01/01/1998

 

Dirección y tribunal

  • Director de la tesis
    • Eduardo Lleida Solano
  • Tribunal
    • Presidente del tribunal: José bernardo Mariño acebal
    • victoria Sanchez calle (vocal)
    • carmen García mateo (vocal)
    • Javier Ortega garcia (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio