Representaciones tiempo-frecuencia no parametricas de voz y aplicaciones.

Tesis doctoral de Juan Luis Navarro Mesa

En los últimos años se ha producido un importante avance en el desarrollo de las representaciones tiempo frecuencia no paramétricas, concretamente las de segundo orden y de tercer orden. El trabajo ha sido enfocado hacia las señales de voz bajo una serie de presupuestos poco restrictivos sobre; riqueza en el contenido frecuencial y en su evolución temporal, estacionariedad, no linealidades en su mecanismo de producción, estadística, etc. Si bien algunas representaciones son conocidas desde hace años otras han sido propuestas más recientemente. En consecuencia, la primera parte del trabajo ha sido estudiar la viabilidad de su aplicación como herramienta en el análisis de voz o, más concretamente, sus potencialidades de cara a ciertos problemas de voz. De los estudios preliminares, entre las muchas aplicaciones posibles, tres han sido los problemas sobre los que se ha fijado el trabajo por la idoneidad de las representaciones de cara a los mismos; detección de instantes de cierre glótico, detección de voz en ambientes ruidosos y reconocimiento automático del habla. para la detección de instantes de cierre glótico el trabajo está basado en las rtf de la clase cohen. Se ha propuesto una función de detección y un algoritmo sobre el que trabaja ésta. en la detección de voz en ambientes ruidosos, especialmente de sonidos débiles, se han propuesto dos funciones de detección, ambas basadas en el biespectro. una función se obtiene de los triángulos interno y externo del biespectro, y juega con la idea de detectar presencia de señal y cambios de estacionariedad. La otra se obtiene del poliespectro integrado. Las dos funciones se benefician de las propiedades de eliminación de ruidos de las estadísticas de orden superior impar. A la vez se propone un algoritmo basado en una detección por umbrales en la que estos se adaptan a las condiciones impuestas por la señal. el tercer gran problema de voz, el de r

 

Datos académicos de la tesis doctoral «Representaciones tiempo-frecuencia no parametricas de voz y aplicaciones.«

  • Título de la tesis:  Representaciones tiempo-frecuencia no parametricas de voz y aplicaciones.
  • Autor:  Juan Luis Navarro Mesa
  • Universidad:  Politécnica de catalunya
  • Fecha de lectura de la tesis:  01/01/1998

 

Dirección y tribunal

  • Director de la tesis
    • Eduardo Lleida Solano
  • Tribunal
    • Presidente del tribunal: Climent Nadeu Camprubi
    • Miguel Angel Ferrer Ballester (vocal)
    • Enrique Masgrau Gomez (vocal)
    • Luis Alfonso Hernandez Gomez (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio