Tesis doctoral de Diaz De María Fernando
El objetivo de esta tesis ha sido mejorar la calidad ofrecida por los algoritmos de codificacion de voz basados en prediccion lineal mediante la generalizacion del predictor para incorporar no linealidades. Tal aproximacion se basa en la presencia constatada de fenomenos no lineales en el mecanismo de produccion de voz. se ha orientado la investigacion a complementar la prediccion lineal con una contribucion no lineal, en lugar de pretender una nueva solucion global. Aparte de aprovechar los conocimientos y experiencia adquiridos sobre el enfoque lineal, la combinacion de ambos tipos de prediccion ha permitido reducir la complejidad de la parte no lineal. las redes neuronales presentan una estructura paralela que puede explotarse mediante una realizacion hardware adecuada para reducir suficientemente el tiempo de computacion de la alternativa no lineal; en particular, en esta tesis se propone el empleo de la red de funciones de base radial (rbfn: «radial basis functions network») por dos motivos fundamentales: primero, su entrenamiento es rapido en relacion con otros tipos de redes; y segundo, la rbfn proporciona una solucion regularizada al problema de prediccion, y la seleccion apropiada del parametro de regularizacion permite garantizar la capacidad de generalizacion necesaria para responder adecuadamente ante excitaciones cuantificadas. se han evaluado las dos formas naturales de combinar la rbfn con un predictor lineal: paralelo y serie, optandose por la segunda configuracion porque ademas de ofrecer unas prestaciones satisfactorias, proporciona ventajas computacionales muy importantes para su utilizacion en codificadores de analisis mediante sintesis. A continuacion, se ha diseñado la red (tamaño de la misma y valor del parametro de regularizacion) para maximizar las prestaciones del predictor hibrido. se ha propuesto un codificador (que se ha denominado cenp: «code-excited nonlinear predictive») basado en el nue
Datos académicos de la tesis doctoral «Funciones de base radial para codificacion predictiva de voz.«
- Título de la tesis: Funciones de base radial para codificacion predictiva de voz.
- Autor: Diaz De María Fernando
- Universidad: Politécnica de Madrid
- Fecha de lectura de la tesis: 01/01/1996
Dirección y tribunal
- Director de la tesis
- Juan Ramón Vidal Romaní
- Tribunal
- Presidente del tribunal: Luis Alfonso Hernandez Gomez
- María Asunción Moreno Bilbao (vocal)
- José Manuel Pardo Muñoz (vocal)
- Carmen García Mateo (vocal)