Estrategias para la mejora de la naturalidad y la incorporación de variedad emocional a la conversión texto a voz en castellano

Tesis doctoral de Juan Manuel Montero Martínez

En esta tesis se abordan tres subproblemas relacionados con la variedad y la naturalidad en la conversión texto habla en castellano: el procesado lingí¼ístico orientado a prosodia, el modelado de la frencuencia fundamental en un dominio restringido y el análisis, modelado y conversión texto a voz con emociones. en el capítulo dedicado a las investigaciones en procesado lingí¼ístico del texto se comienza describiendo en detalle los corpora empleado en la experimentación, tanto en normalización como en etiquetado. La técnica desarrollada en normalización emplea reglas de experto, con muy buenos resultados tanto en precisión como en cobertura, destacando el empleo de reglas de silabicación para la detección precisa de palabras extranjeras. al afrontar la desambiguación gramatical, se comparan tres técnicas: reglas de experto, aprendizaje automático de reglas y modelado estocástico, obteniéndose los mejores resultados con esta última técnica, debido a su capacidad de procesar más adecuadamente textos fuera del dominio de entrenamiento. Finalmente se aborda el análisis sintáctico por medio de gramática de contexto libre como un proceso en dos fases; una primera sintagmática y una segunda relacional básica, a fin de maximizar la cobertura del análisis. Para la resolución de las ambigí¼edades que nos permiten alcanzar gran cobertura se adapta el principio de mínima longitud de descripción con notables resultados. las gramáticas desarrolladas se encuentran comentadas y ejemplificadas en un apéndice. para el modelado de f0 en un dominio restringido se emplean perceptrones multicapa. En una primera etapa se describe y evalúa una nueva técnica de diseño de base de datos basada en un algoritmo voraz moderado mediante subobjetivos intermedios. La exhaustiva experimentación con los diversos parámetros de predicción, la configuración de la red y las subdivisiones de la base de datos ocupa la mayor parte del cap

 

Datos académicos de la tesis doctoral «Estrategias para la mejora de la naturalidad y la incorporación de variedad emocional a la conversión texto a voz en castellano«

  • Título de la tesis:  Estrategias para la mejora de la naturalidad y la incorporación de variedad emocional a la conversión texto a voz en castellano
  • Autor:  Juan Manuel Montero Martínez
  • Universidad:  Politécnica de Madrid
  • Fecha de lectura de la tesis:  14/11/2003

 

Dirección y tribunal

  • Director de la tesis
    • José Manuel Pardo Muñoz
  • Tribunal
    • Presidente del tribunal: javier Ferreiros lópez
    • Enríquez carrasco emilia v. (vocal)
    • eduardo Rodríguez banga (vocal)
    • david Escudero mancebo (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio