Sintesi de la parla per concatenacio basada en la seleccio

Tesis doctoral de Albert Ferrer Godayol

La conversion de texto o habla tiene el objetivo de imitar a un hablante en la capacidad de leer un texto, y permite trasladar la comunicación escrita entre las personas y las maquinas al habla. En el contexto de desarrollo del sistema de conversion de texto a habla del talp (upc), se ha desarrollado un sistema de sintesis del habla por concatenacion basada en la selección de unidades. la sintesis del habla de concatenacion de unidades clasica dispone de una instancia de cada una de las diferentes unidades que utiliza, habitualmente difonemas. Entonces, la voz sintetica se genera por concatenacion de las unidades necesarias. Las limitaciones en la calidad del habla se deben a dos tipos de distorsion: a) de concatenacion: los segmentos de voz utilizados estan condicionados por la coarticulacion con el contexto de donde se extraen(en general diferente del contexto donde se insertan), y b) de unidad: las caracteristicas prosódicas de los segmentos de voz son en general diferentes a la prosodia requerida para el habla sintetica (su modificacion introduce distorsion). Una forma de resolver estos dos problemas consiste en poblar la base de unidades de varias instancias diferentes para cada una de las unidades, incrementando la variabilidad fonetica y prosodica de los segmentos de voz disponibles para la concatenacion. en esta tesis se describe la generacion de un corpus de unidades de sintesis, y el procedimiento y los criterios utilizados para seleccionar estas unidades. la generacion del corpus de unidades se basa en un analisis de diferentes unidades a considerar en la selección: difonemas, trifonemas y palabras, de las que se estudian los inventarios y distribuciones frecuenciales de las apariciones. Las unidades elementales para la la concatenacion que se usan en el sistema implementado son los semifonemas, definidos como cada una de las dos partes de un fonema dependientes del contexto fonetico adyacente. En esta tesis, se describe

 

Datos académicos de la tesis doctoral «Sintesi de la parla per concatenacio basada en la seleccio«

  • Título de la tesis:  Sintesi de la parla per concatenacio basada en la seleccio
  • Autor:  Albert Ferrer Godayol
  • Universidad:  Politécnica de catalunya
  • Fecha de lectura de la tesis:  03/04/2001

 

Dirección y tribunal

  • Director de la tesis
    • Antonio Bonafonte Cávez
  • Tribunal
    • Presidente del tribunal: climent Nadeu camprubi
    • josep Marti (vocal)
    • joaquim Llisterri boix (vocal)
    • inmaculada Hernaez (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio