Nuevas aproximaciones al reconocimiento automático del habla mediante grafos de palabras y técnicas de aprendizaje no supervisado

Tesis doctoral de Jon Ander Gómez Adrián

El habla es uno de los medios más naturales para el intercambio de información entre humanos. Esto ha despertado un crecimiento interés en construir máquinas que puedan aceptar la señal vocal como entrada y actuar en función de la información transmitida. La cantidad de aplicaciones en las que utilizar máquinas que fueran capaces de entender la voz humana es considerable. el propósito de un sistema de reconocimiento del habla continua es proporcionar un mecanismo eficiente y preciso para transcribir la señal vocal a texto. empezando por el nivel más bajo, para el reconocimiento del habla mediante computadoras debemos asignar una unidad lingí¼ística a cada trozo de señal vocal, y a partir de ahí combinar dichas unidades para formar palabras, frases, acciones, instrucciones, etc. en la mayoría de los sistemas estas unidades son los fonemas, los sonidos básicos de una lengua. para pasar de las unidades básicas a las frases pronunciadas un sistma de reconocimiento del habla ha de combinar distintas fuentes de conocimiento: acústico, fonético, léxico y sintáctico. si además, quiere ampliarse a comprensión del habla ha de aplicar conocimiento semántico. la aproximación estándar, ampliamente utilizada en nuestros días y que aporta mejores resultados, integra todas las fuentes de conocimiento en una sola etapa de reconocimiento. el trabajo presentado en esta tesis propone un sistema de reconocimiento automático del habla desacoplado donde las distintas fuentes de conocimiento intervienen de manera secuencial. frente a un único módulo nuestro sistema se compone de varios módulos dispuestos en serie. cada módulo trabaja a un nivel de conocimiento diferente, desde el acústico-fonético hasta el semántico pasando por el léxico y el sintáctico. uno de los puntos más importantes y delicados ha sido el diseño de las interfaces entre módulos, donde debía prevalecer un objetivo: transferir únic

 

Datos académicos de la tesis doctoral «Nuevas aproximaciones al reconocimiento automático del habla mediante grafos de palabras y técnicas de aprendizaje no supervisado«

  • Título de la tesis:  Nuevas aproximaciones al reconocimiento automático del habla mediante grafos de palabras y técnicas de aprendizaje no supervisado
  • Autor:  Jon Ander Gómez Adrián
  • Universidad:  Politécnica de Valencia
  • Fecha de lectura de la tesis:  01/06/2004

 

Dirección y tribunal

  • Director de la tesis
    • Emilio Sanchis Arnal
  • Tribunal
    • Presidente del tribunal: Antonio josé Rubio ayuso
    • ferrán Pla santamaría (vocal)
    • eduardo Lleida solano (vocal)
    • Juan pablo Aibar ausina (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio