Reconocimiento de texto manuscrito continuo

Tesis doctoral de Héctor Toselli Alejandro

Esta tesis tiene como línea general el estudio e implementación de un sistema de reconocimiento automático de texto manuscrito, basado en la actualmente exitosa tecnología de reconocimiento del habla (rh). se comienza con la implementación de un sistema de reconocimiento de caracteres manuscritos aislados, basados en los «modelos de markov de capa oculta» (hmms). En el mismo se prueban diferentes métodos de normalización de estilos (inclinación y altura), y diferentes conjuntos de extracciones de características adecuadas para su uso con los hmms. En los experimentos se consiguen resultados comparables con otras aproximaciones sobre el mismo corpus de muestras. a continuación se implementa un sistema de reconocimiento de texto manuscrito continuo (rtm) para una tarea de reconocimiento de cantidades numéricas escritas mediante texto en castellano. El corpus utilizado se compone de muestras obtenidas en el laboratorio en condiciones controladas, y dispone de un léxico comparativamente pequeño. Se prueban diferentes técnicas de preproceso para normalización de los atributos de estilo de las frases (pendiente de línea base, inclinación vertical y altura). Se realiza el reconocimiento global de las frases, sin aplicar ningún tipo de segmentación previa explícita de sus elementos componentes (palabras y/o caracteres), basándose en el empleo de diferentes fuentes de conocimiento. Cada una de éstas fuentes rige un grado de percepción diferente en la formación correcta de frases; morfológico, léxico y sintáctico. Todas ellas son modeladas por máquinas de estados finitos (mef), permitiendo ser integradas fácilmente entre si y posibilitando una inter-cooperación eficaz entre las mismas. para el modelo sintáctico (de lenguajes) se utiliza tanto un autómata de estados finitos construido manualmente, como n-gramas inferidos a partir de las muestras. Con ambos modelos se consiguen resultados de reconocimiento excelentes

 

Datos académicos de la tesis doctoral «Reconocimiento de texto manuscrito continuo«

  • Título de la tesis:  Reconocimiento de texto manuscrito continuo
  • Autor:  Héctor Toselli Alejandro
  • Universidad:  Politécnica de Valencia
  • Fecha de lectura de la tesis:  22/03/2004

 

Dirección y tribunal

  • Director de la tesis
    • Enrique Vidal Ruiz
  • Tribunal
    • Presidente del tribunal: Francisco Casacuberta nolla
    • josep Llados canet (vocal)
    • Marzal i varó Andrés (vocal)
    • María ines Torres barañano (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio