Estimación de gramáticas incontextuales estocásticas y su aplicación en un modelo de lenguaje híbrido

Tesis doctoral de Linares Ospina Diego Luis

Esta tesis se centra en el estudio de las gramáticas incontextuales estocásticas (gie) generales. pricipalmente se centra en los problemas de la estimación a partir de un corpus y de su integración como modelo de lenguaje en tareas reales. en lo que se refiere a la estimación, se unifica en un solo marco todos los algoritmos de estimación para las gie en formato general. Para ello se utiliza un conjunto de derivaciones que al ser restringido, utilizando información estadística y estructural de la muestra, permite definir tanto los algoritmos clásicos de estimación como algunos que proponemos. con respecto a la integración de las gie en tareas reales, se utiliza un modelo de lenguaje híbrido. Este modelo se define como una combinación lineal de un modelo de n-gramas basado en palabras que se utiliza para capturar las relaciones locales entre palabras; y una gramática estocástica de categorías junto con una distribución de palabras en categorías, que se utiliza para representar las relaciones a largo término entre estas categorías. Igualmente se describe la manera como se estiman e integran todos estos modelo, de manera que el modelo de lenguaje híbrido sea útil en tareas reales con grandes vocabularios. finalmente, se han realizado experimentos de evaluación tanto de los modelos estimados como del modelo de lenguaje híbrido definido a partir de éllos. estos experimentos se han realizado principalmente con el corpus de «upenn trebank». Los resultados obtenidos se han medido en términos de la perplejidad de un conjunto de test y la tasa de error por palabra. Estos resultados se han comparado con toros modelos propuestos por otros autores.

 

Datos académicos de la tesis doctoral «Estimación de gramáticas incontextuales estocásticas y su aplicación en un modelo de lenguaje híbrido«

  • Título de la tesis:  Estimación de gramáticas incontextuales estocásticas y su aplicación en un modelo de lenguaje híbrido
  • Autor:  Linares Ospina Diego Luis
  • Universidad:  Politécnica de Valencia
  • Fecha de lectura de la tesis:  19/12/2003

 

Dirección y tribunal

  • Director de la tesis
    • José Miguel Benedí Ruiz
  • Tribunal
    • Presidente del tribunal: Francisco Casacuberta nolla
    • Andrés Marzal varó (vocal)
    • María ines Torres barañano (vocal)
    • Jorge Calera rubio (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio