Combining statistical and finite-state methods for machine translation

Tesis doctoral de David Picó Vila

La traducción automática es un campo muy activo de las tecnologías del lenguaje natural que ha experimentado un fuerte desarrollo en las últimas décadas. Las técnicas que se han puesto en marcha podrían clasificarse, de manera un tanto simplista, en técnicas «basadas en el conocimiento», que utilizan información aportada por expertos lingí¼istas, y técnicas «basadas en ejemplos», que extraen la información automáticamente a partir de corpus de texto. el trabajo de esta tesis se enmarca en la seguna familia de técnicas, las basadas en ejemplos. Nos hemos centrado en el uso de un modelo en particular: el de los transductores estocásticos de estados finitos. Este modelo (y otros parecidos) se utiliza en muchas áreas de las tecnologías del lenguaje y con finalidades diferentes. Nosotros lo utilizamos aquí para la traducción entre lenguas distintas. la tesis aborda el problema de la creación de transductores estocásticos de estados finitos a partir de muestras de traducción. Estas muestras consisten en pares de frases en idiomas diferentes en los que una frase es traducción de la otra. Por un lado, aportamos varios algoritmos para la estimación de la parte probabilística de los transductores, sobre el supuesto de que se conoce ya la estructura. Por otro lado, y como contribución fundamental del trabajo, se expone un método y un conjunto de algoritmos para inferir transductores (con estructura y probabilidades) a partir de muestras, que agrupamos bajo las siglas genéricas de giati (por el inglés, grammatical inference algorithms. esta memoria presenta una primera exposición teórica de estos algoritmos, y continúa con un estudio práctico de implementación en el que se exploran diferentes formas de poner en uso giati. Se presentan también estudios experimentales de traducción que ponen de manifiesto las posibilidades reales de aplicación de estas técnicas.

 

Datos académicos de la tesis doctoral «Combining statistical and finite-state methods for machine translation«

  • Título de la tesis:  Combining statistical and finite-state methods for machine translation
  • Autor:  David Picó Vila
  • Universidad:  Politécnica de Valencia
  • Fecha de lectura de la tesis:  15/09/2005

 

Dirección y tribunal

  • Director de la tesis
    • Francisco Casacuberta Nolla
  • Tribunal
    • Presidente del tribunal: enrique Vidal ruiz
    • diamantino Antonio caseiro (vocal)
    • Vilar torres Juan Miguel (vocal)
    • María ines Torres barañano (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio