Explotacion de corpus paralelos alineados para el desarrollo de entornos de composicion de documentos estructurados bilingues

Tesis doctoral de Arantza Casillas Rubio

La ia(inteligencia artificial) es un area que abarca conocimiento de muy diverso tipo y en la que, por su naturaleza interdisciplinar, se produce la convergencia de tecnicas muy diferentes. Entre las muchas aplicaciones de la ia existe una antigua y destacada, pero que se resiste a su resolucion, es el pln (procesamiento del lenguaje natural) y dentro de ese particularmente la traduccion entre textos en diferentes idiomas. Esta tesis se enfrenta de una manera realista a este problema abordandolo en su vertiente mas viable. Tiene como principal caracteristica la convergencia de diferentes tecnicas y la puesta es practica de una manera novedosa. Concretamente esta tesis aborada el tema de la composicion de documentacion especializada multilingue. Se propone una metodología de composicion que combina diversas areas de gran actualidad dentro del pln como son: el tratamiento de corpus, el procesamiento de documentos estructurados, los lenguajes de etiquetado, la traduccion automatica y la generacion multilingue. Con esta metodología se crean, a partir de un corpus alineado, recursos linguisticos, memorias de traduccion y estructuras de tipo de documento, para posteriormente utilizarlos en la composicion de documentacion similar. Para llevar a la practica la metodología propuesta es necesario desarrollar diferentes algoritmos, algunos de ellos innovadores, tanto para el tratamiento de documentos estructurados sgml,-standard generalize markup languaje- como para la manipulacion y creacion de memorias de traduccion a partir de corpus alineados. A lo largo de esta memoria se justifica que sgml, es el lenguaje de etiquetado mas apropiado para anotar documentos estructurados pertenecientes a un dominio especifico que posteriormente se vayan a utilizar como base para la composicion de documentacion similar. Para demostrar la eficacia de la metodología propuesta se ha desarrollado un prototipo de editor bilingí¼e que hemos llamado bigentor. En este edit

 

Datos académicos de la tesis doctoral «Explotacion de corpus paralelos alineados para el desarrollo de entornos de composicion de documentos estructurados bilingues«

  • Título de la tesis:  Explotacion de corpus paralelos alineados para el desarrollo de entornos de composicion de documentos estructurados bilingues
  • Autor:  Arantza Casillas Rubio
  • Universidad:  Deusto
  • Fecha de lectura de la tesis:  21/12/2000

 

Dirección y tribunal

  • Director de la tesis
    • Iñaki Alegria Loinaz
  • Tribunal
    • Presidente del tribunal: horacio Rodríguez hontoria
    • gabriel Amores carredano (vocal)
    • lidia Moreno boronat (vocal)
    • anselmo Del moral bueno (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio