Tesis doctoral de Raquel Martinez Unanue
En esta tesis se aborda el problema de la alineación de un corpus paralelo y se aportan soluciones novedosas en algunos de los niveles de resolución más complejos. Estos niveles son las oraciones y algunos elementos intraoracionales como los términos multipalabra y los nombres propios. Se ha formalizado la alineación de un corpus paralelo como un problema de asignación con restricciones en un grafo bipartito. para llevar a cabo dicha formalización, se ha propuesto una serie de definiciones de conceptos asociados a la alineación que no habían sido descritos con anterioridad en la bibliografía sobre el tema. El problema de asignación en un grafo bipartito se ha formalizado como un problema de satisfacción de restricciones (psr). Para resolver este psr, se propone un algoritmo de vuelta atrás mejorado adaptado al problema de la alineación. en dicha adaptación cabe destacar la implementación que se ha realizado del espacio de alineación así como de las alineaciones candidatas. El enfoque utilizado para resovler la alineación se basa en la segmentación del corpus paralelo en los siguientes niveles descriptivos: estructural, independiente del domino y en unidades de traducción. La información resultante de dichos niveles de segmentación se convierte en una fuente de conocimiento para la resolución de la alineación. las estrategias que se proponen para alinear combinan la utilización de medidas cuantitativas con conocimiento lingí¼istico. Se trata, por lo tanto, de una propuesta híbrida que dará más o menos peso a cada tipo de criterio dependiendo del nivel de resolución al que se aplique. La evaluación de la metodología y de las soluciones algorítmicas propuestas se ha llevado a cabo con un corpus paralelo bilingí¼e en euskara y castellano perteneciente al dominio jurídico-administrataivo. Este corpus recibe el nombre de bob. los buenos resultados obtendios permiten afirmar que tanto la metodología com
Datos académicos de la tesis doctoral «Alineación automática de corpus paralelos: una propuesta metodológica y su aplicación a un dominio de especialidad.«
- Título de la tesis: Alineación automática de corpus paralelos: una propuesta metodológica y su aplicación a un dominio de especialidad.
- Autor: Raquel Martinez Unanue
- Universidad: Deusto
- Fecha de lectura de la tesis: 10/02/2000
Dirección y tribunal
- Director de la tesis
- Felisa Verdejo Maillo
- Tribunal
- Presidente del tribunal: ana García serrano
- María antonia Martí antonín (vocal)
- horacio Rodríguez hontaria (vocal)
- Francisco García vallejo (vocal)