Tesis doctoral de Melero Nogués María Teresa
Esta tesis describe una gramática de generación sintáctica, que combina reglas escritas a mano y técnicas de aprendizaje automático. Esta gramática pertenece a un sistema de traducción automática de calidad comercial desarrollado en microsoft research. La primera parte de la tesis describe la gramática, así como las estrategias lingí¼ísticas que subyacen a las reglas. El uso real del sistema de ta en situaciones cotidianas exige del generador un alto grado de robustez, que se resuelve añadiendo a éste un módulo de pregeneración. este módulo es capaz de garantizar la integridad de la entrada, sin necesidad de incorporar elementos ad-hoc en las reglas de la gramática. En la segunda parte exploramos el uso de los clasificadores de árboles de decisión para aprender automáticamente una de las operaciones que tiene lugar en el módulo de pregeneración, en concreto la selección léxica del verbo copulativo en castellano (ser o estar). Demostramos que es posible inferir con gran precisión, a partir de ejemplos, los contextos de este fenómeno lingí¼ístico no trivial.
Datos académicos de la tesis doctoral «Combining machine learning and rule-based approaches in spanish syntactic generation«
- Título de la tesis: Combining machine learning and rule-based approaches in spanish syntactic generation
- Autor: Melero Nogués María Teresa
- Universidad: Pompeu fabra
- Fecha de lectura de la tesis: 02/06/2006
Dirección y tribunal
- Director de la tesis
- Antoni Badia Cardús
- Tribunal
- Presidente del tribunal: enric Monte moreno
- leo Wanner (vocal)
- Arrieta yarza María cruz (vocal)
- flora Ramírez bustamante (vocal)