Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko baliabideen garapena: datak, postposizio-lokuzioak eta komunztadura

Tesis doctoral de Maite Oronoz Anchordoqui

Dada la situación del euskera (se encuentra en proceso de estandarización, es muy rica en dialectos y esta rodeada de otras lenguas) es habitual el uso en la misma, de estructuras lingí¼ísticas que se alejan de las normas del lenguaje definidas por la real academia de la lengua vasca o euskaltzaindia. Llamamos errores a esas estructuras que se alejan de la norma. El objetivo de esta tesis es el desarrollo de recursos para la detección y corrección de errores sintácticos. Los sistemas que hemos desarrollado para detectar y corregir de manera automática estos errores sintácticos podrán ser utilizados en el corrector gramatical para el euskera y en sistemas para el aprendizaje de lenguas. en este trabajo de tesis hemos detectados errores en fechas, locuciones posposicionales y errores relacionados con la concordancia del verbo con el objeto, con el sujeto y con el objeto indirecto de la oración. Para analizar textos correctos e incorrectos, hemos utilizado la cadena de análisis sintáctico desarrollado en el grupo ixa de investigación. La información lingí¼ística ha sido representada usando una red de anotación en xml también desarrollada en el mismo grupo. después de haber realizado un análisis bibliográfico exhaustivo de las técnicas usadas para la corrección y detección de errores, hemos decidido usar técnicas basadas en conocimiento lingí¼ístico (técnicas simbólicas) para nuestro trabajo. Así, para la detección y corrección de errores locales hemos usado dos herramientas muy conocidas en el área del procesamiento del lenguaje natural: xerox finite state tool (xfst) para el tratamiento de fechas y constraint grammar para las locuciones posposicionales. Para el tratamiento de errores que aparecen en contextos más amplios, por ejemplo errores de concordancia, nos parece adecuado el obtener el árbol de análisis de las oraciones, y dado que no hemos encontrado ninguna herramienta adecuada para este menester, hemos desarrollado la herramienta saroi. Saroi es una herramienta general, que puede ser usada no sólo para el tratamiento de errores, si no que puede ser utilizada también para realizar consultas lingí¼ísticas sobre árboles de dependencias. Hemos realizado un estudio exhaustivo sobre la relación de la detección de errores con la ambigí¼edad que queda tras el análisis de la frase (ambigí¼edad morfosintáctica y sintáctica).

 

Datos académicos de la tesis doctoral «Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko baliabideen garapena: datak, postposizio-lokuzioak eta komunztadura«

  • Título de la tesis:  Euskarazko errore sintaktikoak detektatzeko eta zuzentzeko baliabideen garapena: datak, postposizio-lokuzioak eta komunztadura
  • Autor:  Maite Oronoz Anchordoqui
  • Universidad:  País vasco/euskal herriko unibertsitatea
  • Fecha de lectura de la tesis:  26/01/2009

 

Dirección y tribunal

  • Director de la tesis
    • M. Aranzazu Diaz De Ilarraza Sanchez
  • Tribunal
    • Presidente del tribunal: mikel lorenzo Forcada zubizarreta
    • itziar Aduriz agirre (vocal)
    • inmaculada Hernáez rioja (vocal)
    • miren igone Zabala unzalu (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio