Tecnicas de analisis sintactico. robusto para la etiquetacion del lenguaje natural.

Tesis doctoral de Jorge Graña Gil

El objetivo del procesamiento del lenguaje natural es el perfecto análisis de los lenguajes humanos. Este objetivo aun esta lejos, y por ello la mayoría de los esfuerzos de la lingí¼ística computacional se dirigen hacia tareas intermedias que no requieren un entendimiento completo. Una de ellas es la etiquetación o asignación de categorias gramaticales a las palabras. la eliminación de ambigí¼edades es crucial durante este proceso, aunque el interés se centra también en el tratamiento de palabras desconocidas. un buen rendimiento en esta fase asegura la viabilidad de procesamientos posteriores. el problema de la etiquetación e aborda a partir de recursos lingí¼isticos (diccionarios y textos escritos), con los cuales se entrenan o ajustan los parámetros de funcionamiento de los etiquetadores. Esta línea se denomina lingí¼ística basada en corpus. Las tecnicas tradicionales engloban metodos estocásticos (modelos de markov, arboles de decision, modelos de máxima entropia) y basados en reglas (aprendizaje de transformaciones). el primero objetivo del trabajo es implementar una nueva herramienta de etiquetación específica para el español, y realizar una evaluación exhaustiva de todos estos modelos. El estudio es de gran interés ya en si mismo, dado que los recursos lingí¼isticos disponibles para el español no abundan. sin embargo, un pequeño porcentaje de palabras mal etiquetadas es una características inherente a los etiquetadores puramente estocásticos. Por ello apoyamos su uso en combinación con información sintáctica, es decir, con técnicas de anlisis sintáctico robusto, siendo éste el segundo objetivo del trabajo. cuando una frase es correcta, pero la gramática no es capaz de analizarla, todavía es posible considerar los subárboles de análisis parcial de los fragmentos válidos de la frase. En nuestro caso, resulta muy interesante considerar las etiquetas de las palabras de dichos subárboles como inf

 

Datos académicos de la tesis doctoral «Tecnicas de analisis sintactico. robusto para la etiquetacion del lenguaje natural.«

  • Título de la tesis:  Tecnicas de analisis sintactico. robusto para la etiquetacion del lenguaje natural.
  • Autor:  Jorge Graña Gil
  • Universidad:  A coruña
  • Fecha de lectura de la tesis:  19/12/2000

 

Dirección y tribunal

  • Director de la tesis
    • Manuel Vilares Ferro
  • Tribunal
    • Presidente del tribunal: guillermo Rojo sánchez
    • De ledesma otamendi Luis (vocal)
    • roque Marín morales (vocal)
    • jean-cedrel Chappelier (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio