Anotación y recuperación de información semántica eventiva en corpus

Tesis doctoral de Manuel Alcantara Pla

El presente trabajo pretende demostrar que un análisis eventivo esencial es un modo idóneo para estudiar las estructuras lingí¼ísticas de corpus sin necesidad de limitarlos en cuanto a dominio, tipo (oral/escrito) o lengua. se presenta un etiquetado para corpus diseñado en xml y basado en la teoría semántica de juan carlos moreno cabrera. El conjunto de etiquetas es pretendidamente minimalista (con 16 elementos) y permite una anotación sin ambigí¼edades. la viabilidad del etiquetado propuesto se muestra a través de la anotación de dos corpus con características muy diferentes. El primero, etiquetado manualmente, está formado por aprox. 50000 palabras del corpus de habla oral espontánea c-oral-rom y cubre una gran variedad de dominios y registros. el segundo, etiquetado a través del programa sst, desarrollado dentro de esta tesis, está formado por aprox. 22000 palabras del corpus periodístico uam spanish treebank. Sst traduce el análisis sintáctico del treebank a estructuras eventivas.Fruto de dichos corpus, se extrae un diccionario que relaciona los lemas de los predicados etiquetados (1175 lemas) con sus tipos eventivos y, en caso de ambigí¼edad, con la probabilidad de que sean de uno u otro tipo. la estructura eventiva se utiliza como base para estudiar las formas sintácticas. de este modo, se muestran las estructuras típicas de cada parte del evento y se utilizan estas para intentar una nueva definición de las distintas clases de palabras siguiendo sólo criterios semánticos. finalmente, se hace un estudio de los sintagmas preposicionales para demostrar hasta qué punto la anotación semántica sirve para el análisis morfosintáctico.

 

Datos académicos de la tesis doctoral «Anotación y recuperación de información semántica eventiva en corpus«

  • Título de la tesis:  Anotación y recuperación de información semántica eventiva en corpus
  • Autor:  Manuel Alcantara Pla
  • Universidad:  Autónoma de Madrid
  • Fecha de lectura de la tesis:  08/07/2005

 

Dirección y tribunal

  • Director de la tesis
    • Antonio Moreno Sandoval
  • Tribunal
    • Presidente del tribunal: Francisco Marcos marín
    • emanuela Cresti (vocal)
    • Juan Carlos Moreno cabrera (vocal)
    • José Carlos González cristobal (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio