Tesis doctoral de Gemma Boleda Torrent
Esta tesis tiene como objetivo la adquisición automática de clases semánticas para adjetivos del catalán. La tesis se basa en dos hipótesis. La primera, que algunos aspectos de la semántica de los adjetivos no son totalmente impredecibles, sino que corresponden a un conjunto de tipos denotacionales, o clases semánticas. En consecuencia, los adjetivos se pueden agrupar en función de su clase semántica. La segunda hipótesis de trabajo es que la clase semántica se refleja en más de un nivel de descripción lingí¼ística. Las interfaces entre morfología y semántica y entre sintaxis y semántica son las que se exploran en detalle en la tesis. la metodología desarrollada es iterativa, y cada iteración consta de tres fases. En primer lugar, se propone una clasificación. En segundo lugar, se llevan a cabo una serie de experimentos de clasificación, tanto con sujetos humanos como con técnicas de aprendizaje automático. Finalmente, el análisis de los resultados experimentales permite identificar ventajas y desventajas de la propuesta de clasificación. en la tesis se presentan un total de tres iteraciones. En las dos primeras se utiliza una técnica de aprendizaje automático no supervisado denominada clustering. En estos experimentos se revisa la clasificación, añadiendo una clase y dejando de lado otra. en la tercera iteración se incorporan tres modificaciones significativas. En primer lugar, se lleva a cabo una tarea de anotación automática en que participan 322 personas. El acuerdo estimado entre sujetos respecto a la clase semántica de los adjetivos (kappa 0.31-0.45) es bajo respecto a los estándares académicos comúnmente aceptados: la adquisición de datos lingí¼ísticos fiables es una de las mayores dificultades para nuestra tarea. En segundo lugar, la arquitectura para la clasificación automática se redefine para que permita la adquisición de más de una clase a la vez, a fin de incorporar información sobre polisemia. Finalment
Datos académicos de la tesis doctoral «Automatic acquisition of semantic classes for adjectives«
- Título de la tesis: Automatic acquisition of semantic classes for adjectives
- Autor: Gemma Boleda Torrent
- Universidad: Pompeu fabra
- Fecha de lectura de la tesis: 18/04/2007
Dirección y tribunal
- Director de la tesis
- Antoni Badia Cardús
- Tribunal
- Presidente del tribunal: horacio Rodríguez ontoria
- stefan Evert (vocal)
- walter Daelemans (vocal)
- massimiliano Ciaramita (vocal)