Rol semantikoen etiketatze automatikoa: rol multzoak eta hautapen murriztapenak

Tesis doctoral de Beñat Zapirain Sierra

Laburpena tesi honetan, rolen sailkatze automatikoan (rsa) aski ezagunak diren bi arazo izan ditugu aztergai: (1) rol multzo ezberdinen egokitasuna praktikan, eta (2) rsarako sistemek darabiltzaten ezaugarri lexikalen eragin mugatua eta pairatzen duten sakabanaketa. Lehen puntuari dagokionez, gaur egun gure arloan gehien erabiltzen diren propbank eta verbneteko rol multzoen azterketa konparatibo sakona aurkeztuko dugu, rol multzo bakoitzarekin entrenatutako sailkatzaileen errendimendua, sendotasuna, eta orokortzeko gaitasuna, esperimentazio ingurune eta domeinu ezberdinetan neurtuz. Bigarren puntuari dagokionez, ezaugarri lexikoek planteatzen dituzten arazoak aztertuko ditugu eta, wordnet eta antzekotasun distribuzionaleko neurriekin sortutako hautapen murriztapenak erabiliz, arazo horien eragina modu esanguratsuan leunduko dugu. In-vitro egindako esperimentuekin, hautapen murriztapen horiek lexikotik eratorritako ezaugarriek baino sailkatze ahalmen handiagoa dutela ikusiko dugu. Azkenik, hautapen murriztapenetatik erauzitako ezaugarriak baliatuz, artearen egoeran dagoen rsa sistema baten errendimendua hobetuko dugu (domeinu barnean eta domeinuz kanpo). abstract this thesis focuses on two well-known open issues in semantic role classi fication (src) research: (1) the suitability of diferent role inventories in practice, and (2) the limited in uence and sparseness of lexical features. about the former, we present an empirical comparative study on the use of propbank vs. Verbnet roles, the two most widely used role inventories, testing the performance diferences for unseen verbs and the robustness for new corpus domains. About the latter, we test the use of automatically learnt selectional preferences as a complement to lexical features, proposing both wordnet-based and distributional similarity based models. We show that all our selectional preference models improve over lexical features in in-vitro experiments, and that the models are complementary. Finally, we show that incorporating features based on selectional preferences, the overall performance of an state-of-the-art src system improves both in in-domain and out-of-domain corpora.

 

Datos académicos de la tesis doctoral «Rol semantikoen etiketatze automatikoa: rol multzoak eta hautapen murriztapenak«

  • Título de la tesis:  Rol semantikoen etiketatze automatikoa: rol multzoak eta hautapen murriztapenak
  • Autor:  Beñat Zapirain Sierra
  • Universidad:  País vasco/euskal herriko unibertsitatea
  • Fecha de lectura de la tesis:  23/02/2011

 

Dirección y tribunal

  • Director de la tesis
    • Lluís Márquez Villodre
  • Tribunal
    • Presidente del tribunal: inmaculada Hernáez rioja
    • xavier Carreras perez (vocal)
    • andoni Sagarna izagirre (vocal)
    • roser Morante vallejo (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio