Megalinguistic information extraction from specialized texts to enrich computational lexicons

Tesis doctoral de Carlos Rodríguez Penagos

Este trabajo presenta un estudio empírico del uso y función del metalenguaje en el conocimiento científico experto y los lenguajes de especialidad en lengua inglesa, con especial atención al establecimiento, modificación y negociación de la terminología común del grupo de especialistas de cada área. Mediante enunciados discursivos llamados operaciones metalingí¼ísticas explícitas se formaliza y analiza el carácter dinámico de las estructuras conceptuales científicas y los sublenguajes que las vehiculan. Por otro lado, se presenta la implementación de un sistema automático de extracción de información metalingí¼ística en textos de especialidad. El sistema mop (metalinguistic operation processor) extrae enunciados metalingí¼ísticos y definiciones de documentos especializados, utilizando tanto autómatas de estados finitos como algoritmos de aprendizaje automático. El sistema crear bases semi-estructurades de información terminológica llamadas metalinguistic information databases (mid), de utilidad para la lexicografía especializada, el procesamiento del lenguaje natural y el estudio empírico de la evolución del conocimiento científico, entre otras aplicaciones.

 

Datos académicos de la tesis doctoral «Megalinguistic information extraction from specialized texts to enrich computational lexicons«

  • Título de la tesis:  Megalinguistic information extraction from specialized texts to enrich computational lexicons
  • Autor:  Carlos Rodríguez Penagos
  • Universidad:  Pompeu fabra
  • Fecha de lectura de la tesis:  03/02/2005

 

Dirección y tribunal

  • Director de la tesis
    • Toni Badia
  • Tribunal
    • Presidente del tribunal: horacio Rodríguez
    • sophia Ananiadou (vocal)
    • ricardo Baeza yates (vocal)
    • beatrice Daille (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio