Tesis doctoral de Manuel Martín-merino Acera
Los mapas de palabras son herramientas útiles que permiten visualizar de forma intuitiva las relaciones entre términos. Sin embargo, los algoritmos propuestos en la literatura presentan dos problemas. en primer lugar, se basan en similaridades que con frecuencia no reflejan las proximidades semánticas entre términos. Por lo tanto, las relaciones semánticas sugeridas por los mapas carecen de sentido en muchas ocasiones. como muestra empíricamente esta investigación, ello es debido al carácter asimétrico de las relaciones entre términos y al carácter disperso de la representación vectorial. en segundo lugar, los mapas propuestos en la literatura no son capaces de visualizar relaciones jerárquicas. en esta tesis desarrollamos nuevos algoritmos que evitan estos problemas. en primer lugar, proponemos nuevas variantes de los mapas autoorganizativos (som) y de algunos algoritmos de escalado multidimensional (mds) que incorporan medidas asimétricas para mejorar la posición de los términos específicos en el mapa. También extendemos los mapas som al caso de distancias no euclídeas (capaces de modelar mejor las relaciones entre términos) utilizando técnicas kernel para mejorar la calidad de los mapas. Finalmente, modificamos el escalado de kruskai incorporando distancias locales que permiten modelar mejor las proximidades para datos dispersos. por último, proponemos un nuevo som asimétrico capaz de visualizar jerarquías de términos utilizando exclusivamente una matriz de similaridades asimétrica. los nuevos algoritmos han sido probados exhaustivamente sobre dos colecciones textuales reales. La primera, dispone de tesauro, lo que permite evaluar fácilmente las relaciones inducidas por el mapa. La segunda es un problema real correspondiente a los abstracts de la librería digital de la acm. los resultados experimentales muestran que nuestros algoritmos mejoran significativamente los resultados para las alternativas
Datos académicos de la tesis doctoral «Algoritmos para la visualización de datos textuales«
- Título de la tesis: Algoritmos para la visualización de datos textuales
- Autor: Manuel Martín-merino Acera
- Universidad: Salamanca
- Fecha de lectura de la tesis: 11/07/2003
Dirección y tribunal
- Director de la tesis
- Alberto Muñoz García
- Tribunal
- Presidente del tribunal: ramón Ardanuy albajar
- Luis Pastor pérez (vocal)
- Javier Martínez moguerza (vocal)
- gregorio ismael Sainz palmero (vocal)