Selección guiada de características y búsqueda de modelos homogéneos en datos de alta dimensionalidad: un enfoque aplicado a problemas de teledetección

Tesis doctoral de Esteban García Cuesta

Esta tesis estudia los problemas relacionados con la alta dimensionalidad de los datos en un contexto científico de teledetección, con el fin de estimar perfiles de temperatura en el interior de nubes gaseosas a alta temperatura (como es el caso de una llama). el objetivo principal es identificar los problemas de las técnicas existentes en este contexto práctico y proporcionar soluciones. para ello se realiza una introducción a los retos presentes en los datos de alta dimensionalidad, y al área de minería de datos que es actualmente la más activa en el estudio y tratamiento de este tipo de datos. la reducción de dimensionalidad aparece como un proceso necesario para solventar algunos de los retos planteados y mejorar el rendimiento de los algoritmos de aprendizaje. el resto del trabajo está dividido principalmente en dos partes. Cada una de estas partes desarrolla un camino alternativo para reducir la dimensionalidad de los datos y solucionar así los problemas relacionados con la alta dimensionalidad en el contexto de teledetección. en el primero de ellos, el trabajo se centra en la selección de características no supervisada para buscar la información relevante a la aplicación. el principal problema en la selección de características es que no es posible realizar una búsqueda exhaustiva debido al gran número de posibles soluciones. Por esto, se propone el uso de conocimiento previo específico de la aplicación física a tratar, para guiar el proceso de selección. Los resultados obtenidos muestran que esta solución mejora los resultados en un entorno de selección no supervisado, o frente a la ausencia de selección. la segunda parte de esta tesis se centra en la reducción de dimensionalidad desde un punto de vista de extracción de características. en ella se trata de abordar uno de los problemas principales relacionados con la alta dimensionalidad, la multicolinealidad, buscando extraer de un modo supervisado los conjuntos de datos que mantienen un comportamiento similar u homogéneo. esto va a permitir diferenciar diferentes grupos de datos y, lograr con esta división, aplicar modelos de estimación específicos para los diferentes grupos. La aproximación se basa en estructuras de grafos para incluir la información local de los datos, lo cual es muy útil en nuestra aplicación. esta solución muestra mejoras significativas en los resultados obtenidos, a la vez que permite obtener estimaciones precisas para los nuevos casos. Además, también posee una interpretación física y ayudará a un mejor entendimiento de la aplicación estudiada.

 

Datos académicos de la tesis doctoral «Selección guiada de características y búsqueda de modelos homogéneos en datos de alta dimensionalidad: un enfoque aplicado a problemas de teledetección«

  • Título de la tesis:  Selección guiada de características y búsqueda de modelos homogéneos en datos de alta dimensionalidad: un enfoque aplicado a problemas de teledetección
  • Autor:  Esteban García Cuesta
  • Universidad:  Carlos III de Madrid
  • Fecha de lectura de la tesis:  22/01/2010

 

Dirección y tribunal

  • Director de la tesis
    • Antonio J. De Castro González
  • Tribunal
    • Presidente del tribunal: pedro Isasi viñuela
    • eduardo Serrano jerez (vocal)
    • José Luis Balcazar navarro (vocal)
    • abel Calle montes (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio