Minería de datos sobre series temporales multivariable: clasificación y clustering

Tesis doctoral de Oscar Javier Prieto Izquierdo

El desarrollo de técnicas de minería de datos sobre datos de naturaleza temporal es un área de investigación en pleno apogeo, debido tanto a la cantidad de datos de este tipo relacionados con problemas de interés para la comunidad de minería de datos, como a la importancia que estas técnicas pueden tener para su aplicación en la solución de problemas reales; algunos ejemplos de estos problemas pueden aparecer en la economía, la medicina, la industria, etcétera. el presente trabajo se centra en el estudio y propuesta de técnicas de minería de datos sobre series temporales multivariable. Las tareas consideradas son las de clasificación y clustering. para la tarea de clasificación uno de los objetivos es el de comprobar si la descomposición del problema multivariable en problemas univariable supone una mejora en la tasa de acierto de los clasificadores que abordan el problema multivariable de manera directa. Para llevar a cabo esta propuesta se utilizan técnicas de combinación de clasificadores (ensembles). Esta técnica utiliza clasificadores univariable en un primer nivel para luego combinar las salidas de cada uno de ellos en un nivel superior. Esta propuesta se basa en la técnica de combinación de clasificadores stacking [wolpert92]. para la tarea de clustering el objetivo era el de estudiar el funcionamiento de los algoritmos clásicos para su uso con series multivariable. Para llevar a cabo dicho estudio fue necesaria la adaptación de algunos de los algoritmos considerados para que fuera posible su aplicación junto con técnicas específicas de las series temporales como alineamiento dinámico temporal (dtw). para ambas tareas también se planteaba como objetivo comparar los resultados del uso de medidas de disimilitud propias de las series temporales, como dtw, con los resultados obtenidos al utilizar las características extraídas propuestas en [rodriguez04]. se ha realizado un estudio experimental de distintas configuraciones de los métodos de clasificación y clustering considerados. Para la tarea de clasificación el método propuesto ha obtenido tasas de acierto más altas que los métodos con los que se ha comparado en seis de los ocho conjunto de datos tenidos en cuenta. En clustering se ha observado que los métodos jerárquicos aglomerativos son los que mejores índices de rand ajustado obtienen en líneas generales. [wolpert92] wolpert,d.H. Stacked generalization. Neural networks, 1992, 5, 241-259 [rodriguez04] rodríguez diez, j.J. Técnicas de aprendizaje automático para la clasificación de series. Tesis doctoral. Departamento de informática. Universidad de valladolid, 2004

 

Datos académicos de la tesis doctoral «Minería de datos sobre series temporales multivariable: clasificación y clustering«

  • Título de la tesis:  Minería de datos sobre series temporales multivariable: clasificación y clustering
  • Autor:  Oscar Javier Prieto Izquierdo
  • Universidad:  Valladolid
  • Fecha de lectura de la tesis:  14/04/2009

 

Dirección y tribunal

  • Director de la tesis
    • Juan José Rodríguez Diez
  • Tribunal
    • Presidente del tribunal: Antonio Bahamonde rionda
    • cecilio Angulo bahon (vocal)
    • José cristóbal Riquelme santos (vocal)
    • Rafael Martínez gasca (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio