Una metodología de minería de datos para la agrupación de series temporales: aplicación al sector de la construcción residencial

Tesis doctoral de Magdalena Ruth Ferran Aranaz

El análisis de series temporales es fundamental no sólo en la economía, sino en campos tan diversos como, por ejemplo, la ingeniería, la biología, la medicina, la psicología, la sociología e incluso las artes, siendo uno de los problemas más comunes el de comparar y relacionar un conjunto grande de series temporales. Las técnicas que facilitan la extracción de información de bases de datos voluminosas forman parte de la minería de datos. En este trabajo se presenta una metodología de minería de datos para la comparación de series temporales económicas que midan un mismo fenómeno o variable procedentes de diferentes ámbitos, localidades, agentes, condiciones, etc. Para desarrollar la metodología, realizaremos una aplicación al mercado de la vivienda, más específicamente al sector de la construcción residencial, y compararemos la evolución de la oferta de vivienda nueva en las distintas provincias españolas. la metodología que se propone consiste, básicamente, en construir los k centroid es iniciales del algoritmo de las k-medias para un análisis cluster de series temporales. La solución obtenida permitirá interpretar las similitudes entre las distintas series temporales provinciales. Consideramos que la presente metodología, a la qu e denominaremos metodología del haz de rectas, es muy útil como estudio exploratorio previo a la aplicación de cualquier modelo estadístico o económico que persiga objetivos tanto de tipo explicativo como de tipo predictivo. la tesis consta de siete capítulos. Los dos primeros describen los contextos en los que se aplica y se desarrolla la metodología. En el capítulo 1 se describe la relevancia del sector de la construcción residencial en la economía y se justifican determinadas decisiones tales como la elección del tipo de interés como principal proceso generador de las oscilaciones de la serie de vivienda nueva. El capítulo 2 está dedicado al marco teórico en el que se desarrolla la metodología: el análisis cluster de series temporales. E l capítulo comienza con una introducción al análisis cluster general, para pasar a exponer más detalladamente el algoritmo de las k-medias y los diversos métodos de inicialización de este algoritmo. el núcleo de esta tesis corresponde al desarrollo de la metodología propiamente dicho y comprende los capítulos tercero y cuarto. En el capítulo 3 se exponen los elementos teóricos sobre los que se sustenta la metodología. En el capítulo 4 se ilustran las sucesivas etapas del proceso de agrupación d

 

Datos académicos de la tesis doctoral «Una metodología de minería de datos para la agrupación de series temporales: aplicación al sector de la construcción residencial«

  • Título de la tesis:  Una metodología de minería de datos para la agrupación de series temporales: aplicación al sector de la construcción residencial
  • Autor:  Magdalena Ruth Ferran Aranaz
  • Universidad:  Complutense de Madrid
  • Fecha de lectura de la tesis:  07/02/2011

 

Dirección y tribunal

  • Director de la tesis
    • Jose Santiago Merino
  • Tribunal
    • Presidente del tribunal: Miguel Martín dávila
    • julio Rodríguez lópez (vocal)
    • José María Montero lorenzo (vocal)
    • ricardo Gimeno nogues (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio