Fusion de datos: imputacion y validacion

Tesis doctoral de Carlos Alberto Juarez Alonso

Las actitudes, el conocimiento y las acciones generalmente se basan en muestras. Algunos basan sus conclusiones en muestras pequeñas y pocas veces toman en cuenta la magnitud de lo que se desconoce. Generalmente se carece de recursos para estudiar más de una parte del problema de interés que pudiera aumentar nuestro conocimiento. Algunas razones para el uso de las técnicas de muestreo son: costo reducido, mayor velocidad, mayor enfoque o perspectiva y mayor exactitud. la fusión de datos surge como una alternativa a la fuente única de datos frente a la necesidad de conseguir el máximo de información posible al menor costo. Tiene como objetivo combinar datos de diferentes fuentes para poder disponer de toda la información en un solo archivo, aunque artificial, con todas las variables de interés. Utiliza lo mejor de la información existente en un archivo para reconstruir la información ausente en otro archivo. Es una estimación estadística de los datos faltantes. Es un medio de limitar la recolección de datos, reconstruyendo la información faltante. no es un problema de análisis estadístico con datos faltantes en el cual se consideran los mecanismos que conducen a la ausencia de datos. En el caso de la fusión de datos, se presentan bloques completos de datos ausentes, en general, muestras independientes. la revisión bibliográfica ha permitido analizar el problema del análisis de datos faltantes como una aproximación al tema de la fusión de datos, considerando que la fusión de datos es un caso particular. En este caso, se está hablando de bloques de datos faltantes y en muchas ocasiones, datos faltantes por diseño. el objetivo de la fusión de datos es por lo tanto, el obtener un solo archivo que pueda ser analizado posteriormente con herramientas de minería de datos. la idea es estimar los valores de las variables no informadas (valores faltantes) a partir de un bloque de variables informadas correlacionad

 

Datos académicos de la tesis doctoral «Fusion de datos: imputacion y validacion«

  • Título de la tesis:  Fusion de datos: imputacion y validacion
  • Autor:  Carlos Alberto Juarez Alonso
  • Universidad:  Politécnica de catalunya
  • Fecha de lectura de la tesis:  04/03/2005

 

Dirección y tribunal

  • Director de la tesis
    • Tomas Aluja Banet
  • Tribunal
    • Presidente del tribunal: manuel Marti recober
    • enric Ripoll font (vocal)
    • ludovic Revart (vocal)
    • michelle Lejeune (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio