Generative models for video analysis and 3d range data applications

Tesis doctoral de Xavier Orriols Majoral

La mayoría de problemas en visión por computador no contienen una relación directa entre el estímulo que proviene de sensores de tipo genérico y su correspondiente categoría perceptual. Este tipo de conexión requiere de una tarea de aprendizaje compleja. De hecho, las formas básicas de energía, y sus posibles combinaciones, son un número reducido de comparación a las infinitas categorías perceptuales correspondientes a objetos, acciones, relaciones entre objetos, etc. Dos factores principales determinan el nivel de dificultad de cada problema específico: 1,- los diferentes niveles de información que se utilizan. 2,- la complejidad del modelo que se emplea con el objetivo de explicar las observaciones. la elección de una representación adecuada para los datos toma una relevancia significativa cuando se tratan invariancias, dado que estas siempre implican una reducción de los grados de libertad del sistema, i.E., El número necesario de coordenadas para la representación es menor que el empleado en la captura de datos. De este modo, la descomposición en unidas básicas y el cambio de representación dan lugar a que un problema complejo se pueda transformar en uno de manejable. Esta simplificación del problema de la estimación debe depender del mecanismo propio de combinación de estas primitivas con el fin de obtener una descripción óptima del modelo complejo global. Esta tesis muestra como los modelos de variables latentes reducen dimensionalidad, que teniendo en cuenta las simetrías internas del problema, ofrecen una manera de tratar con datos parciales y dan lugar a la posibilidad de predicciones de nuevas observaciones. las líneas de investigación de esta tesis están dirigidas al manejo de datos provenientes de múltiples fuentes. Concretamente, esta tesis presenta un conjunto de nuevos algoritmos aplicados a dos áreas diferentes dentro de la visión por computador: 1,- video análisis y sumarizaci

 

Datos académicos de la tesis doctoral «Generative models for video analysis and 3d range data applications«

  • Título de la tesis:  Generative models for video analysis and 3d range data applications
  • Autor:  Xavier Orriols Majoral
  • Universidad:  Autónoma de barcelona
  • Fecha de lectura de la tesis:  26/02/2004

 

Dirección y tribunal

  • Director de la tesis
    • Xavier Binefa Valls
  • Tribunal
    • Presidente del tribunal: jordi Vitrií  marca
    • david Cooper (vocal)
    • lLuis Torres (vocal)
    • marco Bressan (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio