Técnicas de recuperación por contenido de información multimedia y su aplicación a señal de vídeo no estructurado:optimizaciones en arquitecturas paralelas

Tesis doctoral de Pablo Toharia Rabasco

Esta tesis se enmarca dentro del campo de la recuperación por contenido de información multimedia, y en concreto, de imagen y vídeo. Debido al abaratamiento en los últimos años tanto de las conexiones de banda ancha como de los medios de almacenamiento masivo, la cantidad de información multimedia generada ha experimentado un crecimiento realmente signicativo. Hace unos años este crecimiento tuvo más impacto en imágenes estáticas, siendo la señal de vídeo la protagonista más recientemente. Todo esto ha provocado que haya surgido la necesidad de investigar y desarrollar técnicas que permitan organizar, almacenar y acceder a dicho contenido de forma eciente. Dentro de la comunidad cientíca existen diversos trabajos que abordan esta problemática, aunque todavía quedan ciertos aspectos que no se encuentran resueltos y otros que son susceptibles de ser mejorados u optimizados. Por otro lado, este aumento en la generación y almacenamiento de señal de vídeo, principalmente por parte de productoras o cadenas de televisión, ha acarreado la necesidad de gestionar una mayor cantidad de señal no producida. Este tipo de señal se puede considerar como una señal no estructurada, frente a la señal producida y editada que finalmente llega a las emisiones. Hasta hace muy poco tiempo casi todos los trabajos de recuperación de vídeo existentes en la bibliografía han sido desarrollados con una clara orientación al trabajo con señal de vídeo estructurada. Sin embargo, cada vez de forma más acuciante, se ha detectado la necesidad de avanzar en el desarrollo de sistemas que trabajen de forma efectiva y eciente con señal de vídeo no estructurado, como así se reeja en las últimas ediciones de la conferencia de la iniciativa trecvid. en esta tesis se ha realizado un conjunto de trabajos en el ámbito de la recuperación por contenido de vídeo que permitan realizar la transición entre señal de vídeo estructurado y señal de vídeo no estructurado, intentando además llevarlo a la práctica de forma eciente y en un entorno real de trabajo. En esta línea se ha ampliado un sistema de recuperación por contenido de imagen existente para poder combinar primitivas de color y forma, habiéndose propuesto una nueva primitiva de forma basada en momentos de zernike. Además, se ha estudiado el funcionamiento de esta primitiva en la tarea de segmentación temporal de vídeo así como su combinación con otras primitivas para esta misma tarea. Posteriormente, este sistema, junto con la segmentación temporal, se ha implantado en un sistema de recuperación por contenido de vídeo, analizando su rendimiento con señal estructurada proveniente de emisiones de noticias. Una vez completado y analizado el funcionamiento de un sistema de recuperación por contenido de señal de vídeo estructurado se ha trabajado con señal de vídeo no estructurado, proponiendo un sistema de recuperación por conceptos para vídeo no estructurado que incorpora un algoritmo de segmentación temporal especíco para este tipo de señal. Además, se ha propuesto un algoritmo de generación de resúmenes de señal vídeo no estructurado. en la línea de trabajo relacionada con la gestión y el tratamiento eciente de la señal, se han propuesto varias soluciones. En primer lugar se han diseñado diversas estrategias de paralelización para el problema de la segmentación temporal de vídeo. Por otro lado, se ha construido sobre un entorno grid un sistema de recuperación de vídeo basado en composición de servicios. Todos los trabajos realizados han sido validados y analizados experimentalmente, intentado que fueran llevados a cabo sobre entornos lo más realistas posible.

 

Datos académicos de la tesis doctoral «Técnicas de recuperación por contenido de información multimedia y su aplicación a señal de vídeo no estructurado:optimizaciones en arquitecturas paralelas«

  • Título de la tesis:  Técnicas de recuperación por contenido de información multimedia y su aplicación a señal de vídeo no estructurado:optimizaciones en arquitecturas paralelas
  • Autor:  Pablo Toharia Rabasco
  • Universidad:  Politécnica de Madrid
  • Fecha de lectura de la tesis:  18/05/2010

 

Dirección y tribunal

  • Director de la tesis
    • Oscar David Robles Sánchez
  • Tribunal
    • Presidente del tribunal: Luis Pastor pérez
    • paulo José Monteiro peixoto (vocal)
    • Carlos Cerrada somolinos (vocal)
    • José Luis Bosque orero (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio