Tesis doctoral de Igor Garcia Olaizola
Una de las características principales de la nueva era digital es el la gran explosión producida alrededor de los contenidos multimedia donde las imágenes (tanto estáticas como en movimiento) suponen el tipo principal de dato. Además, esta tendencia sigue siendo creciente debido principalmente a la facilidad de captura ofrecida por los dispositivos móviles que incluyen una o más cámaras.De una forma más específica, podemos destacar el sector audiovisual en el que se está produciendo una profunda transformación provocada principalmente por el proceso de convergencia con internet. En esta situación, se hacen cada vez más necesarios sistemas de búsqueda y recuperación de contenidos que permitan navegar en conjuntos masivos de datos que cada vez son más distribuidos y de una procedencia más heterogénea.El presente trabajo de tesis presenta una revisión sobre la actividad de investigación aplicada que se ha realizado mediante varios proyectos relacionados con la visión por computador y la gestión de contenido multimedia. Uno de los resultados principales de esta actividad investigadora ha sido el modelo mandrágora, un diseño de arquitectura con el objetivo de minimizar la brecha semántica y crear anotaciones automáticas basadas en una ontología previamente definida.Debido a que uno de los problemas principales a los que se enfrenta la implementación de mandrágora es el hecho de que la falta de conocimiento previo sobre el contenido limita el análisis inicial, hemos propuesto un nuevo método (ditec) para la caracterización semántica de imágenes. Los buenos resultados obtenidos en las pruebas experimentales realizadas han resultado en una adaptación del método original basado en un descriptor global de manera que una variante de dicho descriptor global resulte eficaz como descriptor local. En este documento también se describe la variante ditec local en la que los resultados de las pruebas experimentales realizadas (aún con una implementación en fase de desarrollo) han mostrado un comportamiento altamente competitivo al ser comparadas con los descriptores locales más populares en la literatura científica.
Datos académicos de la tesis doctoral «A framework for content based semantic information extraction from multimedia contents«
- Título de la tesis: A framework for content based semantic information extraction from multimedia contents
- Autor: Igor Garcia Olaizola
- Universidad: País vasco/euskal herriko unibertsitatea
- Fecha de lectura de la tesis: 12/12/2013
Dirección y tribunal
- Director de la tesis
- Julian Florez Esnal
- Tribunal
- Presidente del tribunal: Mª aranzazu Illarramendi echave
- marco francesco Quartulli — (vocal)
- Luis María no Matey muñoz (vocal)
- didier Stricker — (vocal)