Tesis doctoral de Santiago Cruz Llanas
La tesis recoge un detallado estudio de las tecnologías de reconocimiento de locutor y de identificación facial, planteando y analizando diferentes estrategias de fusión de ambas tecnologías biometricas. la tesis se divide en dos partes fundamentales. La primera es una introducción al ámbito de la biometría y una presentación del estado del arte en todos los temas que se abordan posteriormente desde una perspectiva práctica: verificación biométrica, reconocimiento de locutor, reconocimiento facila y biometría multimodal voz-cara. en la segunda parte de la tesis se describen sistemas de reconocimiento de locutor y reconocimiento facial. En reconocimiento de voz se utiliza parametrización mfcc y modelos de mezclas gaussianas (gmm) entrenados mediante técnicas map. En reconocimiento facial se analizan diferentes diseños, aunque se presta mayor atención a los métodos relacionados con álgebra lineal, reducción de la dimensión y modelos estadísticos (pca, lda, etc.). la parte más innovadora de la tesis es la correspondiente a fusión multimodal. se analizan formas de combinar las puntuaciones ofrecidas por los reconocedores de voz y cara. Se proponen métodos de normalización de puntuaciones y diferentes reglas de fusión. Todos los experimentos realizados en la tesis siguen el protocolo de evaluación de lausanne asociado a la base de datos xm2vts.
Datos académicos de la tesis doctoral «Integracion de audio y video en reconocimiento biometrico«
- Título de la tesis: Integracion de audio y video en reconocimiento biometrico
- Autor: Santiago Cruz Llanas
- Universidad: Politécnica de Madrid
- Fecha de lectura de la tesis: 27/05/2005
Dirección y tribunal
- Director de la tesis
- Javier Ortega Garcia
- Tribunal
- Presidente del tribunal: narciso García santos
- eduardo Lleida solano (vocal)
- joaquin Gonzalez rodriguez (vocal)
- Siguenza pizarro Juan Alberto (vocal)