Forensic evaluation of the evidence using automatic speaker recognition systems.

Tesis doctoral de Daniel Ramos Castro

Forensic evaluation of the evicence using automatic speaker recognition systems esta tesis se centra en el uso de sistemas automáticos de reconocimiento para identificación forense, en lo que se denomina reconocimiento forense automático de locutor. En general, el proceso de identificación tiene como fin último la individualización, entendida como el imposibilidad de no distinguir una persona del resto de una población. Este objetivo se logra mediante el análisis de la evidencia forense, que es la comparación de dos muestras de un mismo tipo de material, tales como adn, vidrio o grabaciones de voz. Un sistema de reconocimiento automático de locutor puede realizar tal comparación entre una locución recogida de origen desconocido, o dubitada (por ejemplo, un pinchazo telefónico) y una locución de control tomada de un sospechoso, o indubitada. Por ejemplo, grabaciones realizadas en dependencias policiales). sin embargo, la evaluación de tal evidencia no es un asunto trivial en absoluto. De hecho, el intenso debate existente acerca de la presentación de la evidencia forense en juicios representa un punto de fricción en múltiples foros científicos y legales. Las reglas daubert americanas de admisibilidad de una disciplina en un juicio, así como ciertos errores ocurridos en identificaciones utilizando disciplinas supuestamente libres de error, han fomentado la discusión. A partir de este debate, el análisis de adn se perfila como un modelo de identificación forense científica, ya que cumple con los requerimientos más exigentes por parte del sistema legal en referencia a evaluación científica de la evidencia y experimentabilidad de los procedimientos. En esta tesis tenemos en cuenta dichos requerimientos con el objetivo de adaptar los sistema de reconocimiento automático de locutor a lo que se ha llamado el cambio de paradigma en identificación forense. comenzaremos por revisar las principales técnicas presentes en el estado del arte en reconocimiento forense automático de locutor. En primer lugar, se presenta un resumen de los métodos utilizados en la tecnología de reconocimiento automático de locutor propuestos en la literatura. Tras ello, se describe el marco experimental y de medida del rendimiento utilizado para presentar los resultados experimentales de esta tesis, resaltando las más recientes técnicas propuestas para la medida de la precisión de los sistemas forenses de reconocimiento de locutor. El protocolo experimental utilizado es el definido en las evaluaciones de tecnología de reconocimiento de locutor organizadas por el instituto americano de estándares en tecnología (nist), que constituyen el benchmark más aceptado en la comunidad. Las bases de datos utilizadas por n1st presentan condiciones desafiantes de variabilidad, que pueden simular las condiciones forenses típicas en redes telefónicas. tras ello, identificaremos los factores más influyentes de cara a definir la metodología propuesta en esta tesis. En primer lugar, analizaremos los elementos del cambio de paradigma en identificación forense, tras lo cual se analizarán los procedimientos comunes ampliamente aceptados en la comunidad del reconocimiento automático de locutor. Todos esos factores se tienen en cuenta de cara a la definición de la metodología jerárquica propuesta en esta tesis, que consiste en tres niveles de abstracción: el nivel de discriminación, el nivel de presentación y el nivel forense. La disertación se centra luego en la descripción de los niveles de abstracción que componen la metodología propuesta. Primero, se presenta el nivel de discriminación, cuyo objetivo es generar una puntuación (score) discriminante que permitirá distinguir si la voz dubitada proviene de la misma fuente que la voz tomada del sospechoso. Dado que la discriminación ha sido el objetivo del reconocimiento automático de locutor durante años, se presenta una definición de discriminación tomada de la literatura en dicho área. Además, se revisan las técnicas más populares que se han utilizado en la literatura para aumentar la capacidad discriminativa de las puntuaciones obtenidas, véase fusión de sistemas, compensación de variabilidad entre sesiones y normalización de puntuaciones. Finalmente, se presenta una nueva técnica de normalización de puntuaciones llamada kl-t-norm, que incrementa el poder de discriminación de las puntuaciones del sistema con respecto a otras técnicas como t-norm, siendo además más eficiente computacionalmente. Los resultados presentados confirman todo ello. el siguiente nivel en la jerarquía propuesta, llamado nivel de presentación, tiene como objetivo convertir la puntuación obtenida en el nivel de discriminación en una relación de verosimilitudes (likelihood ratio, lr), que es una medida del peso de la evidencia. El lr tiene un significado en sí mismo de grado de apoyo a alguna de las posibles hipótesis manejadas en el caso debido al análisis de la evidencia. Esta metodología, propuesta a principios de siglo pero sólo popularizada tras la introducción de la prueba de adn en juicios, es probabilística y basada en datos objetivos. El lr permite incluir de una forma rigurosa y lógica el peso de la evidencia en el proceso inferencial que se da en un caso forense. En este capítulo se define el concepto de precisión del lr, introduciendo el importante concepto de calibración. Tras ello, se presenta una nueva técnica para evaluar la precisión de un conjunto de valores de lr basándose en la teoría de la información, mediante la cual la precisión del sistema presenta una interpretación clara e intuitiva. la descripción del nivel de presentación continua con la descripción y el estudio comparativo de diferentes técnicas de cálculo de lr. Entre ellas, se propone un método nuevo basado en la adaptación a las particularidades del sospechoso. El estudio muestra que la técnica propuesta mejor la precisión de los valores de lr analizados, mejorando además la discriminación del sistema, debido al uso de información específica de cada locutor para el proceso de cálculo del lr. Se demuestra que la técnica propuesta es también robusta a la escasez de habla indubitada, un problema típico en casos reales. El nivel de presentación concluye con una configuración alternativa de la metodología jerárquica propuesta que considera técnicas de cálculo de lr no orientadas a puntuaciones discriminantes (scores), que es el caso típico en otras disciplinas forenses. Finalmente se presenta el último nivel de la jerarquía, el nivel forense. El objetivo aquí es considerar los requerimientos legales y derivados del cambio de paradigma en identificación forense para presentar el análisis de la evidencia al juez de manera apropiada. Presentamos varios ejemplos experimentales que ilustran el proceso de presentación de información útil al juez de manera rigurosa. Para uno de esos ejemplos, se ha utilizado uno de los sistemas y el protocolos experimentales que la guardia civil española usa en casos forenses reales. El capítulo finaliza con una demostración experimental de que la metodología propuesta es apropiada para otras disciplinas en las que se utilice el lr, tales como análisis de vidrio y de fragmentos de pintura

 

Datos académicos de la tesis doctoral «Forensic evaluation of the evidence using automatic speaker recognition systems.«

  • Título de la tesis:  Forensic evaluation of the evidence using automatic speaker recognition systems.
  • Autor:  Daniel Ramos Castro
  • Universidad:  Autónoma de Madrid
  • Fecha de lectura de la tesis:  20/12/2007

 

Dirección y tribunal

  • Director de la tesis
    • Joaquin Gonzalez Rodriguez
  • Tribunal
    • Presidente del tribunal: Luis alfonso Hernandez gomez
    • david Van leeuwen (vocal)
    • christophe Champod (vocal)
    • hermann Kí¼nzell (vocal)

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio