Influencia de los segmentos del discurso en la discriminación del locutor

  1. Puente Rodríguez, Luis Antonio
Dirigida por:
  1. Ángel García Crespo Director/a
  2. Belén Ruiz Mezcua Director/a

Universidad de defensa: Universidad Carlos III de Madrid

Fecha de defensa: 06 de febrero de 2014

Tribunal:
  1. José Manuel Molina López Presidente/a
  2. Luis Alfonso Hernández Gómez Secretario/a
  3. Rafael Valencia García Vocal
  4. David Camacho Fernández Vocal

Tipo: Tesis

Resumen

La autenticación de la identidad de las personas es hoy en día una tarea crucial, ya que una amplia variedad de sistemas precisan de un método fiable, bien para determinar o bien para confirmar la identidad de los individuos. Entre los métodos de autenticación, el “reconocimiento biométrico” ha recibido una considerable atención en los últimos años debido principalmente a dos motivos: el fuerte crecimiento de la demanda de aplicaciones de seguridad, tanto comerciales como militares y el rápido desarrollo de la tecnología que las soporta. Su finalidad es la determinación de la identidad de las personas basándose en uno o más rasgos físicos o de comportamiento, elementos, que a diferencia de los utilizados por otras técnicas, siempre acompañan al individuo. En este área, la utilización de la voz humana como rasgo presenta un conjunto de características que la hacen especialmente practica y la convierten en la mejor opción, cuando no la única, en un amplio conjunto de aplicaciones. El esquema general del proceso de reconocimiento define dos grandes etapas: la extracción de la información relevante de las muestras de voz capturadas, y la comparación de dicha información con otra de las mismas características previamente almacenada; comparación, esta última, para lo cual se suele hacer uso de técnicas de clasificación provenientes del área de la inteligencia artificial. Dado el estado actual de los algoritmos de clasificación, parece difícil pensar que los sistemas de reconocimiento biométrico puedan mejorar sustancialmente sus tasas a partir de la mejora de los mismos; es necesario, por tanto mejorar la calidad de la información que se les suministra. En este trabajo, el autor presenta un nuevo enfoque que permite la mejora de las tasas del reconocimiento del locutor mediante la selección de la dicha información, proponiendo, asimismo, un sencillo algoritmo que realiza este filtrado. Sus resultados no sólo son aplicables al diseño de nuevos sistemas, sino que resultan útiles a la hora de mejorar las prestaciones de los que se encuentran en funcionamiento. ---------------------------------------------