ISSN: 1139-8736
Depósito Legal: B-8714-2001

5.4 Evaluación del Módulo Acústico

5.4.1 Evaluación de la Calidad Acústica (Tasa de Error de Palabras) y Validación Estadística de los Resultados

La evaluación de la calidad acústica del sistema de reconocimiento se ha llevado a cabo considerando la influencia de 2 factores: la calidad de los patrones acústicos (modelos HMM) y la incorporación de conocimiento lingüístico, a nivel sintáctico y léxico (fonológico).

Validación de los Sistemas: Bandas de Probabilidad

No sólo es necesario obtener las Tasas de Acierto de Palabras para los diferentes sistemas sino que debemos validar estadísticamente la significancia de las diferencias de tasa entre los diversos sistemas que se han implementado y estudiado en esta tesis. Para ello vamos a utilizar el cálculo de las bandas de probabilidad que con un 95% de confianza representan las tasas de acierto de palabras obtenidas. Para poder calcular las bandas necesitamos conocer cuántos datos (número de palabras) N han intervenido en la evaluación de los sistemas. Para ello, se ha modificado el programa de evaluación (alineamiento de frases referencia y frases reconocidas) para que nos dé el número de palabras que aparecen en las frases del corpus de evaluación en cada caso. Además, cuando comparamos sistemas promediando las tasa de acierto de palabras para los cuatro locutores de la base de datos DARPA-ESPAÑOL (ver Capítulo 3), debemos multiplicar por el número de locutores para poder conocer el número de datos que han entrado en juego durante la evaluación del sistema.

El programa de cálculo de las bandas de probabilidad genera dos tablas con información, una con la tasa media, mínima y máxima para cada sistema (con el mínimo y el máximo tenemos la banda del sistema), y la segunda con la comparación cruzada entre todos los sistemas que hemos comparado. Este criterio es más severo que el test de McNemar, ya que exige que las diferencias en las tasas de acierto de palabras sean mayores o bien que se utilicen más datos para poder asegurar que los sistemas comparados son significativamente diferentes.

Recordemos los convenios que hemos adoptado en cuanto a los nombres asignados a los diccionarios, las gramáticas y los modelos HMM de alófono utilizados.

 [Convenios]

Anterior   I  Siguiente   I  Índice capítulo 5   I  Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001