ISSN: 1139-8736
Depósito Legal: B-8714-2001

5.3.2.4 Influencia de la Gramática y del Modelado Acústico en el Umbral de Recorte

Como comentamos anteriormente, nos interesa estudiar el comportamiento del espacio de búsqueda cuando se mejoran las condiciones del sistema de reconocimiento. Es decir, cómo influye la calidad del Módulo Acústico en la determinación de los umbrales de recorte y la eficacia de los mismos.

Para realizar este estudio utilizamos la versión del sistema de reconocimiento que emplea la gramática  GR160S-J, y los modelos semicontinuos de Markov de 3 codebooks (S3V). Los histogramas son calculados con los datos de evaluación pues ya conocemos su relación con los histogramas calculados con los datos de entrenamiento y nos permite reducir el tiempo necesario para realizar la experimentación.

S3V, GR160S-J
PROMEDIO
Trama Actual
Espacio Tot:

44142 est.
ANCHO DEL HAZ CONSTANTE
Distancia a sumar a la Distancia Mínima (Margen)
2 Umbrales 1 Umbral
Factor de Conservación Resto Estados Últimos Estados Todos los
Estados
100.0 % 300000 300000 300000
99.99 % 264075 169875 264075
99.90 % 205950 134775 202725
99.70 % 169800 104700 166950
99.50 % 155550 95850 153375
99.40 % 150900 91800 148425
99.30 % 145950 88425 144075
99.20 % 142425 86175 140100
99.10 % 139800 83850 137925
99.00 % 137700 82125 135150
98.50 % 126150 74475 123675
98.30 % 122850 72450 119550
98.00 % 116850 67725 113775
97.50 % 109650 60975 106950

Tabla 5.13 Umbrales Promedio para la estrategia de recorte implementada (Ancho de Haz Constante), con un sólo umbral o dos umbrales de recorte (Locutores: ENR, FER, LEA, ROM - Modelos S3V de Markov). Los umbrales han sido calculados utilizando los datos de evaluación.

Utilizando las tablas 5.12 y 5.13 representamos las curvas de la figura 5.14. En ella podemos observar la evolución de las constantes para distintos factores de conservación cuando varía la calidad del módulo de reconocimiento (incluimos gramática y un mejor modelado acústico).

Fig. 5.14 Evolución del valor de las constantes de recorte calculadas para distintos factores de conservación para los histogramas calculados con los datos de evaluación para dos sistemas de calidad diferente. Uno de ellos utiliza gramática (GR160S-J) y modelos semicontinuos de 3 codebooks (S3V) y el otro utilkiza sólo modelos discretos de 2 codebooks (D2).

En la figura 5.14 se puede observar cómo la constante de recorte, y por tanto, el umbral de recorte, para un mismo factor de conservación es menor en el caso de utilizador un sistema de reconocimiento de mayor calidad (gramática y mejores modelos HMM). Ese umbral de recorte menor supondrá una mayor reducción del coste computacional en el sistema si suponemos que el hecho de tener un mismo factor de conservación supone Tasas de Acierto de Palabras (WA) similares. Esto lo podremos comprobar con los resultados experimentales incluidos al final de esta capítulo.

Anterior   I  Siguiente   I  Índice capítulo 5   I  Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001