ISSN: 1139-8736 Depósito Legal: B-8714-2001 |
5.3.2.4 Influencia de la Gramática y del Modelado Acústico en el Umbral de Recorte
Como comentamos anteriormente, nos interesa estudiar el comportamiento del espacio de búsqueda cuando se mejoran las condiciones del sistema de reconocimiento. Es decir, cómo influye la calidad del Módulo Acústico en la determinación de los umbrales de recorte y la eficacia de los mismos.
Para realizar este estudio utilizamos la versión del sistema de reconocimiento que emplea la gramática GR160S-J, y los modelos semicontinuos de Markov de 3 codebooks (S3V). Los histogramas son calculados con los datos de evaluación pues ya conocemos su relación con los histogramas calculados con los datos de entrenamiento y nos permite reducir el tiempo necesario para realizar la experimentación.
S3V, GR160S-J
PROMEDIO
Trama Actual
Espacio Tot:
44142 est.ANCHO DEL HAZ CONSTANTE
Distancia a sumar a la Distancia Mínima (Margen)2 Umbrales 1 Umbral Factor de Conservación Resto Estados Últimos Estados Todos los
Estados100.0 % 300000 300000 300000 99.99 % 264075 169875 264075 99.90 % 205950 134775 202725 99.70 % 169800 104700 166950 99.50 % 155550 95850 153375 99.40 % 150900 91800 148425 99.30 % 145950 88425 144075 99.20 % 142425 86175 140100 99.10 % 139800 83850 137925 99.00 % 137700 82125 135150 98.50 % 126150 74475 123675 98.30 % 122850 72450 119550 98.00 % 116850 67725 113775 97.50 % 109650 60975 106950 Tabla 5.13 Umbrales Promedio para la estrategia de recorte implementada (Ancho de Haz Constante), con un sólo umbral o dos umbrales de recorte (Locutores: ENR, FER, LEA, ROM - Modelos S3V de Markov). Los umbrales han sido calculados utilizando los datos de evaluación.
Utilizando las tablas 5.12 y 5.13 representamos las curvas de la figura 5.14. En ella podemos observar la evolución de las constantes para distintos factores de conservación cuando varía la calidad del módulo de reconocimiento (incluimos gramática y un mejor modelado acústico).
Fig. 5.14 Evolución del valor de las constantes de recorte calculadas para distintos factores de conservación para los histogramas calculados con los datos de evaluación para dos sistemas de calidad diferente. Uno de ellos utiliza gramática (GR160S-J) y modelos semicontinuos de 3 codebooks (S3V) y el otro utilkiza sólo modelos discretos de 2 codebooks (D2).
En la figura 5.14 se puede observar cómo la constante de recorte, y por tanto, el umbral de recorte, para un mismo factor de conservación es menor en el caso de utilizador un sistema de reconocimiento de mayor calidad (gramática y mejores modelos HMM). Ese umbral de recorte menor supondrá una mayor reducción del coste computacional en el sistema si suponemos que el hecho de tener un mismo factor de conservación supone Tasas de Acierto de Palabras (WA) similares. Esto lo podremos comprobar con los resultados experimentales incluidos al final de esta capítulo.
Anterior I Siguiente I Índice capítulo 5 I Índice General
ISSN: 1139-8736 Depósito Legal: B-8714-2001 |