ISSN: 1139-8736
Depósito Legal: B-8714-2001

5.3.2.5 Umbrales basados en el Parámetro de la Trama Anterior

El cálculo del umbral de recorte a aplicar sobre todos los estados del espacio de búsqueda en cada trama supone un incremento del coste computacional. Este incremento se deriva, fundamentalmente, del hecho de no poder aplicar el umbral hacia delante, mientras se procesa el espacio de búsqueda activo en cada trama.

Normalmente, se calcula primero el parámetro (la distancia menor del espacio de búsqueda activo) de una trama y luego se calcula el umbral de recorte, sumando la constante elegida al parámetro. Entonces es necesario recorrer de nuevo el espacio de búsqueda activo para eliminar aquellos estados que no superen el umbral. Los recorridos de las estructuras de datos que almacenan la información de los estados del espacio de búsqueda activo puede no ser desdeñable comparada con el propio proceso de reconocimiento, compensando negativamente la reducción del coste computacional conseguida con el recorte mediante el umbral.

Se ha mencionado en algunas ocasiones que el umbral calculado puede estar basado en la suma de una constante de recorte al parámetro calculado en la trama anterior a la que se está procesando. Ello, como veremos a continuación, sólo supone aumentar el margen a sumar a la distancia local del estado de menor distancia en cada trama, sin que suponga un aumento considerable del número de estados activos a procesar. Sin embargo, en nuestra opinión, no se ha realizado un esfuerzo suficiente en el análisis de esta posibilidad en la comunidad científica, desconociendo si el incremento del valor del umbral de recorte compensará la parte del proceso eliminada. De este modo podemos intentar reducir cálculos sin degradación de la calidad del sistema y validando el método que hemos desarrollado.

Las constantes calculados para distintos factores de conservación, utilizando modelos discretos de Markov sin gramática (peor calidad) y utilizando gramática con modelos semicontinuos de Markov de 3 codebooks (mejor calidad), se incluyen a continuación.

Sin gramática y peores modelos de Markov

D2, NG, D-S PROMEDIO
Trama Anterior
Espacio Tot:
31374 est.
ANCHO DEL HAZ CONSTANTE
Distancia a sumar a la Distancia Mínima (Margen)
2 Umbrales 1 Umbral
Factor de Conservación Resto Estados Últimos Estados Todos los
Estados
100.0 % 300000 300000 300000
99.99 % 261750 168825 258900
99.90 % 218625 142725 216225
99.70 % 200475 121725 198450
99.50 % 191325 113925 188775
99.40 % 187650 110625 185175
99.30 % 184650 107925 182025
99.20 % 181950 106350 179400
99.10 % 179625 104925 176700
99.00 % 177300 103125 173925
98.50 % 166950 95550 163800
98.30 % 164475 93150 160725
98.00 % 159750 89925 156825
97.50 % 154350 85050 151200

Tabla. 5.14 Umbrales Promedio para la estrategia de recorte implementada (Ancho del Haz Constante), con un sólo umbral o dos umbrales de recorte, basándonos en el parámetro calculado en la trama anterior (Locutores: ENR, FER, LEA, ROM - Modelos D2 de Markov - Sin gramática - Diccionario D-S). Los umbrales han sido calculados utilizando los datos de evaluación.

Con gramática y mejores modelos de Markov

S3V, GR160S-J
PROMEDIOTrama Anterior
Espacio Tot:
44142 est.
ANCHO DEL HAZ CONSTANTE
Distancia a sumar a la Distancia Mínima (Margen)
2 Umbrales 1 Umbral
Factor de Conservación Resto Estados Últimos Estados Todos los
Estados
100.0 % 300000 300000 300000
99.99 % 292200 217875 296700
99.90 % 277575 192225 273150
99.70 % 230850 189550 227700
99.50 % 214275 154050 211125
99.40 % 207825 149325 205350
99.30 % 203475 146250 201075
99.20 % 199725 143775 198000
99.10 % 195900 142050 193725
99.00 % 193275 139425 190575
98.50 % 181500 129450 179100
98.30 % 178050 126900 175125
98.00 % 172950 123600 170250
97.50 % 166125 118425 163350

Tabla 5.15 Umbrales Promedio para la estrategia de recorte implementada (Ancho del Haz Constante), con un sólo umbral o dos umbrales de recorte, basándonos en el parámetro calculado en la trama anterior (Locutores: ENR, FER, LEA, ROM - Modelos S3V de Markov - Gramática MC160-S - Diccionario D160-J). ). Los umbrales han sido calculados utilizando los datos de evaluación.

Para entender mejor el efecto del uso del parámetro de la trama anterior en el cálculo de la constante de recorte (y por tanto, el umbral), comparado con el del parámetro calculado en la trama actual, se incluye la figura 5.15. En ella puede observarse como el valor de la constante, para un mismo factor de conservación, aumenta cuando se utiliza el parámetro calculado en la trama anterior. Sin embargo, independientemente de la calidad del sistema, cuando el factor de conservación es elevado, el incremento del número de estados del espacio de búsqueda a procesar al aumentar el umbral del recorte parece no ser demasiado elevado.

Lo más relevante es que, en cualquier caso, los umbrales que se calcularán con los parámetros de la trama anterior vuelven a ser conservadores, es decir, en el peor de los casos supondrán una reducción de la eficacia del proceso de recorte pero nunca una degradación de la Tasa de Acierto de Palabras (WA). Por ello, creemos interesante considerar esta posibilidad al aplicar esta técnica de poda o recorte en el futuro.

Fig. 5.15 Evolución del valor de las constantes de recorte calculadas para distintos factores de conservación para los histogramas calculados con los datos de evaluación para dos sistemas de calidad diferente. Uno de ellos utiliza gramática (GR160S-J) y modelos semicontinuos de 3 codebooks (S3V) y el otro utilkiza sólo modelos discretos de 2 codebooks (D2). Se representan las curvas de evolución de la constante de recorte cuando se utiliza un parámetro calculado en la trama anterior y en la trama actual.

Anterior   I  Siguiente   I  Índice capítulo 5   I  Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001