ISSN: 1139-8736 Depósito Legal: B-8714-2001 |
5.3.2.5 Umbrales basados en el Parámetro de la Trama Anterior
El cálculo del umbral de recorte a aplicar sobre todos los estados del espacio de búsqueda en cada trama supone un incremento del coste computacional. Este incremento se deriva, fundamentalmente, del hecho de no poder aplicar el umbral hacia delante, mientras se procesa el espacio de búsqueda activo en cada trama.
Normalmente, se calcula primero el parámetro (la distancia menor del espacio de búsqueda activo) de una trama y luego se calcula el umbral de recorte, sumando la constante elegida al parámetro. Entonces es necesario recorrer de nuevo el espacio de búsqueda activo para eliminar aquellos estados que no superen el umbral. Los recorridos de las estructuras de datos que almacenan la información de los estados del espacio de búsqueda activo puede no ser desdeñable comparada con el propio proceso de reconocimiento, compensando negativamente la reducción del coste computacional conseguida con el recorte mediante el umbral.
Se ha mencionado en algunas ocasiones que el umbral calculado puede estar basado en la suma de una constante de recorte al parámetro calculado en la trama anterior a la que se está procesando. Ello, como veremos a continuación, sólo supone aumentar el margen a sumar a la distancia local del estado de menor distancia en cada trama, sin que suponga un aumento considerable del número de estados activos a procesar. Sin embargo, en nuestra opinión, no se ha realizado un esfuerzo suficiente en el análisis de esta posibilidad en la comunidad científica, desconociendo si el incremento del valor del umbral de recorte compensará la parte del proceso eliminada. De este modo podemos intentar reducir cálculos sin degradación de la calidad del sistema y validando el método que hemos desarrollado.
Las constantes calculados para distintos factores de conservación, utilizando modelos discretos de Markov sin gramática (peor calidad) y utilizando gramática con modelos semicontinuos de Markov de 3 codebooks (mejor calidad), se incluyen a continuación.
Sin gramática y peores modelos de Markov
D2, NG, D-S PROMEDIO
Trama Anterior
Espacio Tot:
31374 est.ANCHO DEL HAZ CONSTANTE
Distancia a sumar a la Distancia Mínima (Margen)2 Umbrales 1 Umbral Factor de Conservación Resto Estados Últimos Estados Todos los
Estados100.0 % 300000 300000 300000 99.99 % 261750 168825 258900 99.90 % 218625 142725 216225 99.70 % 200475 121725 198450 99.50 % 191325 113925 188775 99.40 % 187650 110625 185175 99.30 % 184650 107925 182025 99.20 % 181950 106350 179400 99.10 % 179625 104925 176700 99.00 % 177300 103125 173925 98.50 % 166950 95550 163800 98.30 % 164475 93150 160725 98.00 % 159750 89925 156825 97.50 % 154350 85050 151200 Tabla. 5.14 Umbrales Promedio para la estrategia de recorte implementada (Ancho del Haz Constante), con un sólo umbral o dos umbrales de recorte, basándonos en el parámetro calculado en la trama anterior (Locutores: ENR, FER, LEA, ROM - Modelos D2 de Markov - Sin gramática - Diccionario D-S). Los umbrales han sido calculados utilizando los datos de evaluación.
Con gramática y mejores modelos de Markov
S3V, GR160S-J
PROMEDIOTrama Anterior
Espacio Tot:
44142 est.ANCHO DEL HAZ CONSTANTE
Distancia a sumar a la Distancia Mínima (Margen)2 Umbrales 1 Umbral Factor de Conservación Resto Estados Últimos Estados Todos los
Estados100.0 % 300000 300000 300000 99.99 % 292200 217875 296700 99.90 % 277575 192225 273150 99.70 % 230850 189550 227700 99.50 % 214275 154050 211125 99.40 % 207825 149325 205350 99.30 % 203475 146250 201075 99.20 % 199725 143775 198000 99.10 % 195900 142050 193725 99.00 % 193275 139425 190575 98.50 % 181500 129450 179100 98.30 % 178050 126900 175125 98.00 % 172950 123600 170250 97.50 % 166125 118425 163350 Tabla 5.15 Umbrales Promedio para la estrategia de recorte implementada (Ancho del Haz Constante), con un sólo umbral o dos umbrales de recorte, basándonos en el parámetro calculado en la trama anterior (Locutores: ENR, FER, LEA, ROM - Modelos S3V de Markov - Gramática MC160-S - Diccionario D160-J). ). Los umbrales han sido calculados utilizando los datos de evaluación.
Para entender mejor el efecto del uso del parámetro de la trama anterior en el cálculo de la constante de recorte (y por tanto, el umbral), comparado con el del parámetro calculado en la trama actual, se incluye la figura 5.15. En ella puede observarse como el valor de la constante, para un mismo factor de conservación, aumenta cuando se utiliza el parámetro calculado en la trama anterior. Sin embargo, independientemente de la calidad del sistema, cuando el factor de conservación es elevado, el incremento del número de estados del espacio de búsqueda a procesar al aumentar el umbral del recorte parece no ser demasiado elevado.
Lo más relevante es que, en cualquier caso, los umbrales que se calcularán con los parámetros de la trama anterior vuelven a ser conservadores, es decir, en el peor de los casos supondrán una reducción de la eficacia del proceso de recorte pero nunca una degradación de la Tasa de Acierto de Palabras (WA). Por ello, creemos interesante considerar esta posibilidad al aplicar esta técnica de poda o recorte en el futuro.
Fig. 5.15 Evolución del valor de las constantes de recorte calculadas para distintos factores de conservación para los histogramas calculados con los datos de evaluación para dos sistemas de calidad diferente. Uno de ellos utiliza gramática (GR160S-J) y modelos semicontinuos de 3 codebooks (S3V) y el otro utilkiza sólo modelos discretos de 2 codebooks (D2). Se representan las curvas de evolución de la constante de recorte cuando se utiliza un parámetro calculado en la trama anterior y en la trama actual.
Anterior I Siguiente I Índice capítulo 5 I Índice General
ISSN: 1139-8736 Depósito Legal: B-8714-2001 |