ISSN: 1139-8736 Depósito Legal: B-8714-2001 |
5.3.2.2 Estudio del Espacio de Búsqueda: Distribución de las Distancias de los Estados del Espacio
En las gráficas 5.9 y 5.10 se pudo observar cómo las distancias acumuladas para los estados del espacio de búsqueda varían dentro de una márgenes bastante amplios a lo largo de una frase. Además, los estados del camino óptimo de esa frase parecen tener distancias acumuladas muy cercanas a la distancia menor en cada trama. Ese hecho, como comentamos anteriormente, parece justificar el planteamiento de la existencia de un umbral de recorte que no elimine los estados del camino óptimo en cada trama pero que, por el contrario, sí elimine el mayor número posible del resto de los estados del espacio de búsqueda.
Sin embargo, cuando se fija un valor para el umbral de recorte no puede considerarse únicamente una frase del corpus de entrenamiento utilizado sino que hay que considerar todo el corpus. De ese modo, el umbral de recorte debe considerar la dispersión de los valores de distancia acumulada para todos los estados del espacio de búsqueda de todas esas frases.
Hasta el momento, en la mayoría de los casos en los que se ha utilizado esta técnica de recorte, el proceso de determinación del mejor valor para el umbral se ha basado en la realización de múltiples experimentos. En ellos se varía el umbral de recorte y se calcula la Tasa de Acierto de Palabras (WA) para las frases del corpus, buscando un punto razonable en la curva del Tamaño del Espacio de Estados Activo vs. Tasa de Aciertos de Palabras (WA). Este método de determinación del umbral de recorte no analiza la dispersión real de las distancias de los estados de los espacios de búsqueda de todas las frases de entrenamiento, no utiliza ninguna información de apoyo sobre la naturaleza del propio espacio de búsqueda.
Lógicamente, el número de experimentos que habría que realizar para estar seguros de la elección correcta y de la validez de la misma para nuevos conjuntos de datos (nuevas frases), sería demasiado elevado.
En nuestra opinión, sería interesante estudiar cómo son los espacios de búsqueda de todas las frases del corpus de entrenamiento. Viendo las dispersiones de las distancias acumuladas para ese gran conjunto de datos (estados) e intentando obtener conclusiones gracias a los mismos. De ese modo, podría plantearse algún procedimiento para la determinación del umbral de recorte sabiendo exactamente cómo se va a comportar, en media, cuando lo enfrentemos a distintos conjuntos de datos. Además, en función de la calidad del sistema de reconocimiento (de los modelos HMM, de la gramática utilizada, etc.) podrían determinarse los límites para dicho umbral de recorte y por tanto, los límites para la reducción efectiva del coste computacional en el sistema. Debe tenerse en cuenta que en los sistemas de baja calidad, la dispersión media de las distancias acumuladas para los estados del espacio de búsqueda será mayor, y por tanto, más difícil de encontrar un umbral que recorte principalmente aquellos estados que no pertenezcan a los caminos óptimos de las frases a procesar.
Para poder entender las bases del funcionamiento de las técnicas de recorte o reducción del espacio de búsqueda, cuando se emplean técnicas basadas en programación dinámica, se ha realizado un estudio de la distribución de las distancias de cada uno de los estados que conforman el espacio de búsqueda para un caso determinado. Para ello se ha calculado un histograma de estados, agrupando los estados del espacio de búsqueda de acuerdo con la distancia local acumulada de cada uno de ellos y la distancia local del mejor estado de cada trama. Sólo queda encontrar la relación entre el umbral de distancias a aplicar y el histograma de análisis calculado, para conseguir reducir el espacio de búsqueda sin afectar significativamente el funcionamiento del sistema.
La hipótesis de partida es que un algoritmo de programación dinámica encuentra la solución óptima siempre que pueda procesar el espacio formado por aquellos estados que pertenecen al camino óptimo encontrado al final del proceso de búsqueda y que se desconoce, lógicamente, a priori. Cualquier técnica de recorte supone una pérdida potencial de estados óptimos a procesar y por tanto, la solución encontrada no siempre podrá ser la óptima. De ese modo, se dice que al aplicar una técnica de recorte o poda de estados estamos forzando al algoritmo de búsqueda a encontrar una solución subóptima.
Sin embargo, cabría preguntarse si esas soluciones no óptimas a nivel de estado repercuten significativamente en lo que sería la solución óptima a nivel de secuencia de palabras encontradas (si son las palabras las unidades principales de la búsqueda). Parece interesante, por tanto, plantear la necesidad de poder encontrar una cierta correlación entre el recorte al que se ha sometido a un determinado espacio de búsqueda y la degradación de la tasa de aciertos de palabra que se produce como consecuencia de ello, en base a un determinado factor de conservación de estados pertenecientes al camino óptimo de búsqueda de una frase.
Anterior I Siguiente I Índice capítulo 5 I Índice General
ISSN: 1139-8736 Depósito Legal: B-8714-2001 |