ISSN: 1139-8736
Depósito Legal: B-8714-2001

5.4.2 Evaluación de las N Mejores Salidas (Recuperación de Errores)

5.4.2.1 Modificación del Algoritmo de Evaluación

En el Capítulo 2 , cuando se trató la evaluación de un sistema de reconocimiento de habla, vimos que el algoritmo más utilizado para ello era un algoritmo de Programación Dinámica que comparaba 2 cadenas de símbolos (cada símbolo puede ser una palabra de la frase), una de referencia y otra de test, encontrando el mejor alineamiento entre ambas, es decir, aquél que produce una menor distancia entre ellas. Para el cálculo de la distancia se utilizan un conjunto de penalizaciones para las inserciones, los borrados y las sustituciones. Este es el algoritmo que nosotros hemos utilizado para medir la calidad acústica de los sistema de reconocimiento desarrollados, pero sólo en el caso de la generación de una sola hipótesis de salida.

Para poder evaluar las N frases de salida del reconocedor, es necesario llevar a cabo una modificación en el algoritmo de evaluación (alineamiento de la frase de referencia con la hipótesis de salida) para considerar las N hipótesis obtenidas. Para ello, nos hemos basado en el criterio de encontrar aquella hipótesis con menor número de errores (la de menor distancia de alineamiento) y considerarla como si hubiese sido la única hipótesis de salida. Este criterio es muy conservador y cabría pensar que si utilizásemos la información obtenida con todas las hipótesis sería posible obtener mejores tasas de evaluación. Sin embargo, habría que generar un grafo no determinista, que recogiese toda esta información, y pudiese generar más hipótesis de las reconocidas, aunque algunas de ellas no fuesen correctas desde el punto de vista gramatical (en caso de utilizar una gramática). Para ello habría que procesar a posteriori las N hipótesis, considerando la información de las tramas de transición entre las palabras para encontrar solapamientos en el eje temporal, o bien diseñar un algoritmo de decodificación acústica que genere ese grafo de forma más adecuada, más directa.

Anterior   I  Siguiente   I  Índice capítulo 5   I  Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001