ISSN: 1139-8736
Depósito Legal: B-8714-2001

5.3.3.2 Generando un Grafo con las N Mejores Hipótesis

La modificación del algoritmo de decodificación acústica o reconocimiento de habla básico para la obtención de N hipótesis de salida (N frases diferentes), la hipótesis óptima y N-1 subóptimas, nos obliga a plantearnos cómo utilizar toda esa información de salida, principalmente cuando forma parte de un sistema más amplio como en nuestro caso es el Sistema de Comprensión. Debemos tener en cuenta que la frase correcta puede seguir sin aparecer entre las N hipótesis obtenidas pero puede que algunos errores hayan sido corregidos, consiguiendo como luego veremos en la evaluación mejores tasas de acierto de palabras comparadas con las del sistema básico que genera una sola hipótesis.

Un modo elegante de compilar la información de salida (las N frases) es compilarlas en forma de grafo determinista (aquél que sólo es capaz de generar las N frases con las que ha sido generado o entrenado). De este modo, modificando el algoritmo de segmentación conceptual (algoritmo de Un Paso modificado para reconocer secuencias textuales de palabras) para que sea capaz de procesar un grafo de palabras categorizadas de entrada en lugar de una simple cadena de palabras (frase), podemos permitir que sea el algoritmo de reconocimiento quién decida qué hipótesis es la más probable o de menor distancia, sin necesidad de ejecutar el mismo proceso N veces, una por cada hipótesis de salida. Además, la posibilidad de procesar un grafo determinista de entrada podría ser útil cuando seamos capaces de generar grafos no deterministas, con capacidad para generar más hipótesis que aquellas con las que ha sido entrenado o generado (más potente pero con más posibilidad de error, pues no tienen por qué cumplir las restricciones gramaticales como ocurre en el caso del grafo determinista, a no ser que las tengamos en cuenta a la hora de generarlo).

Veamos un ejemplo real obtenido con el sistema de reconocimiento desarrollado dentro del marco de este trabajo, para una frase del conjunto de evaluación, con cuatro hipótesis de salida.

[Frase: ST0001]

¡ es-1 la-1 hora-1 estimada-1 de-1 llegada-1 del-2 barbero-2 posterior-1 a-1 las-1 ochocientas-1 horas-1 zul’u-1 _ !
¡ es-1 la-1 hora-1 estimada-1 de-1 llegada-1 del-2 barbero-2 posterior-1 ‘areas-1 ochocientas-1 horas-1 zul’u-1 _ !
¡ es-1 la-1 hora-1 estimada-1 de-1 llegada-1 del-2 barbero-2 posterior-1 ha-1 las-1 ochocientas-1 horas-1 zul’u-1 _ !
¡ le-1 si-2 ahora-1 estimada-1 de-1 llegada-1 del-2 barbero-2 posterior-1 a-1 las-1 ochocientas-1 horas-1 zul’u-1 _ !

Fig. 5.16 Ejemplo de frase reconocida con 4 hipótesis de salida en el que se observan las diferencias entre cada uno de los caminos o hipótesis. Se ha utilizado un diccionario con múltiples pronunciaciones, y 3 modelos de silencio acústico (¡, !, _).

A continuación podemos ver el grafo generado con las cuatro hipótesis del ejemplo anterior. Es un grafo determinista, es decir, puede generar solamente a las hipótesis utilizadas para su generación o entrenamiento.

Fig. 5.17 Grafo asociado a la frase ejemplo de la figura 5.16

Anterior   I  Siguiente   I  Índice capítulo 5   I  Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001