ISSN: 1139-8736
Depósito Legal: B-8714-2001

2.4.1.7 Interacción del Sistema de Reconocimiento y el Sistema de Comprensión

Un sistema de reconocimiento de habla se podría comunicar de varias formas diferentes con un sistema de procesamiento de lenguaje natural. Quizá el modo más sencillo es mediante un esquema serie. De este modo, la frase hablada entra en el sistema de reconocimiento que, utilizando sólo información acústica básicamente, produce la mejor hipótesis de salida como secuencia de palabras reconocida asociada al habla de entrada. Esta salida es la entrada al sistema de comprensión de lenguaje natural, que utiliza sólo información textual básicamente. No existe ninguna realimentación según este esquema, es decir, el sistema de reconocimiento no tiene acceso a información sintáctica, semántica, etc a la hora de generar su hipótesis de salida (frase reconocida), y el sistema de comprensión del lenguaje natural no tiene acceso, por ejemplo, a información prosódica (útil para desambigüación). Este esquema tiene, sin embargo, sus ventajas: la necesidad de una mínima interacción entre grupos de especialistas en procesamiento del habla y de especialistas en procesamiento del lenguaje natural, la facilidad para integrar ambos sistemas para dar lugar al sistema de comprensión de habla. A pesar de estas ventajas, el esquema serie es subóptimo al no aprovechar toda la información disponible en el proceso. Una frase que es reconocida con errores puede tener escasas posibilidades de ser interpretada (comprendida) adecuadamente. Se sabe que una persona utiliza una buena cantidad de conocimiento lingüístico (sintáctico, semántico, etc) cuando interpreta lo que otra persona le está diciendo. Por ello, un sistema de comprensión de habla debería tomar ventaja de esa misma información para llevar a cabo su tarea. Existen modificaciones al esquema serie que incluyen el envío de una celosía (lattice) grande de palabras obtenida en el proceso de reconocimiento del habla, un grafo de palabras o bien una lista con las mejores frases. Con ello se pretende fundamentalmente aumentar la calidad de la información enviada al sistema de comprensión del lenguaje natural, intentando que, a pesar de los errores cometidos por el sistema de reconocimiento del habla, las palabras con contenido sintáctico y semántico necesarias para la buena interpretación de la frase hablada se encuentren en la entrada del segundo sistema. En el fondo no disminuye el número de errores del sistema de reconocimiento pero, con la modificación adecuada de los subsistemas de análisis sintáctico y semántico del sistema de comprensión para analizar esas estructuras de datos (celosía, grafo o lista), es posible encontrar la solución correcta. Arquitecturas de este tipo han sido exploradas [PRI90]. Sin embargo, arquitecturas que sigan esquemas con un mayor grado de acoplamiento parecen ser necesarias para alcanzar un mejor funcionamiento de los sistemas.

Anterior   I  Siguiente   I  Índice capítulo 2   I   Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001