ISSN: 1139-8736
Depósito Legal: B-8714-2001

2.4 Definición de una Arquitectura para la Integración

Como ya se ha comentado, el problema de la comprensión de habla no es un problema resuelto. Existen distintas soluciones para problemas muy específicos que se enmarcan en dominios semánticos restringidos, donde el vocabulario, la sintaxis y el significado de las frases se ven limitados por el propio dominio que se modela. Para realizar un análisis y una valoración de las soluciones aportadas por distintos grupos de investigación se hace necesario definir un marco donde poder clasificar los distintos sistemas desarrollados.

Fig. 2.1 Arquitectura General de un Sistema de Comprensión de Habla

Para poder establecer ese marco se necesita definir una arquitectura o modelo donde aparezcan, desde un punto de vista general, los procesos y la información que entran en juego en la comprensión del mensaje hablado, analizando las distintas alternativas (teorías, modelos, herramientas, etc.) que se conocen y utilizan para cada  uno de ellos (tipos de gramáticas, estructuras de datos, algoritmos de análisis, etc.). De este modo, se tendrán los elementos necesarios para poder establecer una clasificación y valorar los pros y contras de cada solución.

Sin embargo, establecer esa arquitectura general, donde se puedan describir los procesos y la información que entran en juego, desde un punto de vista formal, no es tarea sencilla, sobre todo si después se intenta clasificar el conjunto de sistemas implementados en la actualidad en base a la misma.

La figura 2.1 muestra un diagrama de bloques de la arquitectura de un sistema de comprensión de habla que va a ser utilizada en esta tesis, en la que se encuentran definidos los procesos y la información que antes se comentaron. En ella se contemplan dos ramas, la superior, la de comprensión del mensaje hablado de entrada, y otra inferior, la de generación de una respuesta hablada de salida.

Aunque la arquitectura presentada parece responder a una estrategia de abajo-a-arriba (bottom-up) en lo que a comprensión del mensaje hablado se refiere (sin incluir la generación de respuesta), esto es sólo desde el punto de vista de los procesos que tienen lugar pero no implica que estos procesos deban producirse secuencialmente de forma obligada, sino que algunos de ellos pueden producirse simultáneamente, dando lugar a distintos grados de integración de la arquitectura, acercándose a una estrategia de arriba-a-abajo (top-down). Cada una de las estrategias tiene sus ventajas y sus inconvenientes, además no todos los procesos que tienen lugar en el proceso de comprensión pueden ser integrados debido, fundamentalmente, a la distinta naturaleza de los paradigmas utilizados en los mismos como se verá más adelante. Por tanto, el investigador encargado de diseñar e implementar una solución al problema, deberá jugar con las distintas posibilidades y decidir cómo llevar a cabo cada uno de los procesos, lo que da lugar a distintas arquitecturas con un mayor o menor nivel de integración, con ventajas e inconvenientes que definen la bondad de la mismas.

A continuación, describiremos cada uno de los procesos que tienen lugar en la comprensión del mensaje hablado, destacando el conjunto de posibilidades existentes en la actualidad para abordar cada uno de ellos, con sus ventajas e inconvenientes. De este modo, podremos clasificar los distintos sistemas que existen en la actualidad, conociendo mejor el estado de la cuestión y situando con mayor precisión la solución (arquitectura) que se ha propuesto en este trabajo de tesis, es decir, valorando los distintos aspectos de la misma en comparación con las otras soluciones ya existentes. Además, será más fácil justificar los problemas que se han abordado y las soluciones que se han alcanzado, y que se analizarán en los restantes capítulos de este trabajo.

Anterior   I  Siguiente   I  Índice capítulo 2   I   Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001