ISSN: 1139-8736
Depósito Legal: B-8714-2001

6.1.1 Introducción

Dado un grafo semántico de entrada, el Segmentador Conceptual, produce una secuencia de conceptos de salida, asociada a la frase de lenguaje natural de entrada, junto con las marcas del comienzo y fin de cada concepto. Es decir, no sólo indica el significado de la frase de entrada en base a los conceptos encontrados en la misma, sino que agrupa todas los pares palabra-categoría que pertenecen a cada uno de los conceptos. Esta información suele ser suficiente para poder comprender y traducir las frases de lenguaje natural asociadas a dominios semánticos restringidos, a un conjunto de órdenes, a un lenguaje semántico intermedio, a un lenguaje de acceso a bases de datos como SQL, etc. Debemos tener en cuenta que el conjunto de conceptos seleccionados representa una parte importante del conocimiento asociado a nuestro dominio del mundo que hemos modelado. Cada concepto es una estructura de información que contiene las palabras de la frase de entrada, con su significado en base a su categoría semántica asociada, y el orden de la misma en el segmento que constituye el propio concepto.

En base a una gramática regular probabilística, implementada como un autómata finito probabilístico, cuyos estados son las categorías semánticas definidas en el dominio de la aplicación (cada palabra puede tener una o varias categorías semánticas asociadas, de este modo asignamos uno o varios significados a la misma), y un algoritmo de programación dinámica (algoritmo de Un Paso) con capacidad para moverse por el espacio de estados constituido por el autómata, el decodificador conceptual produce la segmentación y etiquetado automático del grafo de entrada.

  Es importante observar que para la generación de una gramática regular en base a un autómata finito existen algoritmos de inferencia a partir de valores etiquetados, y que además, son fácilmente integrables en los algoritmos de programación dinámica utilizados.

La lista de conceptos seleccionados del corpus de entrenamiento se puede encontrar en el Apéndice 6.1. En el Capítulo 3 se ha incluido el diagrama E-R de la aplicación, y la ontología de la misma, es decir, el conjunto de conceptos definidos en la misma.

En la siguiente figura se observa el diagrama de bloques con los módulos y datos que participan en el proceso de segmentación.

Fig. 6.1 Diagrama de bloques del Módulo de Segmentación Conceptual, y su posición relativa dentro de la arquitectura del Sistema de Comprensión implementado.

El Segmentador Conceptual recibe una entrada o consulta en LN con posibles errores (salida del Decodificador Acústico), y la segmenta conceptualmente (descompone la consulta en una serie de conceptos del dominio de aplicación y asigna a cada concepto un conjunto de pares palabra-categoría semántica).

Anterior   I  Siguiente   I  Índice capítulo 6   I  Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001