ISSN: 1139-8736
Depósito Legal: B-8714-2001

3.6 Las Categorías Semánticas de la Aplicación

La función de las categorías semánticas es no hacer depender la gramática de las palabras utilizadas para expresar las consultas en lenguaje natural, es decir, independizar, en cierta medida el léxico de los modelos gramaticales utilizados para la comprensión. Con ello reducimos la necesidad de muchos datos para entrenar las gramáticas, facilitamos la incorporación de nuevos términos del castellano que sirven para expresar una misma idea, reducimos la perplejidad de las gramáticas al mismo tiempo que aumentamos la cobertura. Las categorías utilizadas podrían definirse como semánticas más que sintácticas, estando directamente relacionadas con la ontología de la aplicación. Además,

El diccionario de categorías sintáctico-semánticas pretende asociar a cada posible palabra del lenguaje natural de entrada, un significado, es decir, un conjunto de rasgos semánticos implícitos en la definición de su categoría. Pueden existir distintas palabras del lenguaje natural asociadas a una misma categoría o clase de equivalencia semántica. Este mecanismo nos permite no tratar directamente, durante el proceso de comprensión con las palabras de la frase de entrada, sino con las clases semánticas a las que pertenecen. Además, problemas de cobertura a nivel de lengua natural, es decir, no inclusión en el diccionario de algunos términos, puede ser solucionado fácilmente, sin más que incluir las nuevas entradas y categorizándolas adecuadamente. Si el conjunto de categorías perteneciente al Modelo del Dominio está bien determinado, no será necesario realizar ningún cambio en el resto del sistema.

Las categorías seleccionadas, a partir del corpus de entrenamiento utilizado, pueden encontrarse en el Apéndice 5.5. Algunas entradas en el diccionario (palabras) pueden tener asociadas varias categorías semánticas, lo que plantea un primer problema: la ambigüedad semántica. En el Capítulo 6 se observa el porcentaje de categorías ambiguas y su índice o nivel de ambigüedad.

Este primer problema ha sido solucionado, construyendo un grafo de categorías semánticas asociado a la frase de entrada (lenguaje natural), en el que el número de ramas en cada punto del grafo depende de dicha ambigüedad. A mayor ambigüedad, mayor será el grafo, es decir, mayor perplejidad presentará y mayor probabilidad de error tendrá el decodificador conceptual al segmentar la frase.

Anterior   I  Siguiente   I  Índice capítulo 3   I   Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001