ISSN: 1139-8736
Depósito Legal: B-8714-2001

6.1.6 Ambigüedad Semántica. Grafo de Pares Palabra-Categoría

El diccionario de categorías sintáctico-semánticas pretende asociar a cada posible palabra del lenguaje natural de entrada, un significado, es decir, un conjunto de rasgos semánticos implícitos en la definición de su categoría. Pueden existir distintas palabras del lenguaje natural asociadas a una misma categoría o clase de equivalencia semántica. Este mecanismo nos permite no tratar directamente, durante el proceso de comprensión con las palabras de la frase de entrada, sino con las clases semánticas a las que pertenecen. Además, problemas de cobertura a nivel de lengua natural, es decir, no inclusión en el diccionario de algunos términos, puede ser solucionado fácilmente, sin más que incluir las nuevas entradas y categorizándolas adecuadamente. Si el conjunto de categorías perteneciente al  Modelo del Dominio está bien determinado, no será necesario realizar ningún cambio en el resto del sistema.

Las categorías seleccionadas, a partir del corpus de entrenamiento utilizado, pueden encontrarse en el Apéndice 6.2. Cada categoría determina el posible significado de una palabra, pudiendo existir varias palabras asociadas a una misma categoría, lo que confiere una cierta flexibilidad al sistema ya que resulta sencillo aumentar las posibles formas (palabras) de  expresar un significado sin más que incluir esa palabra en el diccionario categorizado.

Algunas palabras pueden tener asociadas varias categorías, lo que plantea un primer problema: la ambigüedad semántica. En la figura 6.4 se observa el porcentaje de palabras ambiguas y su índice o nivel de ambigüedad. El diccionario categorizado tiene 784 entradas (palabras).

Categorías/Entradas Nº Entradas del Diccionario (%)
1 736 (93.87%)
2 42 (5.35%)
3 6 (0.76%)

Fig. 6.4. Distribución del número de categorías asignadas al conjunto de entradas (palabras) del diccionario de la aplicación.

Este primer problema ha sido solucionado, construyendo un grafo de categorías semánticas asociado a la frase de entrada (lenguaje natural), en el que el número de ramas en cada punto del grafo depende de dicha ambigüedad. A mayor ambigüedad, mayor será el grafo, es decir, mayor perplejidad presentará y mayor probabilidad de error tendrá el decodificador conceptual al segmentar la frase.

Anterior   I  Siguiente   I  Índice capítulo 6   I  Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001