ISSN: 1139-8736
Depósito Legal: B-8714-2001

6.3.4 Clasificación Estructural de las Frases de Entrenamiento

Clasificación de las frases del corpus de entrenamiento.

Previamente al desarrollo de la gramática, se efectúa un análisis de las frases segmentadas (a nivel de concepto) del corpus de entrenamiento, para determinar la taxonomía necesaria (las clases de conceptos), y las posibles interrelaciones entre ellos. En nuestro corpus de entrenamiento nosotros encontramos los siguientes tipos o estructuras:

[Tipo A - Frases Simples]

QT [ V QS ]
QT [ QS ]

Este tipo de frases incluyen dos subtipos básicos:

[Tipo B - Frases Comparativas]

QT [ V QC [ QS COMP QS ]  ]

[Tipo C - Frases de Distancia]

QT [ DIST QS QS ]
QT [ V QC [ QS DIST QS ] ]
QT [ V QC [ DIST QS ] ]
QT [ V QC [ DIST QS QS ] ]

[Tipo D - Frases de Distancia-Comparativas]

QT [ V QCC [ QS COMPdist QS QS ] ]
QT [ V QCC [ QC [ DIST QS QS ] COMP QS ] ]

[Tipo E - Frases con Función no Distancia]

QT [ V QC [ FUNC QS ] ]
QT [ FUNC QS ]

[Tipo F - Frases con Función-Comparativas]

QT [ V QCC [ QS COMP QC [ FUNC QS ] ] ]

[Tipo G - Frases con Estructura no Visible]

En este grupo pueden incluirse varios casos, como por ejemplo, ciertas frases que, presentando una estructura de frase simple, suponen realmente varios accesos, no simultáneos, a la misma tabla. Suelen responder a estructuras como:

QT [ V QS [ CAR1 CAR2 ... OBJ CARn ] ]

En ellas, dos de los conceptos CARi , pertenecen a la misma tabla, y pueden ser considerados equivalentes (el mismo), por lo que suponen un acceso simultáneo a la misma información. Esto no es posible, y por tanto, se hace necesario una descomposición en dos consultas independientes, por lo que la estructura deberá ser modificada en un proceso a posteriori, para dar lugar a:

QT [ V QC [ QS QS ] ]

En nuestra aplicación sucede con cierta frecuencia en frases que manejan conceptos temporales (fechas) o de posición y que, deben ser divididas en dos consultas (una perteneciente a la frase de relativo que subyace en la frase completa).

[Tipo H - Frases No Simples Sin Función]

QT [ V QC [ QS QS ] ]

Son frases coordinadas con varias entidades u objetos, y características de los mismos, pero no incluyen funciones (binarias, ...). Realmente, estas frases equivalen a consultas múltiples expresadas con una única frase en lenguaje natural. En una primera versión y para simplificar el sistema de comprensión, es conveniente limitar este tipo de consultas.

Cada QS puede estar formada por ninguno, uno o varios conceptos tipo CAR (atributos del dominio conceptual) y un concepto de categoría OBJ o equivalente (CAROBJ).

Desde un punto de vista global, podríamos clasificar las frases en:

Frases Sin Funciones (SFW o SelectFromWhere):

Frases con Funciones o Preguntas Lógicas (S/N):

Anterior   I  Siguiente   I  Índice capítulo 6   I  Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001