ISSN: 1139-8736 Depósito Legal: B-8714-2001 |
6.1.8 Limitaciones del Segmentador Conceptual
La principal limitación del Segmentador deriva del uso de una gramática regular (autómata finito), incapaz de encontrar la estructura de la frase, es decir, de las interrelaciones de larga distancia existentes entre los distintos elementos de una frase.
Esta estructura sólo puede conseguirse empleando gramáticas de un nivel mayor en la jerarquía de Chomsky, es decir, con gramáticas de contexto-libre. Además, sería útil el uso de estructuras de rasgos y mecanismos de unificación de los mismos (Gramáticas de Unificación). Además, la incorporación de los mecanismos de robustez (concepto y categoría basura, modelo ergódico para representar las secuencias de conceptos en la frases, hacen del módulo de segmentación, un módulo robusto pero con una capacidad de segmentación limitada. En muchos casos, nos gustaría poder saber los vínculos existentes entre conceptos distantes en la frase, para agruparlos previamente a su traducción (fusión de conceptos), o determinar si se trata de una frase sencilla o compuesta de frases sencillas pero independientes, etc. Esta información es muy importante para enfrentarse al proceso de traducción, y principalmente, si es una traducción a otro lenguaje como es SQL. Existen disyunciones, frases de relativo, frases con información temporal, frases con funciones no traducibles a SQL, etc , que deben ser adecuadamente detectadas o clasificadas antes del proceso de traducción. Existen sistemas que usan clasificadores estocásticos para encontrar el grupo o clase al que pertenece una frase según su Modelo del Dominio, pero son difíciles de entrenar y poco flexibles a la hora de su mantenimiento, además de la dificultad para encontrar las unidades elementales en las que se basa el clasificador.
Fig. 6.5 Pantalla del Sistema de Comprensión con la ventana de entrada de la consulta en LN, y la salida generada por el Módulo de Control.
Nosotros hemos optado por una solución, a nuestro juicio, más potente y flexible, basadas en gramáticas pseudo sensibles al contexto y gramáticas conceptuales de contexto-libre, que serán descritas más tarde cuando hablemos del módulo Mapeador y del Analizador Estructural (una especie de clasificador que entrega información explícita- estructura), así como el Módulo de Control con las reglas de transformación, de resolución de elipsis, procesamiento de funciones no SQL, etc.
Anterior I Siguiente I Índice capítulo 6 I Índice General
ISSN: 1139-8736 Depósito Legal: B-8714-2001 |