ISSN: 1139-8736
Depósito Legal: B-8714-2001

4.0 Introducción

En esta tesis se ha diseñado una arquitectura flexible para implementar un Sistema de Obtención de Información Robusto basado en la modelización lingüística y de un dominio mediante un conjunto de gramáticas conceptuales probabilísticas y no probabilísticas. Esta combinación de fuentes de información de distinta naturaleza permite desarrollar aplicaciones con un cierto nivel de complejidad funcional, como son aquellas que implican el procesamiento de funciones no SQL a los resultados de varias consultas para obtener información que no está incluida explícitamente en las bases de datos de la aplicación, o para traducir frases del lenguaje natural que darían lugar a varias consultas anidadas de cierta complejidad.

Nuestra solución se basa en utilizar una jerarquía conceptual relacionada con el diagrama E-R (Entidad-Relación) de la aplicación, con la funcionalidad de la misma y ciertos fenómenos lingüísticos generales (coordinación, frases de relativo, negación, etc.). La combinación de un Decodificador Conceptual basado en un Autómata Finito Probabilístico de Conceptos (PFSN), de una gramática sensible al contexto para mapear los conceptos (CSMG), de una gramática semántica libre de contexto (SCFG) para obtener la estructura de la frase y una gramática sensible al contexto para transformar la estructura anterior (CSTG), permite al sistema responder a consultas complejas mediante la ejecución estructurada de varias consultas sencillas y ciertas funciones. Comparada con los clasificadores estocásticos, esta arquitectura es más flexible cuando necesitamos añadir nueva funcionalidad sin necesidad de capturar y etiquetar nuevos datos de entrenamiento del clasificador.

Anterior   I  Siguiente   I  Índice capítulo 4   I   Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001