ISSN: 1139-8736
Depósito Legal: B-8714-2001 |
7.2 Líneas Futuras de Trabajo
Un trabajo como el realizado en esta tesis es una fuente de posibles
líneas de trabajo en el futuro, tanto en la mejora del módulo de decodificación
acústica como en el módulo de comprensión de habla, sin olvidar nuevas posibilidades
que conduzcan al desarrollo de un Sistema de Diálogo Hablado que permita implementar
aplicaciones en las que se produzca una verdadera interacción hombre-máquina, incluyendo
la posibilidad de resolver problemas como la anáfora, solucionando problemas de
ambigüedad e incorporando mecanismos de robustez frente a errores basados en la
interacción dialogada del sistema con el usuario. Realmente son muchas las posibles
líneas futuras que se nos ocurre plantear como resultado de la experiencia acumulada en
el desarrollo del presente trabajo. Sin embargo, vamos a destacar sólo aquellos que nos
parecen más interesantes con el objetivo fundamental de alcanzar una base de conocimiento
y experiencia suficiente que permita desarrollar en el futuro sistemas de diálogo
hombre-máquina basados en lenguaje natural en dominios semánticos restringidos:
- Mejora de la eficiencia y ahorro en memoria en el módulo de reconocimiento acústico
compilando los diccionarios en árbol y mejorando la perplejidad de las gramáticas
estocásticas (sintácticas y semánticas) que guían el proceso, así como la
implementación del espacio de búsqueda de modo dinámico.
- Mejora del modelado lingüístico capturando mayores corpus etiquetados que permitan
generar gramáticas estocásticas de mayor cobertura y menor perplejidad.
- Incorporación de probabilidades en las reglas de los distintos módulos que forman el
sistema de comprensión (mapeador, analizador estructural, transformador estructural,
etc.) que permitan trabajar con varias hipótesis en cada paso, introduciendo una mayor
robustez frente a los errores que pueden producirse en cada módulo.
- Mejorar el modelado semántico, reduciendo la basura e integrando ese conocimiento en el
proceso de decodificación acústica, de modo que mantengamos la robustez frente a
ciertos tipos de error, un buen índice de cobertura y mejores perplejidades que permitan
procesar espacios de búsqueda de tamaños razonables.
- Permitir la interacción entre los módulos que conforman el sistema de comprensión,
favoreciendo el tratamiento de las ambigüedades y de los errores en el sistema.
- Incorporar conocimiento del contexto del discurso y conectar los distintos módulos con
un módulo de control global y manejo del diálogo, que permita interaccionar con el
usuario cuando el sistema es incapaz de comprender completamente una consulta o resolver
la anáfora, elipsis, etc. cuando se presenten (manteniendo una pequeña historia del
diálogo).
- Desarrollar nuevas aplicaciones en otros dominios semánticos restringidos que validen
la arquitectura propuesta, resolviendo aquellas deficiencias que limiten en exceso su
generalidad o flexibilidad, mejorando las primitivas de los lenguajes de reglas, mejorando
los intérpretes de reglas, desarrollando modelos que permitan la incorporación de
restricciones semánticas y del dominio de aplicación que permitan la detección de
problemas planteables al usuario a través del módulo de diálogo.
- Captura de bases de datos de habla espontánea en dominios semánticos restringidos que
permitan modelar los problemas propias de ese tipo de habla (falsos comienzos,
interjecciones, anáforas, estructuras con un cierto grado de agramaticalidad, etc.)
permitiendo al sistema procesarlos con éxito.
- Estudio de técnicas de inferencia de conocimiento (sintáctico, semántico, etc. y
etiquetado automático que faciliten el desarrollo de nuevas aplicaciones sin tanto
esfuerzo manual de etiquetado y definición de gramáticas, conceptos, categorías, etc.
- Mejora de los modelos semánticos, incorporando estructuras de rasgos semánticos más
completos, marcos o plantillas semánticas con mecanismos de chequeo (validación) y
herencia más potentes que las utilizadas en el sistema actual.
- Desarrollo de módulos de reconocimiento acústico para línea telefónica e
independencia del locutor, con posibilidad de procesar diccionarios de mayor tamaño
(5.000 a 20.000 palabras) en tiempo real.
- Incorporación del modelado contextual en el sistema de reconocimiento acústico (H.M.M.
de alófono contextuales intra- e inter-palabra).
Anterior
I Siguiente I Índice capítulo 7 I Índice General
ISSN: 1139-8736
Depósito Legal: B-8714-2001 |