ISSN: 1139-8736
Depósito Legal: B-8714-2001 |
1.1 Objetivos
El presente trabajo se enmarca en el campo de los Sistemas
de Comprensión del Lenguaje Hablado. Estos sistemas no sólo realizan una decodificación
acústica del mensaje hablado emitida por un locutor sino que además, intentan
extraer el significado de la misma, con el fin de realizar una acción o una
traducción, fruto del entendimiento de la frase reconocida.
Dentro de ese marco, los objetivos más importantes planteados
en la tesis son los siguientes:
- Análisis del problema de la comprensión del lenguaje hablado y estudio
de los paradigmas más utilizados en la implementación de los sistemas de comprensión
actuales. Como veremos a lo largo de este trabajo de investigación, las
posibilidades son muchas, cada una con sus ventajas e inconvenientes, pero
sin que exista una solución óptima que resuelva de forma completa este tipo
de problemas u objetivos. El problema de la comprensión se resuelve mediante
la solución de distintos subobjetivos, utilizando una gran diversidad de técnicas
y conocimientos, pero insistiendo en que la arquitectura que se desarrolle
debe respetar características como:
- Robustez frente a errores, falta de cobertura (léxica, sintáctica,
semántica), limitaciones, etc.
- Flexibilidad para cambiar el dominio de aplicación sin necesidad
de volver a diseñar el sistema completo, con el menor esfuerzo posible.
- Complejidad, vista como la capacidad del sistema para resolver
problemas de comprensión complejos, sin necesidad de imponer restricciones
no naturales al mensaje a decoficar (comprender).
- Tiempo real, es decir, la posibilidad de realizar el proceso de
comprensión en tiempos muy reducidos, de forma casi inmediata, sin demoras
significativas, permitiendo implementar aplicaciones realistas en
dominios semánticos limitados.
Es decir, deberá plantearse el problema de la comprensión del
lenguaje hablado realísticamente y no sólo desde un punto de vista teórico y
formal.
Se estudiarán distintas arquitecturas planteadas por la comunidad
científica internacional como posibles soluciones al problema de la comprensión
del lenguaje hablado, y estrategias para incorporar el conocimiento lingüístico
necesario para decodificar la información semántica contenida en la frase y
en concreto, analizaremos en profundidad aquellas que modelan la información
semántica mediante autómatas conceptuales ergódicos probabilísticos y
marcos semánticos, al constituir uno de los paradigmas más utilizados
en la comunidad científica internacional en la actualidad.
- Diseño y desarrollo de una arquitectura para la comprensión del lenguaje
hablado en castellano basadas en el paradigma de los autómatas finitos conceptuales
probabilísticos y los marcos semánticos. El objetivo principal de la tesis
es desarrollar una arquitectura para la comprensión del mensaje hablado, que
tenga en cuenta aspectos concretos del castellano como lengua natural que
puedan afectar al proceso de comprensión y que arquitecturas diseñadas para
otras lenguas naturales (inglés, francés, alemán, etc.) no se hayan planteado.
Actualmente, son pocos los esfuerzos realizados por la comunidad científica
española e internacional en este problema (particularizado para el castellano),
y se desconocen las limitaciones de la tecnología utilizada en el desarrollo
de sistemas para otras lenguas cuando se utiliza nuestra lengua.
- Análisis de las ventajas e inconvenientes del uso de dicho paradigma,
teniendo en cuenta las características de una lengua natural como el castellano.
El uso de este paradigma ofrece, en principio, muchas de las características
que antes señalábamos como necesarias en el diseño de una arquitectura realista
para la comprensión del mensaje hablado, sobre todo en dominios de aplicación
restringidos como los que nos interesan. Sin embargo, también presentan limitaciones
que restringen el tipo de frases en lenguaje natural que son capaces de procesar
(comprender), lo que afecta a la naturalidad de las interacciones
que puede mantener un usuario con el sistema.
En esta tesis se estudiarán las ventajas
e inconvenientes de este paradigma y se buscarán soluciones a las limitaciones
del mismo, intentando mantener las características de robustez, cobertura, flexibilidad,
tiempo real, etc.. Estas soluciones (fuentes de conocimiento lingüístico adicionales)
quedarán integradas en la arquitectura final y serán evaluadas y comparadas
con otras estrategias.
Se analizarán y describirán los problemas
que presenta el castellano como lengua natural en relación con el uso de este
paradigma, y cómo las soluciones que se proponen intentan solventarlos (ambigüedad
semántica, frases con estructura compleja claúsulas subordinadas, de
relativo - , funciones no SQL como el cálculo de distancias, comparaciones,
ciertos cuantificadores, la elipsis semántica en la estructura superficial,
etc.).
- Evaluación de la arquitectura desarrollada en un dominio de aplicación
realista de cierta complejidad. Para obtener conclusiones será necesario
evaluar dicha arquitectura en un dominio de aplicación limitado, y poniendo
a punto un conjunto de tecnologías básicas relacionadas con este tipo de sistemas,
que nos permitan investigar la problemática inherente y encontrar las soluciones
más eficientes y generales posibles. La elección de un dominio con un cierto
nivel de complejidad asegura la aparición de fenómenos lingüísticos que requieren
de soluciones más complejas que las ofrecidas por otras arquitecturas básicas
que existen en la comunidad internacional.
- Análisis de la problemática asociada al módulo de decodificación
acústica desde el punto de vista de la integración de fuentes de conocimiento
lingüístico en el mismo y su repercusión en el espacio de búsqueda.
Se diseñará un módulo de decodificación acústica con la capacidad de integrar
distintas fuentes de conocimiento asociadas al proceso de comprensión, y se
evaluarán distintas alternativas destacando los pros y contras de las mismas.
Se analizarán los problemas relacionados con el incremento del espacio de
búsqueda de soluciones en los sistemas de decodificación acústica basados
en programación dinámica y Modelos Ocultos de Markov (H.M.M.) al incorporar
distintas fuentes de conocimiento lingüístico. Se estudiará la integración
de gramáticas morfo-sintácticas y semánticas, así como la generación de una
o N hipótesis de salida y su proceso en forma de grafo semántico en el módulo
de comprensión. Se diseñarán sistemas de reconocimiento flexibles y modulares
que permitan la integración de distintas fuentes de conocimiento lingüístico
sin la modificación del proceso, es decir, con sólo cambiar ficheros de datos
de entrada.
- Estudio en profundidad técnicas de recorte o reducción del espacio de
búsqueda. Estas técnicas permiten que el proceso de decodificación acústica
se pueda llevar a cabo en tiempo real aún a pesar de integrar modelos lingüísticos
de cierta complejidad. Se estudiará el cálculo de heurísticos de recorte que
no supongan un incremento del coste computacional así como la posibilidad
de predecir comportamiento del heurístico de recorte a partir del conjunto
de datos de entrenamiento. Se analizará la naturaleza de la propia técnica
de recorte y cómo afecta al espacio de búsqueda óptimo. Se obtendrán conclusiones
que permitan mejorar la integración de estas técnicas de recorte en los sistemas
de reconocimiento acústico también implementados.
Anterior
I Siguiente
I Índice capítulo 1
I Índice General
ISSN: 1139-8736
Depósito Legal: B-8714-2001 |