En este capítulo hemos mostrado nuestra propuesta de implementación para el lexicón multilingüe en forma de base de datos relacional, así como la conexión con una base de conocimiento que implementa una ontología de conceptos mediante el esquema de representación de IA basado en marcos.
En un nivel más o menos teórico, pero siempre derivado de consideraciones empíricas, hemos hecho algunas propuestas no contempladas en el modelo lexicológico que ha servido de marco de trabajo para la extracción de la información léxica que hemos modelado
En cuanto al diseño de la base de datos, podríamos mencionar las siguientes características destacadas:
Sin duda el asunto más novedoso de cuantos hemos expuesto en este capítulo fundamental del trabajo es la decisión de ofrecer un soporte ontológico, independiente de la lengua a nuestro lexicón, con el objeto de aportar un método de reutilización para la traducción automática. Ya hemos comentado alguno de los aspectos conflictivos en cuanto a la información léxica previamente contenida en la base de datos (redundancia de información semántica, etc.) y hemos señalado que esta redundancia es difícil de evitar en un lexicón que pretende dar soporte a tipos de aplicaciones tan dispares como la lexicografía onomasiológica y la traducción automática. Creemos que las ventajas de la inclusión de este recurso, superan con creces las desventajas. Sin embargo, somos conscientes de las críticas que la utilización de ontologías ha recibido por parte de los investigadores en el procesamiento del lenguaje natural y no quisiéramos finalizar este capítulo sin antes dejar constancia de las mismas. Las mayores objeciones a la utilización de ontologías son las siguientes15:
La más seria de estas objeciones (dejando de lado la que tiene que ver con la imposibilidad de las representaciones interlingües), es sin duda la tercera. Por ejemplo, Briscoe (1994) critica la inexistencia de principios subyacentes a la creación de ontologías. El problema básico, bien conocido por los investigadores en el campo de la KBMT que utilizan ontologías, es la imposibilidad de exponer un procedimiento algorítmico para la adquisición de ontologías, un procedimiento que marque exactamente la inclusión o no de un determinado concepto, así como sus propiedades y conexiones con otros conceptos. Sin embargo, hemos de ser conscientes de que estas críticas provienen de investigadores que están utilizando marcos de trabajo metalingüísticos a los que puede ser aplicada exactamente la misma crítica (notablemente, Acquilex, ver apartado 2.4.1).
La no existencia de un procedimiento algorítmico para el descubrimiento16 de una ontología, no significa que no se sepa nada sobre la metodología de adquisición de ontologías, y en este sentido nos remitimos a la investigación desarrollada desde hace décadas sobre teoría ontológica (p. ej. el trabajo de Gruber).
Si existe un hecho que este trabajo ha sacado a relucir claramente es que no existe una ontología única y verdadera esperando a ser descubierta (Nirenburg, Raskin & Onyshkevych 1995), por lo que el trabajo del constructor de ontologías para NLP no es del mismo tipo que el del investigador de las ciencias naturales, que intenta describir entidades y fenómenos existentes mediante una metodología muy concreta. Como ya hemos apuntado, una ontología es una entidad artificial, creada para una aplicación concreta, esta aplicación es la que determina en gran parte el modus operandi, ya que no la "metodología".
Finalmente, la introducción de una ontología del tipo que hemos descrito en un sistema de NLP no pretende corresponderse con una realidad psicológica o estructuras mentales, en el sentido de Lakoff (1987), ni tampoco ser un reflejo del lexicón mental de un hablante como es el caso de WordNet (ver apartado 2.4.2), sino simplemente como un recurso artificial para un fin muy concreto.
En cualquier caso, volvemos a reiterar nuestra visión ecléctica en cuanto a la construcción de herramientas para NLP se refiere, y nos adherimos por completo al paradigma de la "combinación de métodos débiles" formulada por el prestigioso y experimentado investigador en el campo Yorik Wilks (Wilks et al. 1992).
Por lo que respecta a la implementación en conjunto. La característica más relevante del sistema que proponemos es sin duda la utilización de productos comerciales, como opción a la creación de sistemas de representación específicos creados al efecto.
Pensamos que los productos disponibles en el mercado, de probada valía a través de años de experiencia y que cuentan miles, o millones, de usuarios son una garantía de robustez y fiabilidad, así como de conectividad y reutilización. Creemos que es menos costoso adaptar una determinada aplicación a nuestras necesidades específicas de representación y proceso que la creación de una aplicación desde el principio.
En el capítulo anterior mostramos algunos sistemas de representación que se basan en especificaciones más o menos concretas de lo que el sistema de representación léxica debe ser capaz de hacer. Estas implementaciones tienen una enorme valía como sistemas de investigación en el campo de la informática, y de la lingüística computacional y en tareas de prueba de teorías gramaticales o supuestos lingüísticos. Por el contrario, carecen de la robustez y fiabilidad que una inversión, en términos de esfuerzos humanos, a largo plazo, requiere. Además, suponen el aprendizaje, por parte del lingüista o lexicógrafo, de una serie de técnicas computacionales avanzadas, ya que estas herramientas no disponen de interfaces gráficos que faciliten su tarea.
En resumen, hemos tratado de asegurar los requisitos que exponíamos al principio de este trabajo: fiabilidad, reutilización, conectividad y facilidad de uso.
NOTAS
Anterior I Siguiente I Índice capítulo 5 I Índice General