5.6 Conclusiones y discusión

ISSN: 1139-8736
Depósito Legal: B-35510-2000

5.6 Conclusiones y discusión

En este capítulo hemos mostrado nuestra propuesta de implementación para el lexicón multilingüe en forma de base de datos relacional, así como la conexión con una base de conocimiento que implementa una ontología de conceptos mediante el esquema de representación de IA basado en marcos.

En un nivel más o menos teórico, pero siempre derivado de consideraciones empíricas, hemos hecho algunas propuestas no contempladas en el modelo lexicológico que ha servido de marco de trabajo para la extracción de la información léxica que hemos modelado

En cuanto al diseño de la base de datos, podríamos mencionar las siguientes características destacadas:

Modularidad: la adición de nuevas entidades no implica una modificación del esquema general.
El diseño es compacto: se han evitado las relaciones muchos a muchos, así como la utilización de claves semánticas. El uso de claves subrogadas asegura la independencia de los datos.
Integridad de los datos. todas las relaciones de la base de datos están reforzadas con reglas de integridad referencial, con actualización y borrado en cascada.
Flexibilidad. el abanico de consultas que se pueden realizar como consecuencia del diseño que proponemos es muy amplio. Por ejemplo, podrían realizarse consultas del tipo "¿Cuál es el porcentaje de verbos del campo léxico/dimensión X que toman el tipo de argumento 2 cuando la semántica del Argumento 1 es Z?" No cabe duda de que este tipo de funcionalidad permite un estudio lingüístico realmente interesante. Aunque este tipo de funcionalidad no ha sido explotada en el presente trabajo, creemos que es igualmente importante que las aplicaciones para los que la base de datos ha sido diseñada.
Multifuncionalidad. Como hemos visto, la base de datos contiene información que puede ser utilizada en los dos tipos de tareas a los que nos proponíamos dar soporte. En todos los casos que ha sido posible, la información se ha modelado de forma pueda utilizarse en ambos tipos de aplicaciones.

Sin duda el asunto más novedoso de cuantos hemos expuesto en este capítulo fundamental del trabajo es la decisión de ofrecer un soporte ontológico, independiente de la lengua a nuestro lexicón, con el objeto de aportar un método de reutilización para la traducción automática. Ya hemos comentado alguno de los aspectos conflictivos en cuanto a la información léxica previamente contenida en la base de datos (redundancia de información semántica, etc.) y hemos señalado que esta redundancia es difícil de evitar en un lexicón que pretende dar soporte a tipos de aplicaciones tan dispares como la lexicografía onomasiológica y la traducción automática. Creemos que las ventajas de la inclusión de este recurso, superan con creces las desventajas. Sin embargo, somos conscientes de las críticas que la utilización de ontologías ha recibido por parte de los investigadores en el procesamiento del lenguaje natural y no quisiéramos finalizar este capítulo sin antes dejar constancia de las mismas. Las mayores objeciones a la utilización de ontologías son las siguientes¹⁵:

La Objeción de la Redundancia: es posible resolver ambigüedades semánticas mediante mecanismos no semánticos (sintácticos, morfológicos, etc.). Esta suposición ha llevado a la implementación de sistemas donde el reconocimiento ha suplantado a la interpretación, por lo que no consigue ninguna representación del significado del texto (sistemas basados en transferencia).
La Objeción de la Dependencia de la Lengua: es quizá la objeción más comúnmente citada y se refiere al hecho de que una ontología reflejará la concepción lingüística de sus creadores y por tanto su estructura y contenidos estarán influenciados por la concepción de una lengua determinada, con lo que se revoca la afirmación de que una ontología es independiente de la lengua, así como los supuestos beneficios que de esto se derivan (el servir de puente entre dos lenguas). Se trata, una vez más, de los viejos argumentos en contra de las aproximaciones interlingües a la traducción automática, que no volveremos a debatir.
La Objeción del Método Científico: se refiere a la falta de una metodología concreta que dirija la creación y mantenimiento de ontologías. Como hemos visto, los creadores de ontologías suelen establecer una serie de normas generales a seguir para la introducción de conceptos en una ontología, aunque esto no se pueda considerar como "metodología" en sentido estricto.
La Objeción de la Implementación: las dificultades y costes que supone la creación de una ontología no compensan sus beneficios.

La más seria de estas objeciones (dejando de lado la que tiene que ver con la imposibilidad de las representaciones interlingües), es sin duda la tercera. Por ejemplo, Briscoe (1994) critica la inexistencia de principios subyacentes a la creación de ontologías. El problema básico, bien conocido por los investigadores en el campo de la KBMT que utilizan ontologías, es la imposibilidad de exponer un procedimiento algorítmico para la adquisición de ontologías, un procedimiento que marque exactamente la inclusión o no de un determinado concepto, así como sus propiedades y conexiones con otros conceptos. Sin embargo, hemos de ser conscientes de que estas críticas provienen de investigadores que están utilizando marcos de trabajo metalingüísticos a los que puede ser aplicada exactamente la misma crítica (notablemente, Acquilex, ver apartado 2.4.1).

La no existencia de un procedimiento algorítmico para el descubrimiento¹⁶ de una ontología, no significa que no se sepa nada sobre la metodología de adquisición de ontologías, y en este sentido nos remitimos a la investigación desarrollada desde hace décadas sobre teoría ontológica (p. ej. el trabajo de Gruber).

Si existe un hecho que este trabajo ha sacado a relucir claramente es que no existe una ontología única y verdadera esperando a ser descubierta (Nirenburg, Raskin & Onyshkevych 1995), por lo que el trabajo del constructor de ontologías para NLP no es del mismo tipo que el del investigador de las ciencias naturales, que intenta describir entidades y fenómenos existentes mediante una metodología muy concreta. Como ya hemos apuntado, una ontología es una entidad artificial, creada para una aplicación concreta, esta aplicación es la que determina en gran parte el modus operandi, ya que no la "metodología".

Finalmente, la introducción de una ontología del tipo que hemos descrito en un sistema de NLP no pretende corresponderse con una realidad psicológica o estructuras mentales, en el sentido de Lakoff (1987), ni tampoco ser un reflejo del lexicón mental de un hablante como es el caso de WordNet (ver apartado 2.4.2), sino simplemente como un recurso artificial para un fin muy concreto.

En cualquier caso, volvemos a reiterar nuestra visión ecléctica en cuanto a la construcción de herramientas para NLP se refiere, y nos adherimos por completo al paradigma de la "combinación de métodos débiles" formulada por el prestigioso y experimentado investigador en el campo Yorik Wilks (Wilks et al. 1992).

Por lo que respecta a la implementación en conjunto. La característica más relevante del sistema que proponemos es sin duda la utilización de productos comerciales, como opción a la creación de sistemas de representación específicos creados al efecto.

Pensamos que los productos disponibles en el mercado, de probada valía a través de años de experiencia y que cuentan miles, o millones, de usuarios son una garantía de robustez y fiabilidad, así como de conectividad y reutilización. Creemos que es menos costoso adaptar una determinada aplicación a nuestras necesidades específicas de representación y proceso que la creación de una aplicación desde el principio.

En el capítulo anterior mostramos algunos sistemas de representación que se basan en especificaciones más o menos concretas de lo que el sistema de representación léxica debe ser capaz de hacer. Estas implementaciones tienen una enorme valía como sistemas de investigación en el campo de la informática, y de la lingüística computacional y en tareas de prueba de teorías gramaticales o supuestos lingüísticos. Por el contrario, carecen de la robustez y fiabilidad que una inversión, en términos de esfuerzos humanos, a largo plazo, requiere. Además, suponen el aprendizaje, por parte del lingüista o lexicógrafo, de una serie de técnicas computacionales avanzadas, ya que estas herramientas no disponen de interfaces gráficos que faciliten su tarea.

En resumen, hemos tratado de asegurar los requisitos que exponíamos al principio de este trabajo: fiabilidad, reutilización, conectividad y facilidad de uso.

NOTAS

Este conjunto de objeciones es recopilado precisamente por investigadores defensores de la utilización de una semántica basada en ontología (Nirenburg, Raskin & Onyshkevych 1995).
Ya mencionamos en el apartado 3.3.6, que una ontología no se "descubre" sino que se "crea" (Mahesh 1996).

Anterior I Siguiente I Índice capítulo 5 I Índice General