ISSN: 1139-8736
Depósito Legal: B-35510-2000

2.5 Conclusiones y discusión

En este capítulo hemos tratado de aportar una visión global de lo que el concepto de lexicón significa hoy en día. Tras una caracterización superficial en el ámbito de la psicolingüística, como marco teórico, hemos realizado un recorrido por la historia reciente de los desarrollos de lexicones en el ámbito de la lingüística y lexicografía computacionales.

La importancia que este tipo de recursos ha cobrado en las últimas dos décadas es innegable. Las teorías gramaticales modernas tienen sin excepción un componente léxico muy importante, de modo que el desarrollo en cuanto a lexicones computacionales ha sido paralelo. Sin duda, la afirmación que hacíamos en el capítulo introductorio referente a considerar una tautología el hecho de que no puede existir un sistema de NLP sin un lexicón ha quedado más que demostrada. En el siguiente capítulo veremos cómo esto es especialmente cierto de las aplicaciones de traducción automática.

Es interesante observar que este "renacimiento" del interés general por el léxico coincide también con la revolución de los micro-ordenadores. Pensamos que la disponibilidad de potencia de cálculo y de medios de almacenamiento digital masivo ha ejercido una notable influencia en este cambio de perspectiva. Evidentemente, si no contamos con este tipo de recursos, un lexicón no es más que o bien una entidad abstracta (psicológica), o bien un diccionario en papel; en cualquier caso, el interés que tal tipo de recurso puede tener no va mucho más allá del puramente teórico. Con el concepto de "lexicón computacional" comienza una perspectiva totalmente nueva, abriéndose un abanico de posibilidades de aplicación que hace 20 años eran impensables.

Como hemos visto, a la hora de plantear la construcción de un lexicón computacional, debemos tener en cuenta una serie de aspectos que no se reducen únicamente a los de diseño e implementación, ni a consideraciones sobre el tipo de hardware en el que las posibles aplicaciones derivadas del lexicón computacional deben funcionar. Éstos son sin duda los aspectos más importantes, y dedicaremos por tanto los Capítulos 4 y 5 a estudiar las distintas alternativas que se nos ofrecen. Pero igualmente importantes son las fuentes de adquisición de la información que pretendemos representar en el lexicón, así como la metodología a seguir para introducir dicha información.

Tal y como se deriva de lo visto en las secciones anteriores, la extracción manual de datos parece hoy día la alternativa más realista y la que ofrece resultados más seguros a medio y largo plazo. Es indudable que se ha avanzado mucho en los últimos años en lo relativo a la extracción automática de información léxica, pero creemos que es necesario aún el desarrollo de fuentes más fiables de las que esta información pueda extraerse (mejores y más completos MRDs, córpora informatizados de mayor calidad, acompañados de las herramientas que hagan la extracción posible, etc.).

Una lección importante que debemos aprender del desarrollo y los resultados de algunos de los proyectos que hemos estudiado, es la necesidad de establecer desde un principio la metodología y el marco de trabajo que subyacen a una tarea de envergadura como es la construcción de un lexicón computacional multifuncional. Este tipo de decisiones tienen que ver tanto con la estructura y el acceso que se pretende dar a la base de datos, teniendo en cuenta, no sólo las aplicaciones a las que la base de datos vaya a dar soporte, sino también los posibles usuarios que tendrán que interactuar de forma cotidiana con el sistema. En este sentido, una correcta implementación en términos de modelado de datos y disponibilidad de interfaces de usuario asegurarán estas deseadas funcionalidades.

Un ejemplo de un sistema que cumple con estas características es COBUILD, que se implementó desde un principio sobre un sistema relacional estándar. Como mostraremos en el Capítulo 5, la implementación de nuestra LDB utiliza este mismo modelo de datos, donde también mostraremos el sistema que proponemos y se pondrán de manifiesto las características del mismo, tanto en lo que se refiere a facilidades para la práctica lexicográfica como en lo relativo a la conectividad con otros tipos de sistemas que nos permitirán la aplicación de nuestro sistemas a tareas de traducción automática.

Pero sin duda es Multilex, el mayor proyecto en cuanto a la consecución de estándares para la creación y mantenimiento de lexicones reutilizables. Estudiaremos las recomendaciones surgidas a partir este proyecto en el siguiente capítulo, porque se llevó a cabo como parte del proyecto de TA más ambicioso de los llevados a cabo en Europa: Eurotra. Queremos, no obstante, finalizar este capítulo con la visión que en este proyecto se tuvo en cuanto a la reutilización de datos existentes, ya que refleja perfectamente nuestro punto de vista:

Given the fact that printed dictionaries as well as simple electronic data sets exist, it is the intention of MLEXd to provide the means and tools for reusing lexical resources by importing and converting them. However, copyright problems, problems in converting and correcting dictionary data, and a lack of consistency in the data, frequently make reusing existing dictionaries as costly as building a new lexical data base from scratch. This cost factor is enhanced by the fact that available dictionaries are often dated and do not represent the language use of today.

(Multilex 1993:7)

 

Anterior  I  Siguiente  I  Índice capítulo 2  I  Índice General


ISSN: 1139-8736
Depósito Legal: B-35510-2000
Copyright © 2000 Antonio Moreno Ortiz