Estudios de Lingüística del Español (ELiEs)
Los Diccionarios Electrónicos: hacia un nuevo concepto de diccionario / Ana Fernández-Pampillón Cesteros y María Matesanz del Barrio


3.3.1 La lematización y los problemas en la consulta

Quizá el problema inicial con que se encuentra el consultante, puesto que impide claramente el acceso a toda información, es el del desconocimiento del sistema de lematización, en sus procedimientos más elementales. Los diccionarios en formato electrónico suelen ser casi siempre reflejo de la organización de la información en papel. Como es de sobra conocido, los artículos del diccionarios, independientemente de la estructura interna que se haya diseñado para ellos, tienen un elemento fijo que es la cabecera25. El acceso a la información de los artículos se realiza a través de ella, constituida por la forma de cita de la unidad léxica, normalmente estable en la propia lengua26, a la que en algunos casos acompaña información de moción gramatical (de género, normalmente). Los diccionarios electrónicos que están concebidos inicialmente para su publicación en papel mantienen este sistema de acceso, en el que se suelen usar las formas canónicas únicamente, de modo que las búsquedas serán erradas si se utilizan actualizaciones discursivas27 o, incluso, las formas de moción del elemento elegido como lema. Es decir, el acceso queda reducido casi siempre al primer elemento de la cabecera, a la forma de cita en sentido estricto y, con ella, hay que iniciar la búsqueda. Por ejemplo, en entradas de un sustantivo con moción de género, aunque esta haya sido consignada en la cabecera, sólo se tendrá acceso al artículo tecleando la forma correspondiente al masculino.

Para poder realizar una búsqueda en un diccionario, además de este criterio, hay que tener presentes los criterios particulares que se hayan adoptado en la lematización y distribución de la información lexicográfica, no coincidentes en la mayoría de los diccionarios. Nos referimos, sólo por citar algunas de las dificultades más obvias en la búsqueda, a la distribución del significado léxico y gramatical de una forma en el mismo o distintos artículos, la resolución de los problemas de homonimia y polisemia o la situación de la fraseología en el diccionario. El hábito en el manejo de los diccionarios supone que la primera situación expuesta, la de lematización de unidades léxicas simples, no presente demasiada dificultad para el consultante, al mismo tiempo, también es cierto que no tendrá complicaciones notables en otras búsquedas ligadas a la estructuración particular del diccionario. Evidentemente, las principales dificultades de búsqueda quedan resueltas en los prólogos de advertencias para el uso del diccionario en cuestión, pero los usuarios no suelen dedicar mucho tiempo a su lectura, sobre todo cuando las consultan las realizan a través de la red.

Esta dificultad inicial en la búsqueda que lleva al usuario a pensar que la palabra que busca no ha sido registrada o no existe, viene originada por el concepto de palabra que tiene el propio usuario, quien en muchos casos no realiza el proceso morfológico de asignar a una forma de palabra una forma de expresión que, es, en definitiva, la forma de cita del diccionario (Lyons, 1977). La disociación que para muchos hablantes existe entre, por ejemplo, vicisitudes y vicisitud, entendiendo la primera como una actualización discursiva y la segunda como una representación mental (forma de palabra frente a expresión de palabra) lleva al usuario a no encontrar en el diccionario la forma de cita correspondiente, en este caso “vicisitud”. La traba que presenta para el usuario el manejo de las categorías gramaticales, tanto con representación morfológica como léxica (como es el género, el número, la persona, el tiempo, la modalidad, el aspecto y la diátesis), le supone una dificultad en la búsqueda que en formato electrónico, especialmente en Internet, puede tener, como consecuencia, la no localización del elemento buscado. Esta carencia no resulta tan relevante ni tan evidente, incluso para el mismo usuario, cuando se manejan diccionarios en papel o diccionario electrónicos con presentación simultánea de nomenclatura próxima (rueda de palabras). El problema se hace evidente en los formatos electrónicos que no ofrecen esta ayuda y los artículos sólo se encuentran si se teclea la forma elegida como lema correcto. En la práctica, esta rigidez en el acceso resulta una forma de aislamiento de la información, ya que se elimina completamente la posibilidad de lectura vertical del diccionario, incluso su forma simplificada en la rueda de palabras. De este modo, no sólo se pierde la posibilidad de ‘tropezarse’ con un artículo sino que, por ejemplo, también se pierde completamente, en una búsqueda única, la información de derivación más básica implícita en toda nomenclatura, ya que el acceso es de uno en uno28. Sólo será posible encontrar todos los artículos correspondientes a los miembros de una familia léxica, registrados en el diccionario, realizando todos los procesos derivativos necesarios para su obtención, lo que supone conocerlos previamente. En realidad, en estas búsquedas sólo es posible verificar el propio conocimiento léxico, ya que mediante este sistema no se pueden encontrar elementos de una familia que hayan seguido reglas y reajustes ignorados por el usuario.

El desconocimiento de una pauta de formación, tanto sincrónica como diacrónica, nos impide el acceso al elemento buscado. La casuística es amplia y no entraremos a analizarla con detalle en estas líneas, pero a modo de ilustración del problema citaremos algunos ejemplos. Ya hemos señalado el problema que para muchos usuarios supone la disociación entre formas en plural y las formas canónicas en singular; otras muestras de esta disociación morfológica se puede observar en los incrementos silábicos, unidos o no a cambios acentuales (maniquí-maniquíes, album-álbumes), los cambios ortográficos (haz-haces; jersey-jerséis), los cambios fonéticos, (ley-leyes), palabras desconocidas tanto en singular como en plural de modo que no se tiene seguridad en el proceso (un ejemplo puede ser cuyes, con un singular posible *cuyes (sin variación) cuy, cuye, pero también cui29. La relación femenino-forma canónica también presenta dificultad a la hora de la búsqueda. Las palabras que tienen moción de género y número se han registrado tradicionalmente en masculino singular, lo que hace que las búsquedas en femenino sean infructuosas: el adjetivo púnica tiene como forma de acceso “púnico”. Aunque muchos diccionarios consignan en el lema la moción no se realiza en todos los casos (“emperador-emperatriz”, “duque-duquesa” suelen lematizarse independientemente)30. Las formas conjugadas también son causa de problema en la búsqueda, ya que los usuarios no siempre asocian las formas de conjugación de un verbos con su infinitivo correspondiente; la irregularidad en la conjugación de muchos verbos y la presencia de clíticos suelen ‘desfigurar’ la relación con el infinitivo.

Otro de los problemas apuntados en el acceso a la información, y que también está relacionado con los criterios de lematización de los diccionarios, es el de la homonimia parcial en su vertiente gramatical. La coincidencia formal entre categorías gramaticales recibe soluciones diferentes a la hora de aplicar criterios de lematización de los diccionarios. Algunos diccionarios optan por reunir bajo el mismo lema distintas categorías, mientras que otros se decantan por una lematización independiente. Cuando la coincidencia se produce en la forma de cita el problema es menor, ya que las nomenclaturas de los diccionarios muestran los homónimos de forma consecutiva y, en estos casos, el formato electrónico los presenta de forma simultánea. Pero el problema se plantea cuando las formas de cita no son coincidentes. Esta disociación es la que ocurre, por ejemplo, entre el adjetivo lematizado “heurístico, ca” y el sustantivo “heurística”, ya que en aquellos diccionarios en los que se lematizan ambos conjuntamente la búsqueda debe realizarse usando la forma en masculino “heurístico”; en los formatos electrónicos no habrá respuesta si no se busca a través de la forma de cita del adjetivo. La relación adjetivo-sustantivo entre formas relacionadas morfológicamente no es evidente para muchos hablantes no habituados al uso de conceptos gramaticales. La lematización y distribución de la información puede variar bastante de unos diccionarios a otros, por lo que no existen reglas universales que puedan ayudar a los usuarios en este aspecto sino que en la búsqueda hay que proceder por descarte, aplicando las posibilidades de lematización, si estos criterios no quedan suficientemente especificados en las instrucciones de uso de las obras lexicográficas.




Notas

25 Existe una gran ambigüedad terminológica en la lexicografía española en lo referente a esta parte del artículo. En este capítulo utilizaremos cabecera para referirnos a la secuencia monomorfemática o plurimorfemática que inicia el artículo y a la que se refieren las informaciones contenidas en el resto del él. Por lema entenderemos la forma de cita, que, en muchos casos, es coincidente con la propia cabecera, lo que frecuentemente lleva a la identificación y consiguiente confusión terminológica. Una exposición reciente de este problema se puede encontrar en Porto Dapena (2002, 183-185).
26 Las formas de cita suelen ser estables en una misma lengua, lo que ocurre sin duda con los diccionarios de lenguas modernas. Sin embargo, un caso particular de forma de cita en verbos lo constituyen los diccionarios de latín. En todos se consigna la misma información (tema de presente, con indicación de la conjugación a la que pertenece el verbo, tema de perfecto y tema de supino), pero la forma de consignarlo no es idéntica en todos los diccionarios y responde generalmente a la tradición lexicográfica que se siga, no idéntica en todos los países. En los diccionarios de latín hechos en España se suele seguir el esquema: 1.a persona del singular del presente de indicativo + 2.a persona del singular del presente de indicativo + infinitivo +1.a persona del singular del pretérito + supino. En los diccionarios de tradición francesa esta información no se expresa de idéntica forma.
27 Aunque algunos diccionarios disponen de analizadores morfológicos que actúan sobre el texto del propio diccionario cuando existen saltos hipertextuales, sin embargo, no suele ofrecerse esta posibilidad en el acceso inicial, de modo que el usuario debe realizar la lematización adecuada a cada caso e introducir la forma de cita.
28 Hay que tener en cuenta que esta información no está codificada en la mayoría de los diccionarios de uso, entre otras causas porque no está entre sus propósitos de diccionario descodificador. La extracción de esta información depende, por tanto, de la competencia lingüística del consultante.
29 De hecho en este ejemplo, salvo el caso que hemos marcado con asterisco que no existe, las otras formas son posibles y correctas y sirven como forma de acceso. Un problema diferente es que, a través de una de ellas, localicemos todas las variantes. Esta información no está explicitada en el DRAE 2001, aunque sí lo está en el DUE y Clave.
30 En estos casos las formas van seguidas porque el orden alfabético lo permite, aunque en el DRAE 2001 la secuencia es: “emperador-emperadora-emperatriz”. La lematización *”emperador, ra” no se ha producido por la marca cronológica p. us. del femenino, lo que ha llevado a registrar como lema independiente esta forma. El acceso, por tanto, en los formatos electrónicos por la forma del femenino da un resultado positivo, aunque se remita al artículo encabezado por masculino para su definición (caso del Clave).





Estudios de Lingüística del Español (ELiEs), vol. 24 (2006)   
 ISSN: 1139-8736