ISSN: 1139-8736 Depósito Legal: B-39120-2002 Copyright: © Chantal Pérez |
Nos gustaría terminar nuestra exposición referente a la relación entre lexicografía y terminografía tratando un último aspecto que se deriva de forma natural de los tratados en las secciones anteriores. Hemos visto en el apartado 3.3 las conexiones que unen lexicografía y terminología, señalando la existencia de una disciplina que puede considerarse como puente entre ambas, la lexicografía especializada. Parece lógico, por tanto, que nos detengamos ahora, aunque sea brevemente, a reflexionar sobre la relación que existe entre los productos que se derivan de estas tres disciplinas, es decir, los diccionarios generales (lexicografía), los diccionarios especializados (lexicografía especializada) y los repositorios terminológicos (terminografía). Asimismo, y retomando un concepto que se ha convertido en central en los últimos quince años (como ya vimos en el apartado 3.1.1), veremos algunas iniciativas llevadas a cabo con el objeto de reutilizar la información que puede considerarse como especializada contenida en los diccionarios generales para la creación de repositorios terminológicos.
Lerat (1997: 175) en su capítulo dedicado a la lengua especializada y la lexicografía plantea el caso hipotético de qué diccionario debería consultar un usuario en caso de necesitar información sobre la noción científica ADN: ¿un diccionario de lengua general o un diccionario especializado? Tal y como el autor señala, la respuesta no es nada evidente, ya que dependerá en cualquier caso de la intención con la que el usuario se haya acercado al diccionario: si sólo busca información lingüística (ortografía, pronunciación, etc.), puede que la información contenida en un diccionario general le satisfaga; si busca información enciclopédica básica (relativa al ADN como descubrimiento científico o su importancia genética), es probable que la encuentre en una obra de carácter enciclopédico, aunque esto último dependerá de la amplitud de la obra consultada y de la necesidad de conocimientos del usuario.
Si, por ejemplo, consultamos la entrada que el Cobuild English Dictionary, 2nd edition ofrece a sus usuarios para el término leukaemia/leukemia encontraremos lo siguiente:
Leukaemia /luki:mia/; spelled leukemia in American English. Leukaemia is a disease of the blood in which the body produces too many white blood cells | .N-UNCOUNT |
En esta entrada, por simplista e incompleta que parezca desde el punto de vista terminológico (y habría que añadir que también desde el punto de vista de un usuario médico, o incluso un posible paciente), el diccionario da a sus usuarios simple y llanamente lo que promete en su introducción: información sobre uso lingüístico. En ella, el usuario puede encontrar la pronunciación de la palabra, su variante gráfica en inglés americano y una definición en lenguaje sencillo y sin referencia alguna a otros términos médicos. Además, debido a la estructuración de las definiciones de los diccionarios Cobuild, el usuario (sobre todo los que no son nativos de la lengua inglesa que son, al fin y al cabo, a los que va dirigido este diccionario) puede ver que es un nombre que se usa sin determinantes, junto con la especificación gramatical N-UNCOUNT (sustantivo incontable) e información sobre la frecuencia de uso.
Quizás un médico, un paciente o un terminólogo pueda pensar que esta entrada es a todas luces insuficiente y que el contenido es impreciso y equívoco,41 aunque en nuestra opinión un diccionario de uso lingüístico orientado a estudiantes de EFL (English as a Foreign Language), con el número de entradas y el tamaño del Collins Cobuild English Dictionary no promete ofrecer más información que esa. Veamos, para seguir con el mismo ejemplo, la entrada correspondiente a un diccionario de carácter lingüístico-enciclopédico, el Collins English Dictionary, 2nd Edition (CED):
leukaemia or esp. U.S. leukemia(lu:ki:mia) an acute or chronic disease characterized by a gross proliferation of leucocytes, which crowd into the bone marrow, spleen, lymph nodes, etc. and suppress the blood-forming apparatus. [C19: from LEUCO- + Greek haima blood] |
En esta entrada, además de la información fonética y la variante ortográfica americana, la definición posee un tinte mucho más técnico que la anterior y ofrece información más detallada al usuario, aunque no incluye información gramatical. Sin embargo, el usuario debe ser capaz de asimilar (y entender) los otros términos usados en la definición, lo que puede ser más complicado de lo que parece a simple vista. Por ejemplo, comienza especificando que la leucemia es un "acute or chronic disease". En efecto, las clasificaciones biomédicas de la enfermedad, clasifican los distintos tipos de leucemia usando el parámetro acute (aguda) o chronic (crónica), pero es poco probable que el usuario del diccionario conozca la diferente sintomatología de un tipo de patología y el otro. En cualquier caso, si decide consultar el (mismo) diccionario para ver la diferencia entre acute disease y chronic disease, podrá deducir que el desarrollo de la enfermedad en el primer caso es muy rápido, mientras que en el segundo se trata de una enfermedad de larga duración, pero no podrá saber qué consecuencias tiene esa característica cuando la enfermedad en cuestión es la leucemia. Además, para entender correctamente la definición del diccionario, el usuario deberá conocer (o consultar) el significado de leucocytes, lymph nodes y blood-forming apparatus. En el (improbable) caso de que el usuario sea muy aplicado y se decida a consultar estas tres entradas, lo más probable es que en ellas, a su vez, se encuentre con otras palabras cuyo significado también desconozca, o que hagan referencia a las entradas ya consultadas: es la bien conocida circularidad de los diccionarios, que en nuestra opinión no es más que un reflejo de la circularidad del conocimiento.La información que aparece al final de la entrada es información etimológica que, quizá más por tradición que por el interés real para los usuarios, se suele incluir en las obras enciclopédicas de prestigio.
La entrada del CED, a pesar de que parezca más completa (y compleja) que la anterior, puede aun ser insuficiente si lo que el usuario busca es información precisa sobre la enfermedad, por ejemplo, sus síntomas, su tratamiento o la esperanza de vida de aquellos que la sufren. Una vez más, consideramos que es de justicia no pedir al diccionario enciclopédico de tamaño medio más de lo que está en posición de ofrecer: información de carácter general, aunque en este caso, la estructura de la definición y el vocabulario usado en la misma pueda resultar difícil para un usuario medio.
El Webster´s Encyclopedic Unabridged Dictionary of the English Language, edición de 1989, (WEUD) de mayor tamaño que el anterior, incluye la siguiente entrada para leukemia:
leu·ke·mi·a (lõõke´mea), n. Pathol. an almost uniformly fatal cancerous disease characterized by excessive production of white blood cells, usually in greatly increased numbers in the blood, and accompanied by often severe anemia and enlargement and hyperactivity of the spleen and lymphatic glands. Also, leu·kae´mi·a, leucemia. Also called leukocythemia, leucocythemia, leucocythaemia. [var. of NL leuchaemia. See LEUCO-, -HEMIA] -leu·ke´mic, leu·kae´mic, adj. |
A diferencia de los dos anteriores, el WEUD incluye un indicador de especialidad (Pathol.), además de la información fonética presente también en los otros dos diccionarios y el indicador de clase gramatical del diccionario Cobuild (aunque menos específico). Si nos detenemos en la definición, vemos que ésta añade información a las dos anteriores. Lo primero es una valoración de las consecuencias de la enfermedad, que además de ser fatalista es en gran medida incorrecta, dado que hoy día la ciencia médica ofrece a la inmensa mayoría de enfermos de leucemia una larga esperanza de vida e incluso la curación completa. En esta valoración también se categoriza la enfermedad como un tipo de cáncer (cancerous disease), información que no aparecía en los otros dos diccionarios y la descripción que se hace de la enfermedad incluye menos términos técnicos que la anterior y añade también información sobre algunos de los efectos que esta enfermedad provoca en el cuerpo humano: anemia y enlargement of the spleen and lymphatic glands. En la parte final de la entrada, el WEUD incluye información sobre las posible variantes de leukemia, si bien es cierto que no hace indicación alguna sobre los posibles usos de esas variantes (leukaemia en inglés británico, por ejemplo), ni identifica una de ellas como la más usual o correcta. Si consultamos las remisiones indicadas al final de la entrada, en la entrada correspondiente a leuco- encontramos lo siguiente:
leuco-, a learned borrowing from Greek meaning "white", used in the formation of compound words: leucocyte. Also, leuc-, leuk-, leuko-. [<Gk leuko-, comb. Form of leukós white; akin to L lúx LIGHT1 ] |
Donde se nos informa del origen de la forma leuco- y de sus posibilidades morfológicas (tanto compuestos como variantes grafémicas). Un usuario medianamente informado podrá reconocer (o consultar) en el ejemplo leucocyte la referencia hecha en la definición de leukemia a los glóbulos blancos, además de obtener más información sobre la etimología de la raíz leuco-. La entrada leukemia también nos remitía a la entrada -hemia:
-hemia, var. of -emia after p, t, k: leucocythemia . |
En la que, aparte de poder reconocer una de las variantes dadas para leukemia (leucocythemia), el usuario deberá consultar otra entrada más para averiguar su significado:
-emia, Med. a suffix referring to the state of the blood: hyperemia. Also, -aemia, -haemia, -hemia. [<NL |
En este caso, lo primero que nos llama la atención es el cambio de indicador de especialidad; ya no aparece Pathol. sino Med., indicador más genérico que el primero, aunque en la introducción del diccionario no hemos encontrado un listado de indicadores de especialidad, ni referencia alguna a posibles diferencias entre los dos indicadores. Con la información de la definición, y si es que el usuario todavía es capaz de recordar dónde comenzó su búsqueda, podrá llegar a la conclusión de que, por etimología, leukemia, procede de la unión de la raíz griega leuco- (white) y -hemia (state of the blood), aunque para ello habrá debido consultar cuatro entradas, algo que parece poco probable, a juzgar por los resultados que se derivan de la observación del uso que un usuario medio se suele hacer de un diccionario (Atkins & Knowles 1988; Hartmann 1989).
Sin embargo, si consultamos la misma entrada en un diccionario que podría considerarse especializado (aunque orientado a un tipo de usuario no especialista en la materia), como es The Cancer Dictionary. Facts on File, Inc. l la diferencia cualitativa y cuantitativa de la información contenida es obvia:
leukemia Rather than cancer "of the blood" as is commonly thought, leukemia is a cancer of the organs that make the blood: the BONE MARROW and LYMPH SYSTEM. Red and white blood cells, platelets, and lymph cells originate in the bone marrow and lymph system, where they "mature" before entering the bloodstream. While the same process takes place in a person with leukemia, the number of cells produced, the rate at which they are produced, and their ability to function are altered.
The term "leukemia" comes from Greek and means "white blood". Although there are some exceptions, such as ERYTHROLEUKEMIA, most leukemias cause white blood cells to reproduce abnormally, which is harmful in several ways. An overabundance of abnormal white blood cells in the bloodstream can infiltrate vital organs and glands, causing them to enlarge and/or malfunction, or they can crowd our healthy cells and prevent the bone marrow from producing sufficient levels of normally functioning red, white, and clotting cells platelets. Leukemia accounts for about 5% of all cancer cases in the United States. In 1992 there were about 28,200 cases diagnosed in the United States and about 18,200 deaths. Leukemia was the most common childhood cancer in the United States in 1990. The most common type of leukemia occurring in children is acute lymphocytic leukemia (ALL), accounting for 45%; it is most likely to occur in children aged 6 or younger. The second most common leukemia in children is acute nonlymphocytic leukemia (ANLL). However, leukemia is far more common in older adults. More than half of all leukemias occur in people of over 60 years of age. Men are affected by leukemia about 30% more often than women. It occurs slightly more often in whites than blacks, and Jewish people have a slightly higher incidence than other whites. About half the newly diagnosed leukemias are acute (immature cells still involved in the growth process are affected and the disease progresses rapidly), and half are chronic (cells in more advanced stage of development and the disease progresses slowly). Chronic leukemia can become acute in some circumstances. The causes of leukemia are not fully understood, but there are factors that are known to increase the risk of developing leukemia. There is evidence that radiation can induce leukemia; the greater the exposure, the higher the risk. There can be delay of up to 20 years before leukemia develops in a person who has been exposed to excessive radiation. In Japan, among the people who survived the largest radiation doses from the atomic bombs, only 1 in 40 developed leukemia, which illustrates that susceptibility to radiation-induced leukemia varies from person to person. Since the potential hazard of excess exposure to X RAYS has become widely known, exposure to it has been declined. A genetic basis of leukemia is uncertain. Studies of families and twins with leukemia have shown a higher incidence than in the general population. It has also been found that leukemia occurs more often with certain congenital (present in birth) defects more often than can be attributed to chance. The role that viruses might play in the development of leukemia is still being investigated. In the middle 1980s, HTLV-1, a human T cell leukemia virus, was isolated and describe by researchers at the National Cancer Institute. It is estimated that only 1 in every 80 people infected with HTLV-1 actually develops leukemia, and it appears that the virus can only be spread by prolonged, intimate contact. Long term exposure to certain chemicals like benzene, found in petroleum and coal-tar distillates, and some drugs have also been linked to leukemia. Some anticancer drugs are believed to be carcinogenic as well. For example, ALKYLATING agents have been associated with the later development of acute leukemia in some patients treated for Hodgkin’s disease or ovarian cancer. People who have been treated with alkylating agents face a slightly higher risk of eventually developing leukemia. The four major types of leukemia and their subtypes are:
The general symptoms of leukemia may include fever and flu-like symptoms; enlarged lymph nodes, spleen, and liver; bone pain, joint pain, paleness; weakness; tendency to bleed or bruise easily; and frequent infections. The general symptoms for CLL can be a general feeling of ill health, fatigue, lack of energy, loss of appetite and weight, or night sweats. It is not uncommon for there to be no symptoms with the disease discovered during a routine examination, or an exam for some other complaint. The symptoms for CML may include fatigue, weight loss, or a sense of fullness of heaviness under the left ribs. The symptoms of ALL and ANLL are varied and can progress rapidly. The lymph nodes, spleen, and the liver may be enlarged. There can be bone pain, paleness, tendency to bleed or bruise easily, and frequent infections. Procedures used in the diagnosis and evaluation of leukemia may include blood tests, bone marrow biopsy, and spinal test. Leukemia can only be definitively diagnosed by microscopic examination of the blood and bone marrow. For staging and treatment information, see the four major types of leukemia -ALL, ANLL, CLL, and CML. |
Esta entrada pertenece a un diccionario sobre cáncer, compilado principalmente con la intención de ofrecer información detallada sobre la enfermedad que sea de ayuda a pacientes y a sus familiares. Quizá por ello no encontramos valoraciones sobre el posible resultado de la enfermedad (como la que aparecía en el WEUD) y las cifras dadas sobre el índice de mortandad se presentan de forma bastante aséptica. El tamaño de la entrada contrasta con la claridad de la estructuración de la información: comienza con una corta explicación del proceso fisiológico que sigue la enfermedad (incluyendo una aclaración a un posible punto de confusión del que dábamos cuenta en referencia a la definición del Collins Cobuild English Dictionary) y señala las referencias a otras entradas del diccionario por medio de un tipo de letra diferente. También ofrece información sobre la etimología del término (mucho menos detallada que en el caso anterior), para enlazarla con una explicación de las consecuencias que el desarrollo de la enfermedad tiene en el cuerpo del enfermo. A continuación le sigue información estadística sobre la incidencia de la enfermedad, tanto por edades como por grupos raciales, una detallada tipología de la enfermedad, las posibles causas que la provocan y la sintomatología y métodos diagnósticos más comunes.
Establecer una comparación entre esta entrada y las anteriores quizá no sea del todo justo, ya que los diccionarios generales, por muy extensos que sean, deben tratar con un número infinitamente superior de entradas a las contenidas en este diccionario específico de los términos relacionados con el cáncer. Sí es importante señalar el carácter pedagógico y explicativo que puede apreciarse en éste último (incluso si sólo nos fijamos en la parte correspondiente a la definición) y que se echa en falta en los demás, ya sea porque la entrada es demasiado simplista (como es el caso del Cobuild) o porque hace demasiado énfasis en la información etimológica en perjuicio de la inclusión de información real sobre la enfermedad (como en el caso del WEUD).
No es nuestra intención aquí hacer una crítica exhaustiva de la información terminológica que contienen los diccionarios de propósito general, simplemente hemos querido ofrecer una pequeña muestra de la cantidad (y calidad) de información que un usuario medio puede obtener sobre un término si acude a uno de estos diccionarios.
A pesar de que estas entradas sean insatisfactorias desde el punto de vista terminológico (y en algunos casos incluso desde el punto de vista de la lengua general), se estima que un 40% de las entradas de los diccionarios generales (en especial los de carácter enciclopédico) corresponden a unidades léxicas de un área de especialidad (Landau 1989; Ahmad et al 1995), por lo que los diccionarios generales han sido considerados como fuentes potenciales de información terminológica, sobre todo aquellos que pueden encontrarse en formato magnético.
El uso de los diccionarios en formato magnético como fuentes de información léxica no es una idea nueva; parte de los primeros intentos de reutilización de recursos léxicos hechos a principios de los años 60, en los que se investigó la posibilidad de usar la información contenida en diversos diccionarios electrónicos para la construcción automática (o semi-automática) de bases de datos léxicas. Los diccionarios más usados desde los años setenta hasta nuestros días en este tipo de investigación han sido las versiones electrónicas del Oxford Advanced Learner’s Dictionary of Current English (OALD), Collins Cobuild English Dictionary, Longman Dictionary of Contemporary English (LDOCE) y Webster’s Seventh Collegiate Dictionary. El proceso seguido, así como los resultados obtenidos pueden encontrarse en, por ejemplo, Boguraev & Briscoe (1989), Boguraev (1991), Atkins (1991), Wilks et al (1996) y Pérez, Moreno & Faber (1999). Los problemas fundamentales que estos investigadores encontraron a la hora de extraer la información contenida en los diccionarios electrónicos para emplearla en la construcción de lexicones computacionales no difiere, en esencia, de los que se han planteado en los intentos de usarlos como posibles fuentes para la creación de repositorios terminológicos.
El problema fundamental es que los diccionarios están diseñados por humanos y para ser usados por humanos. Estos usuarios (humanos) son hablantes nativos de una lengua, que saben, al menos implícitamente, como está estructurado el lexicón de su lengua, de modo que los lexicógrafos, a la hora de compilar un diccionario, explotan el conocimiento lingüístico de sus usuarios potenciales, incluyendo en las entradas del diccionario sólo la información necesaria para que un hablante de una lengua sea capaz de conectarla con su conocimiento lingüístico general. Incluso los diccionarios diseñados especialmente para los estudiantes de una lengua (learners’ dictionaries) tienen en cuenta las propiedades generales del lenguaje, aunque contengan información mucho más detallada (sobre todo a nivel sintáctico y de uso) que cualquier otro tipo de diccionario.
Por otra parte, la mayoría de los diccionarios existentes (tanto en formato electrónico como impresos) han sido compilados por equipos de lexicógrafos que trabajan bajo grandes presiones de tiempo y espacio. Esto provoca que la mayoría de ellos sean inconsistentes e incompletos (véase Boguraev & Briscoe 1989; Atkins, Kelg & Levin 1988; Levin 1991), y que, por ejemplo, palabras que tienen un comportamiento similar (sintáctico, morfológico, semántico, etc.) no reciban un tratamiento paralelo en los diccionarios, ya sea por falta de tiempo, por haber sido compiladas por diferentes lexicógrafos, o simplemente porque el lexicógrafo no fue capaz de reconocer las similitudes.
A estos problemas habría que añadir la dificultad que supone la extracción, no ya de la información explícita contenida en las entradas de forma más o menos consistente, sino la extracción de la información implícita, es decir, la expresada por medio de la estructuración de la entrada del diccionario, el formato de los tipos de letras y los diferentes estilos usados que en muchas ocasiones señalan diferentes secciones y tipos de información (como era el caso del Cancer Dictionary, donde las referencias a otras entradas estaban indicadas por medio de versalitas, o en el WEUD, donde la etimología se indicaba por el signo "<", y en otros casos por "See").
A los problemas que plantea la inconsistencia, tanto en la forma como en la estructura de las entradas, en el caso de la utilización de los diccionarios generales como fuentes de información terminológica hay que añadir la falta de consistencia o de información explícita (como vimos en nuestro ejemplo del WEUD) en el uso de los indicadores de área de especialidad, junto con la dificultad que supone separar la información que puede considerarse terminológica de lo que representa información general, ya que en la mayoría de los casos, la acepción terminológica aparece como una acepción dentro de una entrada polisémica, y su localización no es siempre fácil.
Tanto en Ahmad et al. (1995) como en el apéndice del informe POINTER se muestran los resultados obtenidos del estudio de los términos incluidos en cinco diccionarios generales (tanto monolingües como bilingües). En ambos informes, a los problemas ya mencionados se añaden la extensión indiscriminada de indicadores de área de especialidad y la falta de precisión en la estructura de las definiciones. En la mayoría de los casos, las definiciones no pueden usarse para localizar el área de conocimiento al que se adscribe el término ni, por supuesto, para relacionar términos que pertenezcan al mismo área.
A pesar de que todos estos problemas hacen que la extracción de información terminológica de los diccionarios generales no sea una solución factible (o al menos rentable) en la actualidad, las dos fuentes citadas anteriormente proponen una serie de soluciones a medio y largo plazo para que esto pueda realizarse en el futuro. La principal de estas soluciones pasa por la estandarización del formato de representación de la información léxica y el empleo uniforme y coherente de los sistemas de clasificación establecidos. Ya mencionamos este problema en el apartado 3.1.2 en referencia a la reutilización de los recursos terminológicos, pero es indudable que esta problemática se extiende también a los recursos léxicos de carácter general.
Para terminar este apartado nos gustaría mostrar una entrada que pertenece a un repositorio terminológico altamente especializado que estudiaremos con más detalle en el apartado 4.3.3.3: la entrada del concepto leukemia en el UMLS (Unified Medical Language System), proyecto de investigación y desarrollo financiado por la NLM (National Library of Medicine) del U.S. Department of Health and Human Services. Con este proyecto se pretende facilitar la recuperación e integración de la información contenida en diferentes fuentes de información biomédicas existentes en formato electrónico, de forma que puedan usarse en una gran variedad de aplicaciones, tanto clínicas como relacionadas con la gestión de bases de datos bibliográficas o factuales o en sistemas expertos.
La siguiente entrada del UMLS ilustra claramente la diferencia que existe entre un repositorio de información estructurado y los ejemplos vistos de diccionarios generales y diccionario especializado:
Figura 13: Información del concepto leukemia en el Metathesaurus del UMLS.
La primera gran diferencia entre ésta entrada y las anteriores es que en este caso estamos tratando con el "concepto" leukemia, ya que la información lingüística referente al término que designa este concepto está almacenada en un repositorio diferente (el denominado Specialist Lexicon). Lo más relevante de este repositorio es que unifica diferentes nomenclaturas, todas ellas de gran difusión en la comunidad científica biomédica. En el primero de los campos (sources) se nombran todas la fuentes donde aparece una referencia al concepto leukemia (en este caso son quince, pero podrían ser más de cincuenta). Esta información es expandida en el campo synonyms, donde se especifica las distintas formas que cada uno de esos repositorios usa para referirse a ese concepto. Además de esta información, el UMLS ofrece una definición (en la que se reconoce la fuente de donde se ha extraído) y un listado de equivalentes en otros idiomas, junto con una indicación de la clase semántica (semantic type) en la que el concepto leukemia se encuentra dentro de una red de relaciones semánticas denominada Semantic Network.
A pesar de su enorme utilidad como sistema de referencia y de la importancia que posee como elemento unificador de diferentes nomenclaturas, existen muchos aspectos en los que resulta un repositorio terminológico de reducidas aplicaciones (falta de información lingüística y terminológica, estructuración de las definiciones, establecimiento de las relaciones semánticas, etc.). Pese a su clara orientación terminológica (parte del concepto para llegar al término), la información real que contiene, tanto sobre los conceptos como sobre los términos que los designan, es en la mayoría de los casos insuficiente, ya que suele ser demasiado general o poco informativa para ser de utilidad tanto a especialistas o como a legos en la materia. Profundizaremos más en estos aspectos cuando mostremos con mayor detalle la información contenida tanto en el Metathesaurus como en las demás fuentes de información que ofrece el UMLS.
Notas
41 La leucemia ha de definirse, como aparece reproducido más adelante en la entrada extraída del Cancer Dictionary, no como un cáncer de la sangre, sino de los órganos encargados de la formación de la sangre.
ISSN: 1139-8736 Depósito Legal: B-39120-2002 Copyright: © Chantal Pérez |