cap1

ISSN: 1139-8736
Depósito Legal: B-8929-00

1. Marco general y cuestiones preliminares

La lingüística computacional trata de la formalización o codificación del lenguaje natural en un lenguaje formal, tratable por medios informáticos con fines aplicados diversos, tales como traducción automática, acceso a bases de datos, extracción de información de textos o comunicación con sistemas informáticos -es decir, con lenguajes formales- mediante el lenguaje natural. En la última década, gran parte de la investigación en lingüística computacional se ha centrado en la semántica léxica, a partir de la constatación de que una parte muy considerable de la información lingüística reside, o puede ser explicada, a partir de la información contenida en las entradas léxicas.

Coexisten en este momento diversos tipos de aproximación a la lexicografía computacional, cada uno de ellos con diversos grados de compromiso con respecto a formulaciones teóricas del campo de la lingüística, la psicolingüística, la filosofía del lenguaje o la ciencia cognitiva. Aunque en último término la lingüística computacional, no depende de forma inexcusable del seguimiento de una u otra teoría lingüística o cognitiva, resulta obvio señalar que, con carácter previo a la formulación de cualquier tipo de representación computacional del lenguaje, es preciso haber tomado antes cierto tipo de decisiones previas acerca de cómo se va a abordar el lenguaje natural y qué aspectos del mismo se considera preciso representar.

Para los propósitos finales de este trabajo -la formulación de representaciones lingüísticas tratables computacionalmente- entenderemos en principio la lingüística, en un sentido ciertamente amplio, como la descripción de una lengua; y de forma más específica, como la construcción un modelo de las regularidades que, a juicio del lingüista, se manifiestan en el uso de una lengua. Ello implica asumir la idealización estructuralista del lenguaje como sistema ontológicamente exterior a los hablantes (aunque por supuesto conocido, compartido y usado por ellos con objetivos semióticos varios). Asimismo, el objeto de la descripción, 'la lengua', se entenderá como 'una lengua' en particular, en este caso el castellano. Cabe resaltar que ambas asunciones son de tipo metodológico; por consiguiente no entraré aquí en disquisiciones sobre la entidad real del lenguaje bien como sistema, bien como capacidad mental (competencia), o sobre las presuntas cualidades de universalidad o innatismo que puedan atribuírsele.

Sin embargo, estas consideraciones no deben ser entendidas como un modo de desentenderse de la teoría. Por el contrario, los modelos de representación del conocimiento son en gran medida deudores de modelos o ideas provinentes de los campos de la psicolingüística y la ciencia cognitiva; existiendo un notable consenso en la comunidad investigadora respecto a que los modelos computacionales del lenguaje deben ser, en la medida de lo posible, un reflejo de los modelos mentales. Siendo el lenguaje una facultad cognitiva humana, es de esperar que un modelo formal del lenguaje resultará tanto más acertado en cuanto mejor modelo sea de dichas facultades cognitivas. Éste es también mi convencimiento. Como podrá comprobarse en lo sucesivo, las representaciones computacionales que formularé a lo largo de este trabajo estarán basadas en ideas provinentes de la psicolingüística y la ciencia cognitiva; en especial en el modelo relacional de la memoria léxica, en la gramática cognitiva, y en las hipótesis semántico-conceptuales de Jackendoff.

Por otra parte, formular algún tipo de análisis o representación del léxico de una lengua, implica, por una parte, utilizar una terminología metalingüística para manejarse en dicho terreno; y por otra, pretender que de algún modo se está representando o aludiendo a algo de tan difícil definición como es 'el significado' de las palabras. Como es sabido, la elucidación de qué es o qué puede entenderse exactamente por significado así como, de forma inseparable, la definición de términos tales como 'significado', 'sentido', 'referencia', 'denotación', 'designación', etc., es una materia que ha ocupado y sigue ocupando a filósofos y lingüistas como mínimo desde la Grecia clásica. No puedo pretender terciar en tan arduo debate, sino tan sólo situarme mínimamente en dicho marco a fin de utilizar una terminología metalingüística lo menos gratuita posible. Para ello describiré en primer lugar de modo necesaria y deliberadamente esquemático los modelos fundamentales o tendencias mayoritarias a partir de las cuales se han desarrollado la mayor parte de formalismos de representación del significado.

Básicamente, existen dos tipos de aproximación a lo que pueda significar el 'significado' de una expresión de un lenguaje: una (habitualmente denominada 'realista') que parte de Aristóteles, y otra (a la que podríamos llamar 'abstraccionista') que emerge de la obra de Platón.

Ambas aproximaciones comparten la muy sensata asunción de que existe la realidad, es decir, el mundo nuestro de cada día, con sus gatos, sus alfombras, sus árboles, sus sillas y sus taburetes; y también la constatación de que la organización de dicho mundo en entidades individualmente designables no es en absoluto un asunto trivial (son famosas en semántica lingüística las discusiones sobre qué es una silla y qué un taburete; tampoco es fácil decir si una mecedora o una silla eléctrica deben ser contadas como sillas; o si cada árbol viene determinado por la existencia de un tronco, o quizá por la existencia de un conjunto común de raíces, bajo tierra o a una distancia prudencial -¿cuál?- sobre el nivel del suelo). Sin embargo, una y otra difieren en que mantienen posturas radicalmente diferentes sobre si un lenguaje (el lenguaje natural o cualquier otro) puede o no (y si puede, cómo) describir el mundo, o 'referirse' a él.

La aproximación realista mantiene que las unidades del lenguaje refieren directamente a entidades del mundo (ver fig. I.1). Los desarrollos basados en la misma utilizan para tal propósito la herramienta formal denominada 'conjuntos': dado un universo (que por otra parte puede ser el mundo físico, un mundo abstracto, o cualquier mezcla de ambos), las entidades en él vienen de un modo u otro individualizadas, y estas individualidades se agrupan de forma natural en clases, definibles mediante condiciones necesarias y suficientes, y por tanto formalizables mediante conjuntos. En los modelos derivados de la aproximación realista no importa demasiado saber cómo se produce la individuación, de hecho puede producirse de infinitos modos: lo relevante es que cada modo de individuación corresponde a posibles conjuntos. Así, puede haber un conjunto que contenga todo tipo de sillas, sillas eléctricas incluídas, otro que no incluya sillas eléctricas pero sí tronos y mecedoras, y un tercero que incluya sillas, sofás, serpientes venenosas y personajes de "El Quijote".

Fig. I.1: La significación según el modelo realista

Por contra, desde un punto de vista platónico o abstraccionista, se considera que un lenguaje no puede referir al mundo, sino únicamente a un universo consistente en abstracciones u objetos de orden matemático, cuya naturaleza ontológica es completamente disjunta de la de las colecciones de objetos del mundo real (ver fig. I.2).

Fig. I.2: La significación según el modelo abstraccionista

Ambos modos de comprender la significación de un lenguaje son formalizables, y de hecho han sido formalizados, mediante una semántica teórica de modelos, es decir, un sistema consistente en (i) un lenguaje o formalismo que disponga, entre otros recursos, de nombres (propios) para individualidades y nombres (comunes) para conjuntos de ellas; (ii) un universo (o múltiples universos posibles) que conste de individualidades de referencia; y (iii), un conjunto de valores de verdad (Verdadero y Falso) que relaciona uno con otro.

En todo caso, la diferencia fundamental entre las aproximaciones realista y abstraccionista es que en la segunda, al contrario de lo que sucede con la primera, el universo del discurso no puede en ningún caso entenderse como el mundo. Por tanto, dicha aproximación introduce la noción de un tercer nivel de representación semántica: un nivel abstracto distinto de los niveles del lenguaje y del mundo de referencia. Desde este punto de vista, que ha dado origen a la mayoría de los modelos semióticos y lingüístico-semánticos que hoy nos son familiares, el lenguaje (A) puede describir el mundo (C), pero debe hacerlo a través de la mediación del nivel abstracto intermedio (B). Por contra, desde el punto de vista realista, A y B son básicamente la misma cosa: los signos de A no son sino nombres para las categorías de B.

Los principales herederos de la concepción platónica del significado son el modelo de Frege (1892) y el de Ogden y Richards (1923). En este último -en el que ya se entiende abiertamente 'lenguaje' como 'lenguaje natural'- los tres niveles son los denominados (A) Símbolo, (B) Pensamiento y (C) Referente (ver fig. I.3), los cuales, según Hayes (1994), deben ser entendidos como A:Lenguaje, B:Significado, C:Mundo. La noción subyacente, sin embargo, no es en absoluto novedosa, dado que puede ser hallada anteriormente (cf. Serrano, 1983) en los estoicos (que diferencian "aquello que es significado", "aquello que lo significa" y el "objeto"), en San Agustín (quien en 'De Dochtrina Cristiana' asimismo plantea una distinción entre signo, significado y cosa) y en los escolásticos medievales (cf. Ullmann, 1962), que acuñaron la máxima "vox significat mediantibus conceptibus" (la palabra significa mediante los conceptos).

Fig. I.3: El lenguaje según el modelo de Ogden y Richards (I)

Este tipo de modelos suele ser representado gráficamente de modo más habitual mediante un triángulo como en la fig. I.4, en el que, dependiendo de cada aproximación en particular, cada nivel (especialmente el nivel abstracto, B) y cada relación entre niveles goza de distinta naturaleza ontológica, recibe distinto tipo de contenido y, en definitiva, es denominado de forma diferente. En todo caso, se asume que el nivel B es, aparte de un nivel abstracto, algún tipo de estructura o representación mental, llámesele 'pensamiento', 'idea', 'significado' o 'concepto'. En cuanto a las relaciones que ponen en correspondencia a los niveles de representación, Ogden y Richards las denominan de la siguiente forma: un símbolo 'simboliza' un pensamiento (r1); un pensamiento 'refiere' a un referente (r2); y un símbolo 'representa' a un referente (r3).

Fig. I.4: El lenguaje según el modelo de Ogden y Richards (II)

El diagrama de la fig. I.4, sin embargo, no contempla la posibilidad de que, permaneciendo un referente inalterado, el significado de un nombre pueda cambiar para el hablante, sea por causa de alguna alteración en la percepción, en el conocimiento o en el sentimiento hacia el mismo.

Frege (1892) sí había abordado el problema, estableciendo la distinción del contenido significativo entre 'referencia' -bedeutung- y 'sentido' -sinn-, según la cual dos signos (p.e. 'el lucero del alba' y 'la estrella de la noche') pueden tener un mismo referente (el planeta Venus), pero diferente 'sentido'; e incluso un signo (p.e. 'el cuerpo celeste más alejado de la tierra') puede tener sentido pero es dudoso que tenga referencia.

En la terminología de Frege, un 'signo' expresa un 'sentido'; un 'sentido' designa una 'referencia'; y un 'signo' tiene una 'referencia' -ver fig. I.5-.

Es preciso hacer notar dos aspectos que diferencian al modelo fregeano de los modelos mentalistas al estilo del de Ogden y Richards.

Fig. I.5: La significación según el modelo de Frege

En primer lugar, adviértase que para Frege, el 'sentido' no es la representación que se pueda formar en la mente: la representación mental es un objeto individual y subjetivo, mientras que el 'sentido' fregeano es un ente objetivo, propiedad común de muchos y susceptible de ser transmitido de generación en generación. En consecuencia, no debe confundirse el nivel B de Odgen y Richards -de orden mental- con el nivel B de Frege, el 'sentido' -de orden estrictamente abstracto-.

Fig. I.6: Comparación de los modelos platónico y fregeano

En segundo lugar, debe hacerse notar que para Frege, el nivel de los referentes no es el mundo real, sino el mundo de los conceptos (en los que, en su terminología, 'caen' los objetos o extensiones del mundo real, pero que no son objetos del mundo real). Por consiguiente, el triángulo signo-sentido-referente -o en su equivalente para expresiones: expresión-sentido-concepto- de la semántica de Frege, no es análogo al triángulo de Ogden y Richards (fig. I.4) ni al genérico de los modelos platónicos (fig. I.2), dado que en Frege el mundo real de nuestras cosas cotidianas no juega papel directo alguno (únicamente el papel indirecto de 'caer' en clases de referentes). Por contra, el nivel B (o 'sentido') de Frege debe ser interpretado como un nuevo nivel interpuesto entre los niveles A y B de los modelos filoplatónicos, correspondiendo el nivel C de Frege ('referentes'/'conceptos') al nivel B de estos últimos (ver fig. I.6).

Finalmente, apuntemos que el modelo semántico fregeano también es representable, por supuesto y por antonomasia, mediante una semántica teórica de modelos.

Otra manera de enfocar el asunto, la cual parece representar la primera gran alternativa a los modelos platónico y aristotélico, es la que emerge de los trabajos de Putnam (1981) en filosofía, Rosch (p.e., 1973) en psicología cognitiva, Langacker (1991) en lingüística, y otros en diversos campos, y se compendia y extiende en Lakoff (1987): la aproximación 'constructivista' o 'cognitivista'. El punto básico de dicha aproximación es la negación de la validez como teorías semánticas de los modelos basados en aparatos lógico-simbólicos (conjuntos, condiciones de verdad, etc.) en tanto en cuanto "el significado no puede ser caracterizado por la manera en que unos símbolos son asociados a cosas en el mundo" (Lakoff, op.cit.). El cognitivismo desplaza del centro del debate semántico a los formalismos y sitúa en su lugar al hombre y a sus capacidades (cognitivas) de comprensión o 'construcción' de la realidad externa.

Una visión prejuzgadora del cognitivismo, como la propia de Hayes (1994), considerará la aproximación como confusa y en definitiva poco científica en tanto la entiende como poco menos que la asunción de una incapacidad para referirse al mundo real; y podrá emparentarla, peyorativamente, con la idea de Whorf (1956) de que el mundo exterior, sin el lenguaje, no es mas que un caos inefable. Una visión filosóficamente favorable, por contra, la emparentará con el más prestigiado Wittgenstein (p.e., 1953) en el sentido de que no debe abordarse el problema de la significación como un terreno en el que las palabras sean las protagonistas exclusivas en tanto que objetos autónomos contenedores de significado.

El cognitivismo reclama la influencia de Wittgenstein en varios aspectos, y no rechaza de plano la de Whorf (y Sapir); pero lo que en ningún caso debe entenderse acerca de esta aproximación es que (como parece entender Hayes) niegue la existencia o la posibilidad de acceso a una realidad objetiva. El cognitivismo simplemente dice que no puede existir una descripción objetivamente correcta de la realidad, sino que existen múltiples maneras de describirla o comprenderla, y en todo caso éstas son fruto de una construcción (mental, y más o menos antropocéntrica) que hacen los hablantes de la propia experiencia.

El modelo cognitivista puede ser representado esquemáticamente del mismo modo que el de Ogden y Richards (1923) (ver fig. I.4) ya que también en éste se postula la existencia de objetos mentales que median entre el lenguaje y el mundo externo. La diferencia fundamental radica en la naturaleza de los mismos. En primer lugar, para el cognitivismo dichas estructuras no son estrictamente lingüísticas sino que forman parte de los sistemas cognitivos generales y, de manera decisiva, no se consideran objetos con referencia en entidades del mundo real (u otros mundos posibles) sino modos de aprehenderlo y construirlo en la mente. Por otra parte, las clases mentales en que se organiza dicho conocimiento no pueden ser vistas como conjuntos de elementos sino como categorías difusas definibles a partir de prototipos (ejemplares centrales o idóneos) o esquemas estereotípicos.

En otro orden de cosas, se considera que dicho sistema de representaciones mentales es, como en el caso del 'sentido' de Frege, algo compartido por los hablantes de un mismo sistema cultural (típicamente con reflejo en un mismo sistema lingüístico); y, como en los modelos de inspiración platónica, la relación de significación básica se establece entre el nivel lingüístico (A) y dicho nivel abstracto (B).

El modelo cognitivista, por definición, no es representable, mediante una teoría semántica de modelos.

Los modos básicos de entender la significación que hasta aquí hemos esbozado (el realista o aristotélico, el platónico-fregeano, y la alternativa constructivista a los dos anteriores) son filosóficamente irreconciliables. Sin embargo, ello no debe sumir en el desconcierto al lingüista computacional de modo que su trabajo quede bloqueado a la espera de la resolución de tales problemas filosóficos. La función del procesamiento computacional del lenguaje es la resolución de problemas observables en el comportamiento del nivel A (el lenguaje); lo cual es realizable utilizando un sistema de representaciones formales que, en principio y como marco de trabajo, puede ser independiente de modelos epistemológicos.

En los modelos computacionales del significado habitualmente utilizados, como los que se manejarán en este trabajo, se asocia a los signos lingüísticos información codificada mediante representaciones formales tomadas de un metalenguaje y ancladas en algún nivel a entidades de un universo ontológico de referencia formado por símbolos denominados tipos. En este orden de cosas las representaciones de los signos lingüísticos pueden ser tomadas como los signos (nivel A de los diferentes modelos semánticos) y la ontología de referencia como un modelo del mundo extralingüístico (cuyo status comentaremos a continuación, pero que es asimilable en términos generales al nivel C de Frege en tanto que, por su propia naturaleza, no puede ser una representación objetiva del mundo, sino un modelo interpretado del mismo).

En un sistema de representación computacional, el haz de información semántica asociada a cada signo lingüístico puede se tomado como el nivel B, interpuesto entre los signos y el universo de referencia. No es necesario a efectos de representación mantener una postura beligerante sobre la naturaleza epistemológica de dicha representación semántica. Basta con asumir simplemente que se trata de un nivel intermedio entre los significantes lingüísticos y el mundo extralingüístico, necesario a efectos explicativos. A grandes rasgos puede ser considerado como el significado en un sentido vagamente saussuriano, pero un realista podrá tratar dicha representación en términos de conjuntos (y definirlos por extensión o intensión); un platónico podrá verla como una abstracción o concepto; un fregeano como el 'sentido'; y un cognitivista como un modelo cognitivo.

Desde este punto de vista, las representaciones computacionales del lenguaje pueden ser interpretadas, mediante el esquema triangular habitual, como en la fig. I.7.

Con el fin de fijar la terminología que utilizaré en el resto del trabajo -en definitiva éste es el objetivo fundamental de este capítulo- es preciso considerar con mayor detalle el papel del nivel C o mundo del que son modelo las ontologías de tipos en los sistemas computacionales. Asumiremos en primer lugar que, como indica el sentido común, existe el llamado mundo real, o nivel de las entidades directamente aprehensibles a través de los sentidos y de los hechos o situaciones en que dichas entidades se ven inmersas. Asumiremos asimismo que es posible utilizar el lenguaje para aludir al mundo y así comunicarse o interaccionar con otros hablantes. A la relación que se establece en el proceso comunicativo entre las expresiones del lenguaje y las entidades o hechos del mundo le denominaremos referencia. Así, diremos que las expresiones 'Micifuz', 'aquel gato' o 'el gato de mi padre' refieren a una misma cierta entidad del mundo real.

Fig. I.7: Interpretación de las representaciones computacionales
en un esquema semántico triangular

La adopción del término 'referencia' para indicar esta relación es, aparte de habitual, de clara estirpe fregeana; y es preciso recordar al respecto que en puridad los referentes de Frege no son objetos del mundo, sino a los conceptos bajo los que caen dichos objetos. En otras palabras, el nivel C de Frege no es el mundo real sino una clasificación del mismo. Lo mismo ocurre con el universo ontológico de referencia en los modelos computacionales: por tratarse de un modelo no puede ser sino una clasificación, en definitiva una interpretación, del mundo extralingüístico.

Indudablemente, por múltiples motivos antes apuntados y ampliamente discutidos desde Aristóteles hasta nuestros días, la anterior asunción, con parecer razonable, es claramente insuficiente, ya que evidentemente no toda expresión lingüística tiene un correlato evidente en el llamado mundo real. Hasta este momento no hemos hablado de unicornios, y eso debe reputarse como un defecto grave para cualquier aproximación a la semántica, por generalizante que, como ésta, sea. Es evidente que, aunque en el mundo real no existen unicornios (ni los personajes de El Quijote; ni pueda demostrarse que existan los protones o la justicia; ni esté ni mucho menos clara la existencia objetiva del mes de septiembre), los humanos -especialmente los lógicos- hablan de unicornios (y también de Sancho Panza, de protones, de la justicia y del mes de septiembre).

Lo más sensato al respecto es suponer que tal tipo de cosas, si no son del mundo (C), deben ser de B. Sin embargo habíamos reservado B para conjuntos, significados, intensiones, conceptos, o categorizaciones de entidades, no para entidades en particular; y nadie puede impedir que a alguien le apetezca hablar de ('referirse a') el unicornio de Ctesias, el cual dicen fue visto hacia el año 400 a.d.C. Dicho ejemplar de unicornio, por poco probable que sea su existencia, debe considerarse como perteneciente a la más general clase de los unicornios. Luego la expresión 'el unicornio de Ctesias', aparte de manejar el concepto [unicornio], implica algún tipo de referencia a un unicornio en particular. Pero referencia, ¿dónde?

La solución de compromiso la hallaremos acogiéndonos a la muy veterana noción lógica de los mundos posibles. Asumiremos que los unicornios son entidades de C, un C que ciertamente no es el mundo de las cosas tangibles nuestras de cada día, pero que a efectos comunicativos funciona como si lo fuera. En privado admitiremos que el C de los unicornios no es más que una ficción, una construcción de la mente, pero desde el momento en que dicha ficción es (o puede llegar a ser) compartida por hablantes distintos -en caso contrario no podría existir la comunicación y el lenguaje perdería la función que hace que nos ocupemos de él-, asumiremos que los hablantes están de acuerdo en que una palabra como 'unicornio' tiene referencia en un universo (C) sobre el cual se puede hablar.

Tal asunción coincide básicamente con la noción de 'espacio mental' (Fauconnier, 1994), constructo teórico que sirve de marco para la fijación de la referencia en gramática cognitiva. Desde esta óptica, por ejemplo, 'Sancho Panza' se tomará como una expresión con referencia en el universo o 'espacio mental' que conocemos como 'El Quijote'.

A tal respecto, es digna de ser tomada en consideración la idea de que dichos 'espacios mentales' o 'mundos posibles' están construidos en la mente de los hablantes a imagen y semejanza del mundo real, de forma que la maquinaria fundamental de referencia al mundo real es aplicable a la de los mundos posibles.

Un ejemplo muy ilustrativo de cómo conceptos y entidades no reales se construyen a partir de conceptos y entidades realmente perceptibles podemos hallarlo en el mundo literario de Lovecraft. Como es sabido, las criaturas de Lovecraft son de índole considerablemente mucho más alejada de cualquier referente real que, por ejemplo, los personajes de El Quijote; sin embargo, tal universo literario, pese a su extrema extravagancia, es transmitido al lector de forma que éste puede compartirlo (y éste a su vez referirse a él en conversación con otras personas, por ejemplo, pero no necesariamente, con otros lectores de Lovecraft); luego tal universo de referencia es susceptible de funcionar, en la comunicación lingüística, del mismo modo que el mundo real. ¿Cómo se consigue ello? Como podremos comprobar en el párrafo siguiente (descripción de un monstruo, extraída de 'El horror de Dunwich'), no de otro modo que por el recurso constante a la analogía con conceptos con referencia en la realidad:

Es mayor que un establo... todo hecho de cuerdas retorcidas... tiene una forma parecida a un huevo de gallina, pero enorme, con docenas de patas... como grandes toneles medio cerrados que se echan a rodar... no se ve que tenga nada sólido... es de una sustancia gelatinosa y está hecho de cuerdas sueltas y retorcidas, como si las hubieran pegado... tiene infinidad de enormes ojos saltones... diez o veinte bocas o trompas que le salen por todos los lados, grandes como tubos de chimenea, y no paran de moverse, abriéndose y cerrándose continuamente... todas grises, con una especie de anillos azules o violetas... !Dios del cielo! !y ese rostro semihumano encima...!

LOVECRAFT, H.P. (1925) El horror de Dunwich [tr. esp. en Alianza Editorial. Madrid, 1993].

En todo caso, una representación computacional del léxico de una lengua debe aspirar a representar todo tipo de léxico, tanto el que se entiende como con posible referencia en el mundo real como el que designa cualquier otro tipo de entidad imaginaria o imaginable. Para ello, el modo de proceder sin quedarse atorado en disquisiciones filosóficas pasa por asumir que el universo de referencia en las representaciones computacionales (nivel C en la fig. I.7) incluye no únicamente a las entidades con existencia real sino también a aquéllas con existencia en cualquier otro mundo expresable mediante el lenguaje.

En un sistema de representación basado en estructuras de rasgos como el que utilizaré, los rasgos utilizados para la descripción han sido definidos previamente, como se ha dicho, en una ontología de tipos, que se asume como un modelo -más o menos acertado, y sin duda, como mínimo, incompleto- de las clases de entidades que conforman el conocimiento compartido por los hablantes de una lengua. En consecuencia, por ejemplo, en dicho formalismo se podrá expresar sin mayores remordimientos filosóficos que Sancho Panza tiene brazos, cabeza y piernas; y que un unicornio es como un caballo pero con un cuerno en la frente; siendo suficiente que [brazo], [pierna], [caballo], [cuerno], [unicornio] o [Sancho Panza], sean tipos definidos en la ontología; y sin que tenga mayor relevancia el que tales conceptos sean susceptibles de tener referencia en el mundo real, en un espacio mental de Fauconnier, o en alguna otra especie de mundo posible. Como corolario, también dicho universo de referencia podrá (probablemente deberá) contener los objetos del metalenguaje utilizado en las representaciones.

Veamos un ejemplo de dicho panorama en la fig. I.8, en donde una representación parcial de un sistema de tipos (nivel C) contiene el universo general que es modelo del mundo de referencia, incluídos objetos imaginarios -como los unicornios- y abstractos -como los objetos del metalenguaje, incluidos los signos lingüísticos (nivel A) y las representaciones semánticas a ellos asociados (nivel B)-.

Fig. I.8: Sistema de tipos (parcial) de una representación computacional

Por supuesto debe constatarse que la categorización o clasificación de entidades no es un asunto que esté en absoluto claro; es más, es probable que no sea objetivamente decidible; pero, una vez más, confiaremos en que existe algún tipo de convenio implícito o convención al respecto que los hablantes de una lengua conocen y comparten; y en definitiva, las representaciones lingüístico-computacionales del mundo de referencia simplemente aspiran a ser un modelo de dicho conocimiento compartido que sea utilizable para un cierto número de aplicaciones de ingeniería del lenguaje.

Sentado todo lo anterior, fijemos por fin los términos que en lo subsiguiente voy a emplear para referirme a los objetos de B y sus relaciones con A y C. Habrá que hacer al respecto una nueva precisión. Hasta ahora hemos venido hablando de forma genérica de los niveles A (lenguaje, signos, palabras), B (conceptos, significados) y C (mundo). Sin embargo es preciso distinguir entre la semántica léxica y la semántica de las expresiones en el discurso. La segunda se fundamenta en la primera. En el primer caso la intención es caracterizar objetos abstractos, informalmente, 'palabras' (como por ejemplo 'gato'), que pueden tomar diversas formas (por ejemplo, 'gatos'), que se suelen nombrar mediante una de sus formas, llamada 'lema' (por convención, en castellano, para nombres es la forma singular, para verbos la infinitiva, para adjetivos la masculina singular), y que son susceptibles de ser utilizadas bajo alguna de sus formas en las expresiones lingüísticas (como por ejemplo en 'el gato de mi padre'). Es preciso pues distinguir entre dos triángulos A-B-C, el lexicológico y el de las expresiones.

· En el modelo de las expresiones (ver fig. I.9), siguiendo, como se ha dicho antes, de forma laxa a Frege, llamaremos a los elementos del nivel A, expresiones (p.e. 'el gato'); y a sus correspondencias en el mundo (nivel C), referentes. A las correspondencias de las expresiones de A en el nivel B las llamaremos conceptos o significado de A. No creo que sea precisa una denominación especial para la relación de correspondencia entre significados (B) y referentes (C), pero en todo caso si hay que mencionarla será también como una relación de referencia (desprendiéndose del contexto que se trata de una vía indirecta de referencia). En cuanto a convenciones de notación, en lo subsiguiente utilizaré la forma entre comas simples para el nivel A, una expresión entre corchetes para el B, y ninguna notación en particular para el nivel C. Así, diremos que la expresión 'el gato de mi padre' significa [el gato de mi padre]; y que 'el gato de mi padre' se refiere al gato de mi padre.

Fig. I.9: Terminología relativa a las expresiones

· En el triángulo léxico-semántico (ver fig. I.10), denominaremos a los elementos de A (abstracciones de las formas posibles de las palabras, unidades de significado léxico) lexemas, siguiendo la tradición filológica habitual. A su relación con los elementos de B (conceptos o significados) la denominaremos, siguiendo a Lyons (1977), denotación. Aunque quizá de forma estricta no quepa considerar que exista relación entre los lexemas y los referentes o entidades del mundo (C), diremos que los lexemas refieren potencialmente a las entidades de C. Así, diremos que el lexema 'gato' (A), denota el concepto o categoría [gato] (B) y tiene la capacidad de referir en el contexto de una expresión a los gatos que en el mundo hayan (C).

Fig. I.10: Terminología relativa a los lexemas

Con estas precisiones y la esperanza de que el contexto desambigue cualquier otro modo menos laxo de hablar (como por ejemplo llamar 'palabras' a los 'lexemas'), creo que podemos pasar a tratar del lenguaje, el mundo, los conceptos, y de sus representaciones computacionales.

Volver al índice
Capítulo siguiente

Climent S. (1999) Individuación e información Parte-Todo. Representación para el procesamiento computacional del lenguaje. Estudios de Lingüística Española (ELiEs).

ISSN: 1139-8736
Depósito Legal: B-8929-00