ISSN: 1139-8736
3.2 EuroWordNet
Tomando en gran parte como pauta a seguir WordNet 1.5, se inició en 1996 el proyecto EuroWordNet, que tiene como fin la construcción de una base de datos léxico-semántica que debe constar, al finalizar ésta su fase inicial, en 1998, de 50.000 sentidos nominales y verbales para cada una de las lenguas participantes: castellano, holandés, italiano e inglés. Las redes semánticas de cada una de las lenguas estarán conectadas mediante relaciones de equivalencia a una estructura interlingüística, pudiendo así servir de base para tareas de procesamiento del lenguaje que requieran de información multilingüe, tales como traducción automática o recuperación de información de textos de una lengua por parte de hablantes de otra distinta.
EuroWordNet propone una mayor riqueza de relaciones semánticas así como diversas soluciones para solventar lo que se ha considerado como deficiencias de WordNet 1.5 y que se han expuesto en la sección anterior: multiplicación inncesaria de sentidos y falta de consistencia en la aplicación de ciertas relaciones semánticas (cf. Bloksma et al. 1996, Climent et al. 1996). A tal efecto se introducen como mecanismos de representación las nociones de conjunción y disyunción de relaciones, con la aplicación que se ilustra a continuación en las fig. III.4 a III.8.
WordNet 1.5 utiliza de forma circunstancial la conjunción de
hiperónimos, ya que existen nodos conectados con varios (generalmente dos) nodos
superiores. La conjunción no está marcada explícitamente en WordNet 1.5, sino que es el
valor asumido por defecto en los casos en que se da múltiple conexión. En EuroWordNet
(EWN) se propone un uso mucho más sistemático de dicho recurso, de forma que así sea
posible evitar casos de duplicación innecesaria de sentidos.
Fig. III.4: conjunción de hiperónimos
Véase en el ejemplo dispuesto en la fig. III.4 como el uso de dicho recurso permite codificar en la base de datos un único sentido de los conceptos {change of location}, {rise, ascent} y {climb} por el método de conectar el nodo superior, {change of location} como hipónimo conjuntivo de {movement} y {change}, dando así cuenta de que un [cambio de localización] implica necesariamente tanto un [movimiento] como un [cambio] . En WordNet 1.5 la solución adoptada consiste en la existencia de dos sentidos diferenciados para, cada miembro de la cadena {change of location}, {rise, ascent} y {climb}, siendo una cadena hipónima de {movement} y otra de {change}.
A pesar de usar implícitamente la conjunción, WordNet no hace uso
de la noción complementaria de disyunción de relaciones. La introducción de la misma en
EWN permite dar cuenta de casos como el ejemplificado en la fig. III.5. En el
mismo, a diferencia del caso de la fig. III.4, un concepto como {albino} debe ser
considerado como hipónimo de los conceptos {animal} y {planta} dado que, en terminología
de conjuntos, los [albinos] están incluídos en el conjunto de
los [animales] o bien en el de las [plantas] , pero -nótese la diferencia con el caso ejemplificado en la fig.
III.4- no simultáneamente en ambos. Ello conduciría en WordNet 1.5 a la
introducción de dos conceptos diferentes, dos sentidos de 'albino', uno correspondiente a
los animales albinos y otro a las plantas albinas; en EWN sin embargo, un único sentido
conectado de forma disyuntiva con los hiperónimos {animal} y {planta} evita una nueva e
innecesaria duplicación de conceptos.
Fig. III.5: disyunción de hiperónimos
Dicho recurso es aplicable no sólo a las relaciones
taxonómicas sino también a las meronímicas. Recuérdese el ejemplo de (12), en el que
WordNet 1.5 introducía sentidos diferenciados para puertas de coches y puertas de
habitaciones o recintos. Sin embargo no parece que los hablantes tengan noción de la
existencia de tales dos conceptos diferenciados; por el contrario, puertas de coches y
puertas de habitaciones parecen ser dos realizaciones alternativas de un mismo concepto.
Ello es codificable en EWN usando la disyunción de la relación parte-de: un único
concepto de [puerta] es comprendido como parte, bien de
habitaciones, bien de coches -o de cualquier otro tipo de recintos susceptibles de tener
puertas, los cuáles serán asimismo conectables a {puerta} mediante una relación
meronímica disjunta-.
Fig. III.6: disyunción de holónimos
De forma simétrica puede expresarse en EWN la relación disjunta de
parte basada no en la naturaleza de la parte sino en la del todo. Como puede verse en la fig.
III.7, pese a que es plausible postular un único concepto de [avión] , es evidente que existen aviones a hélice y aviones con motor a
propulsión -pero no aviones que tengan simultáneamente como partes {motor a hélices} y
{motor a propulsión}-. Dichas relaciones de parte alternativas puden nuevamente ser
expresadas mediante la aplicación de la etiqueta de disyunción a la relación que parte
del concepto denotador del todo ([avión] ).
Fig. III.7: disyunción de merónimos-1
El sistema de conjunción y disyunción de relaciones permite
además la combinación de ambos recursos, como en fig. III.8, en la que retomando
el ejemplo del avión, puede expresarse que todos los aviones tienen como parte
{puerta}, y además algunos tienen como parte {motores a hélices} y otros
distintos {motores a propulsión}. La aplicación de la conjunción y la disyunción en la
fig. III.8 debe ser interpretada como '{avión} tiene por partes {puerta} y
X; en dónde X puede ser {motor a hélice} o {motor a propulsión}'.
Fig. III.8: Disyunción de merónimos-2
Etiquetado de relaciones: factividad, reversión y negación
El sistema de relaciones de WordNet 1.5 no permite expresar otro tipo de aspectos de las relaciones léxicas tales como la factividad, la reversión o la negación de relaciones. A fin de conseguir una mayor precisión léxico-relacional se ha considerado aconsejable en EWN dotar al sistema de capacidad para dar cuenta de los mismos. Tal cometido se realiza mediante el etiquetado de relaciones.
En EWN las relaciones léxicas no son simples constructos unarios
sino que además pueden estar etiquetadas mediante un conjunto de rasgos: factivo/no
factivo, revertido y negación (en la base de datos codificadas mediante
los términos ingleses 'factive/non factive', 'reversed' y 'not'). Ejemplos de la
codificación de relaciones con tales etiquetas pueden verse en la tabla III.3 y
los comentaremos a continuación.
synset | relación | etiqueta | synset |
matar | causes | factive | morir |
buscar | causes | non-factive | encontrar |
nariz | part | cara | |
cara | has_mero_part | nariz | |
libro | has_mero_madeof | papel | |
papel | madeof | reversed | libro |
castrado | has_mero_part | not | genitales |
tabla III.3: relaciones etiquetadas en EuroWordNet
El rasgo epistémico factivo (propuesto por Lyons, 1977) se aplica a las relaciones de causación e indica la necesariedad de la relación, sirviendo para distinguir, por ejemplo, entre 'matar' causa 'morir' y 'buscar' causa 'encontrar'; en el primer caso si alguien mata, necesariamente alguien muere; en el segundo, el que alguien busque puede causar que ese alguien encuentre, pero la relación causa-efecto no es inexorable, sino únicamente posible o probable.
El rasgo revertido es necesario pues es un requisito de consistencia interna de la base de datos que toda relación tenga su inversa: si existe una relación que indique que 'nariz' es parte de 'cara', necesariamente debe reflejarse que 'cara' tiene por parte 'nariz'. Sin embargo, de modo similar a lo que ocurre con las causaciones, no todas las relaciones reversas pueden considerarse del mismo nivel de factividad. En el caso de la relación meronímica-holonímica 'nariz'-'cara' la relación debe considerarse completamente bidireccional (toda nariz es parte de una cara y toda cara tiene por parte una nariz). Considérese sin embargo la relación existente entre 'libro' y 'papel'; todo libro esta hecho de papel, luego debe postularse la relación meronímica 'libro' es holónimo de 'papel'; sin embargo la relación inversa, 'papel' es merónimo de 'libro' no es del mismo orden, pues no toda la materia denominada 'papel' se utiliza exclusivamente para conformar libros. Tal distinción se codifica en EWN etiquetando la última de las relaciones como revertida. Así pues, la etiqueta revertida se utiliza para distinguir entre las relaciones con base conceptual de las revertidas automáticamente a fin de cumplir con los requisitos de consistencia interna de la base de datos.
Finalmente, la etiqueta negación se utiliza para expresar explícitamente que una relación no se da, lo cual puede ser útil para distinguir entre conceptos cuya diferencia radique en la ausencia en uno de ellos de cierta característica, por ejemplo entre 'castrado' y el resto de humanos, en dónde 'castrado' se caracterizará por la negación de la existencia de la relación meronímica con 'genitales'.
Unificación de nombres y verbos
Otra innovación de EWN con respecto a WordNet 1.5 es la posibilidad de establecer relaciones entre nombres y verbos. Es harto conocido que procesos y acciones, aunque típicamente estén designados por verbos, tambien pueden serlo por nombres. De hecho aproximadamente el 30% de los nombres de WordNet 1.5 no denotan entidades sino acciones, procesos, relaciones etc. Por dicha razón, los conjuntos de nombres y verbos, absolutamente desconectados entre sí en WordNet 1.5, pueden relacionarse en EWN mediante relaciones transcategoriales. Así, pueden relacionarse los conceptos [destruir] y [destrucción] mediante una relación de cuasi-sinonimia, o [destruir] y [construcción] mediante una de cuasi-antonimia.
En general, practicamente cualquier relación que pueda postularse
entre verbos (holonimias y meronimias, excepto sub-eventos, quedan por tanto excluidas) se
entiende de modo más general como existente entre eventos; y dado que los eventos pueden
ser también designados tanto mediante nombres como mediante verbos, cualquiera de dichas
relaciones puede ser establecida, de forma transcategorial entre nombres y verbos. En la fig.
III.9 puede verse de que forma las relaciones de hiponimia (marcadas mediante trazo
continuo) y sinonimia (trazo discontinuo) producen el efecto de unificación nombre-verbo.
fig. III.9: relaciones nombre-verbo de hiponimia y sinonimia
Una ventaja de dicho tipo de aproximación a las relaciones léxicas
es que, dado que una misma información puede ser codificada lingüísticamente tanto
mediante una oración como mediante un sintagma nominal (compárense los clásicos
ejemplos 'los enemigos destruyeron la ciudad' / 'la destrucción de la ciudad por los
enemigos'), será posible, utilizando EWN como base de datos, realizar de forma optimizada
operaciones de extracción o recuperación de información en los casos en que, como en el
ejemplo, una misma información viene codificada mediante estructuras sintácticas
distintas.
Nuevas relaciones
La arquitectura de EWN comprende relaciones no existentes en WordNet
1.5. En la tabla III.4 pueden verse la totalidad de las relaciones semánticas
intralingüísticas incluídas (cf. Climent et al., 1996), junto con una breve
descripción de las mismas. Las relaciones en minúscula son subtipos de las
inmediatamente anteriores en mayúscula. Las relaciones XPOS (acrónimo de cross
part of speech ,'transcategoriales') son las que se establecen entre palabras de
distinta categoría morfosintáctica. Las abreviaciones para las etiquetas aplicables a
cada relación son: d- disyunción, c- conjunción, r- revertida, f-
factiva, n- negación.
relación | Etiquetas aplicables | ejemplo | descripción |
HAS_XPOS_HYPERONYM | d c r | destrucción > cambiar | hiperonimia transcategorial |
HAS_XPOS_HYPONYM | d r | cambio > destruir | hiponimia transcategorial |
HAS_HYPERONYM | d c r | destruir > cambiar | hiperonimia |
HAS_HYPONYM | d r | cambio > destrucción | hiponimia |
XPOS_NEAR_SYNONYM | r | cambiar > cambio | cuasi-sinonimia transcategorial |
NEAR_SYNONYM | r | cigarro > puro | cuasi-sinonimia |
FUZZYNYM | feudalismo > propiedad | relación indeterminada | |
XPOS_FUZZYNYM | feudalismo > poseer | relación indeterminada transcategorial | |
ANTONYM | r | construir > destruir | antonimia |
NEAR_ANTONYM | r | construir > destrozar | cuasi-antonimia |
XPOS_NEAR_ANTONYM | r | construcción > destrozar | cuasi-antonimia transcategorial |
INVOLVED | d c r | martillear > martillo | entidad directamente relacionada con un evento |
ROLE | d c r | vino > beber | evento directamente relacionado con una entidad |
involved_agent | d c r | educar > educador | involvement en que la entidad realiza un papel agentivo |
role_agent | d c r | educador > educar | role en que la entidad realiza un papel agentivo |
involved_patient | d c r | examinar > examinando | involvement en que la entidad realiza un papel de paciente |
role_patient | d c r | examinando > examinar | role en que la entidad realiza un papel de paciente |
involved_instrument | d c r | martillear > martillo | involvement en que la entidad realiza un papel de instrumento |
role_instrument | d c r | martillo > martillear | role en que la entidad realiza un papel de instrumento |
involved_location | d c r | comer > comedor | involvement en que la entidad realiza un papel locativo |
role_location | d c r | comedor > comer | role en que la entidad realiza un papel locativo |
involved_direction | d c r | caer > suelo | involvement en que la entidad realiza un papel de origen o destino |
involved_source_direction | d c r | disparo > arma de fuego | involvement en que la entidad realiza un papel de origen |
involved_target_direction | d c r | caer > suelo | involvement en que la entidad realiza un papel de destino |
role_direction | d c r | suelo > caer | inversa de involved_direction |
role_source_direction | d c r | arma de fuego > disparo | inversa de involved_source_direction |
role_target_direction | d c r | suelo > caer | inversa de involved_target_direction |
HAS_HOLONYM | d c r n | nariz > cara | holonimia (genérica) |
HAS_MERONYM | d c r n | cara > nariz | meronimia (genérica) |
member | d c r n | senador > senado | holonimia de inclusión de elemento en conjunto |
has_mero_member | d c r n | senado > senador | inversa de la anterior |
portion | d c r n | mandrugo > pan | holonimia de trozo o fragmento |
has_mero_portion | d c r n | pan > mendrugo | inversa de la anterior |
part | d c r n | nariz > cara | holonimia de parte |
has_mero_part | d c r n | cara > nariz | inversa de la anterior |
madeof | d c r n | papel > libro | holonimia de sustancia, o hecho de |
has_mero_madeof | d c r n | libro > papel | inversa de la anterior |
location | d c r n | oasis > desierto | holonimia de lugar |
has_mero_location | d c r n | desierto > oasis | inversa de la anterior |
CAUSES | d c r n f | matar > morir | causación entre eventos |
IS_CAUSED_BY | d c r n f | morir > matar | inversa de la anterior |
HAS_INSTANCE | ciudad > Barcelona | instancia de clase | |
BELONGS_TO_CLASS | Barcelona > ciudad | inversa de la anterior | |
BE_IN_STATE | d c r n |
belleza > bello | estado correspondiente a la posesión de una cierta propiedad |
STATE_OF | d c r n | bello > belleza | inversa de la anterior |
tabla III.4: relaciones semánticas en EuroWordNet
Las relaciones en EWN no se definen formalmente, sin embargo, se
describen de forma no ambigua mediante tests lingüísticos. A continuación se
exponen los tests para las relaciones de las que específicamente trata este
trabajo, las relaciones meronímicas nominales.
Descripción de las relaciones nominales parte-todo en EWN
Tal y como se ha descrito en el capítulo 2 la llamada relación parte-todo no es una única relación sino una familia de relaciones, de las que se han descrito diversos subtipos (cf., p.e. Cruse, 1986; Winston et al.1987). En EWN se ha decidido restringir dichos subtipos a los seis siguientes: relación entre un todo y sus partes constituyentes (part y has_mero_part); relación entre un todo y una entidad-trozo que ha sido separada de él (portion y has_mero_portion); la relación entre un lugar y otro lugar incluído en el primero (location y has_mero_location); la relación entre un conjunto y sus elementos o miembros (member y has_mero_member); y la relación entre una entidad y la sustancia de qué está hecha (madeof y has_mero_madeof. Se mantiene asimismo una relación subespecificada para cubrir los casos que no sean claramente incluibles en las anteriores (has_holonym y has_meronym).
La descripción de dichas relaciones se realiza mediante tests de aceptabilidad lingüística, los cuales constan de marcos sintagmáticos con variables a sustituir por los pares de palabras o lexías examinadas como candidatas a cumplir la relación, valores de juicio lingüístico sobre la aceptabilidad del sintagma (si -aceptable-, no -no aceptable) y condiciones a cumplir por dichas palabras o lexías.
En esta sección se ha descrito el modo de
representación del conocimiento léxico adoptado en EWN, que sigue la pauta definida por
WordNet, ampliando su expresividad en diversos aspectos. Como hemos visto, se trata en
ambos casos de aproximaciones léxico-relacionales. Veremos a continuación un modo
distinto de representación, el basado en estructuras de rasgos tipificadas.
Continuar
Volver al inicio del
capítulo
Volver al índice
Climent S. (1999) Individuación e información Parte-Todo. Representación para el procesamiento computacional del lenguaje. Estudios de Lingüística Española (ELiEs).
ISSN: 1139-8736
Depósito Legal: B-8929-00