ISSN: 1139-8736
Depósito Legal: B-8929-00


3.2 EuroWordNet
 


    Tomando en gran parte como pauta a seguir WordNet 1.5, se inició en 1996 el proyecto EuroWordNet, que tiene como fin la construcción de una base de datos léxico-semántica que debe constar, al finalizar ésta su fase inicial, en 1998, de 50.000 sentidos nominales y verbales para cada una de las lenguas participantes: castellano, holandés, italiano e inglés. Las redes semánticas de cada una de las lenguas estarán conectadas mediante relaciones de equivalencia a una estructura interlingüística, pudiendo así servir de base para tareas de procesamiento del lenguaje que requieran de información multilingüe, tales como traducción automática o recuperación de información de textos de una lengua por parte de hablantes de otra distinta.

    EuroWordNet propone una mayor riqueza de relaciones semánticas así como diversas soluciones para solventar lo que se ha considerado como deficiencias de WordNet 1.5 y que se han expuesto en la sección anterior: multiplicación inncesaria de sentidos y falta de consistencia en la aplicación de ciertas relaciones semánticas (cf. Bloksma et al. 1996, Climent et al. 1996). A tal efecto se introducen como mecanismos de representación las nociones de conjunción y disyunción de relaciones, con la aplicación que se ilustra a continuación en las fig. III.4 a III.8.

    WordNet 1.5 utiliza de forma circunstancial la conjunción de hiperónimos, ya que existen nodos conectados con varios (generalmente dos) nodos superiores. La conjunción no está marcada explícitamente en WordNet 1.5, sino que es el valor asumido por defecto en los casos en que se da múltiple conexión. En EuroWordNet (EWN) se propone un uso mucho más sistemático de dicho recurso, de forma que así sea posible evitar casos de duplicación innecesaria de sentidos.
 


Fig. III.4: conjunción de hiperónimos
 

    Véase en el ejemplo dispuesto en la fig. III.4 como el uso de dicho recurso permite codificar en la base de datos un único sentido de los conceptos {change of location}, {rise, ascent} y {climb} por el método de conectar el nodo superior, {change of location} como hipónimo conjuntivo de {movement} y {change}, dando así cuenta de que un [cambio de localización] implica necesariamente tanto un [movimiento] como un [cambio] . En WordNet 1.5 la solución adoptada consiste en la existencia de dos sentidos diferenciados para, cada miembro de la cadena {change of location}, {rise, ascent} y {climb}, siendo una cadena hipónima de {movement} y otra de {change}.

    A pesar de usar implícitamente la conjunción, WordNet no hace uso de la noción complementaria de disyunción de relaciones. La introducción de la misma en EWN permite dar cuenta de casos como el ejemplificado en la fig. III.5. En el mismo, a diferencia del caso de la fig. III.4, un concepto como {albino} debe ser considerado como hipónimo de los conceptos {animal} y {planta} dado que, en terminología de conjuntos, los [albinos] están incluídos en el conjunto de los [animales] o bien en el de las [plantas] , pero -nótese la diferencia con el caso ejemplificado en la fig. III.4- no simultáneamente en ambos. Ello conduciría en WordNet 1.5 a la introducción de dos conceptos diferentes, dos sentidos de 'albino', uno correspondiente a los animales albinos y otro a las plantas albinas; en EWN sin embargo, un único sentido conectado de forma disyuntiva con los hiperónimos {animal} y {planta} evita una nueva e innecesaria duplicación de conceptos.
 


Fig. III.5: disyunción de hiperónimos
 

    Dicho recurso es aplicable no sólo a las relaciones taxonómicas sino también a las meronímicas. Recuérdese el ejemplo de (12), en el que WordNet 1.5 introducía sentidos diferenciados para puertas de coches y puertas de habitaciones o recintos. Sin embargo no parece que los hablantes tengan noción de la existencia de tales dos conceptos diferenciados; por el contrario, puertas de coches y puertas de habitaciones parecen ser dos realizaciones alternativas de un mismo concepto. Ello es codificable en EWN usando la disyunción de la relación parte-de: un único concepto de [puerta] es comprendido como parte, bien de habitaciones, bien de coches -o de cualquier otro tipo de recintos susceptibles de tener puertas, los cuáles serán asimismo conectables a {puerta} mediante una relación meronímica disjunta-.
 


Fig. III.6: disyunción de holónimos
 

    De forma simétrica puede expresarse en EWN la relación disjunta de parte basada no en la naturaleza de la parte sino en la del todo. Como puede verse en la fig. III.7, pese a que es plausible postular un único concepto de [avión] , es evidente que existen aviones a hélice y aviones con motor a propulsión -pero no aviones que tengan simultáneamente como partes {motor a hélices} y {motor a propulsión}-. Dichas relaciones de parte alternativas puden nuevamente ser expresadas mediante la aplicación de la etiqueta de disyunción a la relación que parte del concepto denotador del todo ([avión] ).
 


Fig. III.7: disyunción de merónimos-1
 

    El sistema de conjunción y disyunción de relaciones permite además la combinación de ambos recursos, como en fig. III.8, en la que retomando el ejemplo del avión, puede expresarse que todos los aviones tienen como parte {puerta}, y además algunos tienen como parte {motores a hélices} y otros distintos {motores a propulsión}. La aplicación de la conjunción y la disyunción en la fig. III.8 debe ser interpretada como '{avión} tiene por partes {puerta} y X; en dónde X puede ser {motor a hélice} o {motor a propulsión}'.
 


Fig. III.8: Disyunción de merónimos-2
 

    Etiquetado de relaciones: factividad, reversión y negación

    El sistema de relaciones de WordNet 1.5 no permite expresar otro tipo de aspectos de las relaciones léxicas tales como la factividad, la reversión o la negación de relaciones. A fin de conseguir una mayor precisión léxico-relacional se ha considerado aconsejable en EWN dotar al sistema de capacidad para dar cuenta de los mismos. Tal cometido se realiza mediante el etiquetado de relaciones.

    En EWN las relaciones léxicas no son simples constructos unarios sino que además pueden estar etiquetadas mediante un conjunto de rasgos: factivo/no factivo, revertido y negación (en la base de datos codificadas mediante los términos ingleses 'factive/non factive', 'reversed' y 'not'). Ejemplos de la codificación de relaciones con tales etiquetas pueden verse en la tabla III.3 y los comentaremos a continuación.
 

    synset     relación     etiqueta     synset
    matar     causes     factive     morir
    buscar     causes     non-factive     encontrar
    nariz     part       cara
    cara     has_mero_part       nariz
    libro    has_mero_madeof       papel
    papel     madeof     reversed     libro
    castrado     has_mero_part     not     genitales

tabla III.3: relaciones etiquetadas en EuroWordNet
 

    El rasgo epistémico factivo (propuesto por Lyons, 1977) se aplica a las relaciones de causación e indica la necesariedad de la relación, sirviendo para distinguir, por ejemplo, entre 'matar' causa 'morir' y 'buscar' causa 'encontrar'; en el primer caso si alguien mata, necesariamente alguien muere; en el segundo, el que alguien busque puede causar que ese alguien encuentre, pero la relación causa-efecto no es inexorable, sino únicamente posible o probable.

    El rasgo revertido es necesario pues es un requisito de consistencia interna de la base de datos que toda relación tenga su inversa: si existe una relación que indique que 'nariz' es parte de 'cara', necesariamente debe reflejarse que 'cara' tiene por parte 'nariz'. Sin embargo, de modo similar a lo que ocurre con las causaciones, no todas las relaciones reversas pueden considerarse del mismo nivel de factividad. En el caso de la relación meronímica-holonímica 'nariz'-'cara' la relación debe considerarse completamente bidireccional (toda nariz es parte de una cara y toda cara tiene por parte una nariz). Considérese sin embargo la relación existente entre 'libro' y 'papel'; todo libro esta hecho de papel, luego debe postularse la relación meronímica 'libro' es holónimo de 'papel'; sin embargo la relación inversa, 'papel' es merónimo de 'libro' no es del mismo orden, pues no toda la materia denominada 'papel' se utiliza exclusivamente para conformar libros. Tal distinción se codifica en EWN etiquetando la última de las relaciones como revertida. Así pues, la etiqueta revertida se utiliza para distinguir entre las relaciones con base conceptual de las revertidas automáticamente a fin de cumplir con los requisitos de consistencia interna de la base de datos.

    Finalmente, la etiqueta negación se utiliza para expresar explícitamente que una relación no se da, lo cual puede ser útil para distinguir entre conceptos cuya diferencia radique en la ausencia en uno de ellos de cierta característica, por ejemplo entre 'castrado' y el resto de humanos, en dónde 'castrado' se caracterizará por la negación de la existencia de la relación meronímica con 'genitales'.

    Unificación de nombres y verbos

    Otra innovación de EWN con respecto a WordNet 1.5 es la posibilidad de establecer relaciones entre nombres y verbos. Es harto conocido que procesos y acciones, aunque típicamente estén designados por verbos, tambien pueden serlo por nombres. De hecho aproximadamente el 30% de los nombres de WordNet 1.5 no denotan entidades sino acciones, procesos, relaciones etc. Por dicha razón, los conjuntos de nombres y verbos, absolutamente desconectados entre sí en WordNet 1.5, pueden relacionarse en EWN mediante relaciones transcategoriales. Así, pueden relacionarse los conceptos [destruir] y [destrucción] mediante una relación de cuasi-sinonimia, o [destruir] y [construcción] mediante una de cuasi-antonimia.

    En general, practicamente cualquier relación que pueda postularse entre verbos (holonimias y meronimias, excepto sub-eventos, quedan por tanto excluidas) se entiende de modo más general como existente entre eventos; y dado que los eventos pueden ser también designados tanto mediante nombres como mediante verbos, cualquiera de dichas relaciones puede ser establecida, de forma transcategorial entre nombres y verbos. En la fig. III.9 puede verse de que forma las relaciones de hiponimia (marcadas mediante trazo continuo) y sinonimia (trazo discontinuo) producen el efecto de unificación nombre-verbo.
 


fig. III.9: relaciones nombre-verbo de hiponimia y sinonimia
 

    Una ventaja de dicho tipo de aproximación a las relaciones léxicas es que, dado que una misma información puede ser codificada lingüísticamente tanto mediante una oración como mediante un sintagma nominal (compárense los clásicos ejemplos 'los enemigos destruyeron la ciudad' / 'la destrucción de la ciudad por los enemigos'), será posible, utilizando EWN como base de datos, realizar de forma optimizada operaciones de extracción o recuperación de información en los casos en que, como en el ejemplo, una misma información viene codificada mediante estructuras sintácticas distintas.
 

    Nuevas relaciones

    La arquitectura de EWN comprende relaciones no existentes en WordNet 1.5. En la tabla III.4 pueden verse la totalidad de las relaciones semánticas intralingüísticas incluídas (cf. Climent et al., 1996), junto con una breve descripción de las mismas. Las relaciones en minúscula son subtipos de las inmediatamente anteriores en mayúscula. Las relaciones XPOS (acrónimo de cross part of speech ,'transcategoriales') son las que se establecen entre palabras de distinta categoría morfosintáctica. Las abreviaciones para las etiquetas aplicables a cada relación son: d- disyunción, c- conjunción, r- revertida, f- factiva, n- negación.
 

    relación Etiquetas aplicables     ejemplo     descripción
    HAS_XPOS_HYPERONYM     d c r     destrucción > cambiar     hiperonimia transcategorial
    HAS_XPOS_HYPONYM     d r     cambio > destruir     hiponimia transcategorial
    HAS_HYPERONYM     d c r     destruir > cambiar     hiperonimia
    HAS_HYPONYM     d r     cambio > destrucción     hiponimia
    XPOS_NEAR_SYNONYM     r     cambiar > cambio     cuasi-sinonimia transcategorial
    NEAR_SYNONYM     r     cigarro > puro     cuasi-sinonimia
    FUZZYNYM       feudalismo > propiedad     relación indeterminada
    XPOS_FUZZYNYM       feudalismo > poseer     relación indeterminada transcategorial
    ANTONYM     r     construir > destruir     antonimia
    NEAR_ANTONYM     r     construir > destrozar     cuasi-antonimia
    XPOS_NEAR_ANTONYM     r     construcción > destrozar     cuasi-antonimia transcategorial
    INVOLVED     d c r     martillear > martillo     entidad directamente relacionada con un evento
    ROLE     d c r     vino > beber     evento directamente relacionado con una entidad
    involved_agent     d c r     educar > educador     involvement en que la entidad realiza un papel agentivo
    role_agent     d c r     educador > educar     role en que la entidad realiza un papel agentivo
    involved_patient      d c r     examinar > examinando     involvement en que la entidad realiza un papel de paciente
    role_patient     d c r     examinando > examinar     role en que la entidad realiza un papel de paciente
    involved_instrument     d c r     martillear > martillo     involvement en que la entidad realiza un papel de instrumento
    role_instrument     d c r     martillo > martillear     role en que la entidad realiza un papel de instrumento
    involved_location     d c r     comer > comedor     involvement en que la entidad realiza un papel locativo
    role_location     d c r     comedor > comer     role en que la entidad realiza un papel locativo
    involved_direction     d c r     caer > suelo     involvement en que la entidad realiza un papel de origen o destino
    involved_source_direction     d c r     disparo > arma de fuego     involvement en que la entidad realiza un papel de origen
    involved_target_direction     d c r     caer > suelo     involvement en que la entidad realiza un papel de destino
    role_direction     d c r      suelo > caer     inversa de involved_direction
    role_source_direction     d c r     arma de fuego > disparo     inversa de involved_source_direction
    role_target_direction     d c r     suelo > caer     inversa de involved_target_direction
    HAS_HOLONYM     d c r n     nariz > cara     holonimia (genérica)
    HAS_MERONYM     d c r n     cara > nariz     meronimia (genérica)
    member     d c r n     senador > senado     holonimia de inclusión de elemento en conjunto
    has_mero_member     d c r n     senado > senador     inversa de la anterior
    portion     d c r n     mandrugo > pan     holonimia de trozo o fragmento
    has_mero_portion     d c r n     pan > mendrugo     inversa de la anterior
    part     d c r n     nariz > cara     holonimia de parte
    has_mero_part     d c r n     cara > nariz     inversa de la anterior
    madeof     d c r n     papel > libro     holonimia de sustancia, o hecho de
    has_mero_madeof     d c r n     libro > papel     inversa de la anterior
    location     d c r n     oasis > desierto     holonimia de lugar
    has_mero_location     d c r n     desierto > oasis     inversa de la anterior
    CAUSES   d c r n f     matar > morir     causación entre eventos
    IS_CAUSED_BY   d c r n f     morir > matar     inversa de la anterior
    HAS_INSTANCE       ciudad > Barcelona     instancia de clase
    BELONGS_TO_CLASS       Barcelona > ciudad     inversa de la anterior
    BE_IN_STATE

    d c r n

    belleza > bello     estado correspondiente a la posesión de una cierta propiedad
    STATE_OF     d c r n     bello > belleza     inversa de la anterior

tabla III.4: relaciones semánticas en EuroWordNet
 

    Las relaciones en EWN no se definen formalmente, sin embargo, se describen de forma no ambigua mediante tests lingüísticos. A continuación se exponen los tests para las relaciones de las que específicamente trata este trabajo, las relaciones meronímicas nominales.
 

    Descripción de las relaciones nominales parte-todo en EWN

    Tal y como se ha descrito en el capítulo 2 la llamada relación parte-todo no es una única relación sino una familia de relaciones, de las que se han descrito diversos subtipos (cf., p.e. Cruse, 1986; Winston et al.1987). En EWN se ha decidido restringir dichos subtipos a los seis siguientes: relación entre un todo y sus partes constituyentes (part y has_mero_part); relación entre un todo y una entidad-trozo que ha sido separada de él (portion y has_mero_portion); la relación entre un lugar y otro lugar incluído en el primero (location y has_mero_location); la relación entre un conjunto y sus elementos o miembros (member y has_mero_member); y la relación entre una entidad y la sustancia de qué está hecha (madeof y has_mero_madeof. Se mantiene asimismo una relación subespecificada para cubrir los casos que no sean claramente incluibles en las anteriores (has_holonym y has_meronym).

    La descripción de dichas relaciones se realiza mediante tests de aceptabilidad lingüística, los cuales constan de marcos sintagmáticos con variables a sustituir por los pares de palabras o lexías examinadas como candidatas a cumplir la relación, valores de juicio lingüístico sobre la aceptabilidad del sintagma (si -aceptable-, no -no aceptable) y condiciones a cumplir por dichas palabras o lexías.

    En esta sección se ha descrito el modo de representación del conocimiento léxico adoptado en EWN, que sigue la pauta definida por WordNet, ampliando su expresividad en diversos aspectos. Como hemos visto, se trata en ambos casos de aproximaciones léxico-relacionales. Veremos a continuación un modo distinto de representación, el basado en estructuras de rasgos tipificadas.
 


    Continuar
    Volver al inicio del capítulo
    Volver al índice


Climent S. (1999) Individuación e información Parte-Todo. Representación para el procesamiento computacional del lenguaje. Estudios de Lingüística Española (ELiEs).

ISSN: 1139-8736
Depósito Legal: B-8929-00