ISSN: 1139-8736 Depósito Legal: B-25223-99 |
3.3.3. Novell ConceptNet
En los últimos tres años se han comenzado a desarrollar nuevas bases de conocimiento léxico para aplicaciones de la Industria de la Lengua. Una de ella es el ConceptNet, desarrollado por Novell Linguistic Technology Department. Esta red semántica se desarrolló a partir de WordNet 1.5 y acoge el concepto de synset y parte de la estructura, tipos de relaciones y datos. También existen diferencias entre ambos, como por ejemplo el carácter multilingüe, los tipos de objetos de significado o las relaciones semánticas.
En cuanto a la arquitectura, el ConceptNet contiene todas las especificaciones de WordNet 1.5, más una serie de elementos propios estructurales básicos. Por ejemplo, relaciones (palabra-relacionada y meronimia lugar-área), tipos de datos (Domains o área de conocimiento e Instances o elementos referenciales) y elementos de su arquitectura (dos tipos diferentes de jerarquías o división de sublenguajes y transferencia de significados en distintas lenguas). Algunos elementos de WordNet 1.5 han sido cambiados (como el establecimiento de distintos grados de sinonimia).
Este sistema, el ConceptNet, está pensado para mantener de una forma sencilla las complejas redes semánticas multilingües, tanto con nuevos significados, como con nuevas palabras o relaciones. Además permite almacenar significados por el usuario sin que éste sea experto en cuestiones semánticas.
El ConceptNet Database ha sido diseñado y programado para manejar específicamente redes semánticas. Posee un enfoque distinto en cuanto a la programación de bases de datos de conocimiento léxico. Utiliza una base de datos sin comprimir en la que podemos modificar y añadir información. Esta base de datos se comprime para ser integrada en el producto final.
La base de datos comprimida funciona con motores de acceso rápidos a través de funciones claras y sencillas. También está conectada a otros módulos, como un analizador y generador morfológico, lo que proporciona la posibilidad de tratar el léxico de forma paradigmática desde muchos puntos de vista.
En cuanto a los datos, aunque WorNet 1.5 fue utilizado como punto de partida, existen numerosas modificaciones y ampliaciones (palabras, significados y relaciones) con respecto al inglés y, por supuesto, con respecto a las otras dos lenguas iniciales de expansión (alemán y francés), así como algunos sublenguajes o terminologías. Además, algunos errores y problemas que contenía WordNet 1.5 fueron revisados y corregidos (errores en caracteres de las unidades léxicas y glosas, relaciones erróneas, etc.). Esta tabla muestra algunas diferencias:1
WordNet 1.5 |
ConceptNet 1.0 (Inglés) |
ConceptNet 2.0 (Inglés, Francés, Alemán) |
|
Categoría Gramatical |
Sustantivos, Verbos, Adjetivos, Adverbios |
Sustantivos, Verbos, Adjetivos, Adverbios |
Sustantivos, Verbos, Adjetivos, Adverbios |
Nombre de Relaciones |
Synonym
(synset), |
Full
Synonym, |
Multilingual
Equivalence, |
Nº de Significados |
91591 | 99953 | 102.000(1) |
Nº de Unidades Léxicas |
126520 | 127.000 | Inglés= 127.000(1) Francés= 40000-50000(1) Alemán= 40000-50000(1) |
Nº de Conexiones |
Miembros de Synsets = 168217 Resto de conexiones = 219133 |
Miembros de Synsets = 177.750 Resto de conexiones = 395.000 |
Miembros de Synsets Inglés= 180.000(1) |
Nº de Glosas |
76705 (83.7% de significados) | 99953 (100% de significados) | 102.000(100% de significados) |
(1) El Multilingual ConceptNet está en proceso de desarrollo y las cifras son la proporcionadas en un comunicado de prensa en mayo de 1996.
Como podemos observar, en cuanto a las meronimias, ConceptNet distingue las meronimias lugar-área para los nombres geográficos y espaciales. Éstos forman pues un grupo de jerarquías meronímicas diferenciadas del resto que permite el tratamiento de algunos problemas específicos.2
NOTAS
1 Díez Orzas (1995).
2 Ver Clementini & Di Felice (1994).
Anterior I Siguiente I Índice capítulo 3 I Índice General
ISSN: 1139-8736 Depósito Legal: B-25223-99 |