ISSN: 1139-8736
Depósito Legal: B-35510-2000

4.4.4 DATR

DATR (Evans & Gazdar 1989a, 1989b, 1990, 1995), es otro lenguaje basado en restricciones para la representación del conocimiento léxico desarrollado por algunos de los autores pioneros en este campo. La mayor fuente de información respecto a este lenguaje de programación específico puede ser encontrada en Evans, Gazdar & Keller (1997).

El objetivo de DATR fue desarrollar un lenguaje con las siguientes características Evans & Gazdar (1995):

  1. contenga una teoría explícita de inferencia.
  2. posea una semántica declarativa explícita.
  3. pueda ser directamente implementable de forma eficiente.
  4. tenga la suficiente capacidad expresiva como para codificar las entradas lingüísticas características de las gramáticas de unificación.
  5. pueda expresar las generalizaciones y subgeneralizaciones de dichas entradas.

DATR ha pretendido mantener un espíritu minimalista y austero (Evans & Gazdar 1995; Evans, Gazdar & Keller 1997), en el sentido de que una implementación de la especificación DATR contiene únicamente lo necesario para representar una red con herencia por defecto no monotónica. De hecho, el núcleo del motor de inferencia de DATR puede ser codificado en una sola página de Prolog (Gibbon 1993).

La herencia por defecto no-monotónica es una diferencia fundamental con el formalismo PATR, que, como ya hemos visto, soporta únicamente la re-entrada de rasgos. En PATR el énfasis está puesto en el proceso, mientras que en DATR, el énfasis está en la representación. De hecho ha sido calificado como "orientado a la representación" (Duda 1994), como opuesto a la "orientación al proceso" de PATR. En DATR, no existe otra operación aparte de la estrategia de inferencia por herencia, es decir, no se implementa un algoritmo de unificación.

Como viene siendo habitual en los formalismos basados en rasgos, una jerarquía de DATR se organiza en una red de nodos, donde un nodo es básicamente una colección de información relacionada que se puede corresponder con una palabra, un lexema o un conjunto de lexemas. Cada nodo tiene un conjunto de pares camino-valor, donde el "camino", consta de uno o más átomos que conforman un atributo. Por ejemplo, la palabra "finished" puede ser representada en notación DATR del modo siguiente:

Word:
<syn cat> = verb
      <syn type> = main
<syn form> = passive participle
      <mor form> = finish ed.

Como se puede comprobar en este simple ejemplo, la sintaxis guarda un enorme parecido con la notación PATR, formalismo del que sin duda desciende DATR. Esta característica es considerada en la actualidad un aspecto negativo por sus autores (Evans & Gazdar 1995:3) ya que una sintaxis determinada condiciona en gran parte una semántica determinada, y ésta mantiene en realidad grandes diferencias con el formalismo de Shieber.

La decidida orientación de DATR a la representación léxica hace que mediante este formalismo sea muy fácil definir una jerarquía de objetos lingüísticos y crear nuevos objetos a partir de otros ya existentes por similitud. Por supuesto, esto se consigue mediante la característica fundamental de DATR: la herencia. En DATR existen dos tipos de herencia: la herencia local y la herencia global.

Ambos mecanismos funcionan del mismo modo: especificando descriptores31 que hacen referencia a un camino, un nodo o un camino y nodo existentes. La siguiente definición del verbo "come" ejemplifica estos tres casos:

Come:
<> == VERB
     <mor root> == come
<mor past> == came
     <mor past participle> == <mor root>
     <syn> == INTRANSITIVE:<>.32

El primer valor heredado es el camino vacío, que hereda de VERB, es decir, el valor de Come:<> es igualado al de VERB:<> (especificación de nodo). La forma de participio pasado del verbo, <mor past participle> hereda de su forma raíz Come:<mor root> (especificación de camino). El tercer tipo de herencia es la asignación de intransitividad; en la última sentencia se especifican tanto el nodo como el camino INTRANSITIVE:<> (especificación de nodo y camino), de este modo la sintaxis de Come se iguala al camino vacío de INTRANSITIVE, un nodo abstracto que define la sintaxis de los verbos intransitivos.

Los descriptores simplemente expresan restricciones de igualdad entre un camino o nodo y otro. Por ejemplo. la sentencia

Nodo1:Camino1 == Nodo2:Camino2

se puede leer como "si el valor para Nodo2:Camino2 es definido, entonces el valor de Nodo1:Camino1 se define e iguala a él".

En suma, la aplicación de la herencia múltiple por defecto es la característica más destacable de DATR, y en este sentido, supera las posibilidades de PATR. Sin embargo, DATR no ofrece la posibilidad de especificar valores complejos estructurados (estructuras embebidas).

Ya hemos estudiado la aplicación que esta deseable característica posee, y el uso que de ella hace PATR. Una segunda crítica, señalada al igual que la anterior por Daelemans & van der Linden (1992), también a favor de PATR, es la utilización de caminos recursivos en lugar de nombres de atributos atómicos. También volvemos a mencionar la no inclusión en el formalismo del mecanismo de unificación, así como la dificultad de utilizar DATR para representar gramáticas basadas en este concepto. Esta dificultad, sin embargo ha demostrado ser salvable, por ejemplo, Duda (1994) muestra el desarrollo de interfaz entre DATR y PATR que pretende aprovechar las facilidades en cuanto a representación del primero y las posibilidades de proceso del segundo, combinándolos en un único entorno.

La aplicación del formalismo DATR a gramáticas basadas en herencia sin unificación también es posible, tal como la Word Grammar (Hudson 1990), como prueban trabajos como Poch (1992).

Otra característica positiva de DATR es que también permite especificar transductores de estados finitos, por lo que resulta un buen entorno para la generación y análisis morfológicos.33 En comparación con PC-PATR, sin embargo, la integración de éste con el que es sin duda el mejor analizador morfológico, PC-KIMMO, hace que las prestaciones de DATR en este sentido se queden muy atrás.


NOTAS

  1. En DATR, cuando un valor no es asignado directamente, sino mediante herencia, el puntero encargado de esta operación es denominado descriptor (p. ej. "<VERB>" en la primera sentencia del siguiente ejemplo).
  2. La diferencia entre éste y el anterior ejemplo en cuanto al símbolo de igualdad de las dos partes de la sentencia se debe a que en el primero las sentencias eran "extensionales" mientras que en el segundo son "definicionales". La única diferencia práctica es que el segundo tipo es válido tanto para la asignación de valores de forma directa como mediante herencia, por lo que suele ser el único utilizado.
  3. En el presente trabajo no mostraremos el funcionamiento de este tipo de autómatas, pues su aplicación tradicional ha sido al trabajo en morfología. Tampoco hemos mostrado otros formalismos basados en autómatas de estados finitos, como las redes de transición aumentadas (ATN: Augmented Transition Networks), que sí han sido utilizadas para la representación léxica en general, pero han estado enfocadas al desarrollo de teorías gramaticales muy determinadas, en concreto, la gramática generativa.

 

Anterior  I  Siguiente  I  Índice capítulo 4  I  Índice General


ISSN: 1139-8736
Depósito Legal: B-35510-2000
Copyright © 2000 Antonio Moreno Ortiz