DATR (Evans & Gazdar 1989a, 1989b, 1990, 1995), es otro lenguaje basado en restricciones para la representación del conocimiento léxico desarrollado por algunos de los autores pioneros en este campo. La mayor fuente de información respecto a este lenguaje de programación específico puede ser encontrada en Evans, Gazdar & Keller (1997).
El objetivo de DATR fue desarrollar un lenguaje con las siguientes características Evans & Gazdar (1995):
DATR ha pretendido mantener un espíritu minimalista y austero (Evans & Gazdar 1995; Evans, Gazdar & Keller 1997), en el sentido de que una implementación de la especificación DATR contiene únicamente lo necesario para representar una red con herencia por defecto no monotónica. De hecho, el núcleo del motor de inferencia de DATR puede ser codificado en una sola página de Prolog (Gibbon 1993).
La herencia por defecto no-monotónica es una diferencia fundamental con el formalismo PATR, que, como ya hemos visto, soporta únicamente la re-entrada de rasgos. En PATR el énfasis está puesto en el proceso, mientras que en DATR, el énfasis está en la representación. De hecho ha sido calificado como "orientado a la representación" (Duda 1994), como opuesto a la "orientación al proceso" de PATR. En DATR, no existe otra operación aparte de la estrategia de inferencia por herencia, es decir, no se implementa un algoritmo de unificación.
Como viene siendo habitual en los formalismos basados en
rasgos, una jerarquía de DATR se organiza en una red de nodos, donde un nodo es
básicamente una colección de información relacionada que se puede corresponder con una
palabra, un lexema o un conjunto de lexemas. Cada nodo tiene un conjunto de pares
camino-valor, donde el "camino", consta de uno o más átomos que conforman un
atributo. Por ejemplo, la palabra "finished" puede ser representada en notación
DATR del modo siguiente:
Word:
<syn cat> = verb
<syn type> = main
<syn form> = passive participle
<mor form> = finish ed.
Como se puede comprobar en este simple ejemplo, la sintaxis guarda un enorme parecido con la notación PATR, formalismo del que sin duda desciende DATR. Esta característica es considerada en la actualidad un aspecto negativo por sus autores (Evans & Gazdar 1995:3) ya que una sintaxis determinada condiciona en gran parte una semántica determinada, y ésta mantiene en realidad grandes diferencias con el formalismo de Shieber.
La decidida orientación de DATR a la representación léxica hace que mediante este formalismo sea muy fácil definir una jerarquía de objetos lingüísticos y crear nuevos objetos a partir de otros ya existentes por similitud. Por supuesto, esto se consigue mediante la característica fundamental de DATR: la herencia. En DATR existen dos tipos de herencia: la herencia local y la herencia global.
Ambos mecanismos funcionan del mismo modo: especificando descriptores31 que hacen referencia a un camino, un nodo o un camino y nodo existentes. La siguiente definición del verbo "come" ejemplifica estos tres casos:
Come:
<> == VERB
<mor root> == come
<mor past> == came
<mor past participle> == <mor root>
<syn> == INTRANSITIVE:<>.32
El primer valor heredado es el camino vacío, que hereda de VERB
,
es decir, el valor de Come:<>
es igualado al de VERB:<>
(especificación de nodo). La forma de participio pasado del verbo, <mor past
participle>
hereda de su forma raíz Come:<mor root>
(especificación de camino). El tercer tipo de herencia es la asignación de
intransitividad; en la última sentencia se especifican tanto el nodo como el camino INTRANSITIVE:<>
(especificación de nodo y camino), de este modo la sintaxis de Come
se
iguala al camino vacío de INTRANSITIVE
, un nodo abstracto que define la
sintaxis de los verbos intransitivos.
Los descriptores simplemente expresan restricciones de
igualdad entre un camino o nodo y otro. Por ejemplo. la sentencia
Nodo1:Camino1 == Nodo2:Camino2
se puede leer como "si el valor para Nodo2:Camino2
es definido,
entonces el valor de Nodo1:Camino1
se define e iguala a él".
En suma, la aplicación de la herencia múltiple por defecto es la característica más destacable de DATR, y en este sentido, supera las posibilidades de PATR. Sin embargo, DATR no ofrece la posibilidad de especificar valores complejos estructurados (estructuras embebidas).
Ya hemos estudiado la aplicación que esta deseable característica posee, y el uso que de ella hace PATR. Una segunda crítica, señalada al igual que la anterior por Daelemans & van der Linden (1992), también a favor de PATR, es la utilización de caminos recursivos en lugar de nombres de atributos atómicos. También volvemos a mencionar la no inclusión en el formalismo del mecanismo de unificación, así como la dificultad de utilizar DATR para representar gramáticas basadas en este concepto. Esta dificultad, sin embargo ha demostrado ser salvable, por ejemplo, Duda (1994) muestra el desarrollo de interfaz entre DATR y PATR que pretende aprovechar las facilidades en cuanto a representación del primero y las posibilidades de proceso del segundo, combinándolos en un único entorno.
La aplicación del formalismo DATR a gramáticas basadas en herencia sin unificación también es posible, tal como la Word Grammar (Hudson 1990), como prueban trabajos como Poch (1992).
Otra característica positiva de DATR es que también permite especificar transductores de estados finitos, por lo que resulta un buen entorno para la generación y análisis morfológicos.33 En comparación con PC-PATR, sin embargo, la integración de éste con el que es sin duda el mejor analizador morfológico, PC-KIMMO, hace que las prestaciones de DATR en este sentido se queden muy atrás.
NOTAS
<VERB>
" en la primera sentencia del siguiente ejemplo).
Anterior I Siguiente I Índice capítulo 4 I Índice General