2.2. Estándares para la formalización de contenidos morfosintácticos

ISSN: 1139-8736
Depósito Legal: B-39199-99

2.2. ESTÁNDARES PARA LA FORMALIZACIÓN DE CONTENIDOS MORFOSINTÁCTICOS

2.2.1. DEFINICIÓN DE ENTIDADES

Una vez definidos los rasgos y los conjuntos de valores para estos. Langedoen y Fahmy formulan la definición de entidades.

Para ello se asocia un código alfanumérico a cada nombre y valor de rasgo. Los códigos de nombres de rasgos deben ser todos diferentes entre sí, aquellos que se refieren a valores de rasgos de una determinada categoría deben únicamente diferenciarse entre los de esta misma categoría. Es decir, si N es el código correspondiente a un valor del rasgo categoría, N debe ser distinto del resto de los códigos de los valores de categoría. Además, dentro de la categoría N, los códigos de los distintos rasgos y los valores correspondientes a cada uno de ellos serán también diferentes entre sí.

Para construir una definición de entidad para un determinado par atributo-valor, se concatena el código del nombre del rasgo y el código para el valor del rasgo mediante "-". Por ejemplo, supongamos que C es el código para el nombre del rasgo "categoría" y N es el código para el valor "nombre". Entonces, la entidad que representa este par atributo-valor es la siguiente:

&C-N
<! ENTITY C-N	"Feature
	name=CATEGORY> <atomic> NOUN </atomic> </feature>">

que es la entidad correspondiente a la siguiente estructura:

Supongamos ahora que queremos codificar la estructura de rasgo de un nombre en caso nominativo. La representación completa de estructura de rasgo sería la siguiente:

<f. struct>
     <feature name=category>
          <atomic> noun </atomic>
     </feature>
     <feature name=case>
          <atomic> nominative </atomic>
     </feature>
<(/f. struct>

Esta estructura puede ser codificada, usando las entidades C-N y K-N:

<f. struct> &C-N;&K-N; </f.struct>

Puesto que los códigos para los valores de los rasgos de una determinada categoría deben ser distintos entre sí, podemos representar la entidad anterior concatenando únicamente los valores de los distintos rasgos:

&NN

que correspondería a la siguiente entidad

<!ENTITY NN " <f.struct> &C-N; &K-N; </f.struct>">

De la misma manera podemos representar una estructura más compleja como puede ser la de un nombre plural, masculino, en nominativo con letra inicial mayúscula y no propio de la siguiente manera:

&NPMNU5

De esta forma y combinando los partes atributo-valor que se proponen en el documento TEI AI 1W2 para las distintas lenguas comunitarias y el ruso llegaríamos a definir los membretes que identifican a todos los elementos (signos de puntuación, palabras, grupos de palabras) que aparecen en estas lenguas.

El problema surge cuando tratamos de analizar las distintas lenguas con el sistema propuesto de rasgos basados en pares atributo-valor.

Se hace absolutamente necesario especificar muy claramente qué conjunto de nombres de rasgos son relevantes en la codificación específica que nos proponemos desarrollar, qué valores de rasgos pueden presentar, cómo se representan valores sub o inespecificados y valores por defecto, ... Para ello se elabora el documento TEI AI 1W3 que, como los anteriores, constituye un borrador en el que se dibujan algunas propuestas para la resolución de problemas.

Anterior I Siguiente I Índice capítulo 2 I Índice General

ISSN: 1139-8736
Depósito Legal: B-39199-99