ISSN:  1139-8736
Depósito Legal: B-39199-99

3.1.14.  LA CATEGORÍA RESIDUAL

Como veíamos en 2.1.2. Leech y Wilson asignan la categoría "residual" a todas aquellas clases de unidades o palabras textuales ("textword") que quedan fuera de las categorías gramaticales tradicionalmente aceptadas.

Codificación

TIPO EXTRANJERA FÓRMULA SÍMBOLO ACRÓNIMO
ABREVIATURA SIN CLASIFICAR1

Codificaremos como "extranjeras" todas aquellas palabras cuya secuencia de fonemas no se ajusta a los patrones del español. En este orden de cosas hemos de advertir que no se codificará como "extranjera" todas aquellas palabras (muchas de las árabes, por ejemplo) cuya grafía se haya adaptado a la nuestra o todas aquellas que aparezcan en un atlas, por ejemplo, con grafía estandarizada2.

Otra advertencia sobre el uso de este membrete consiste en no codificar como "extranjera" las palabras que aparecen mencionadas pero no usadas en el Corpus.

TEI P1 propone incluir en el membrete de "extranjero" un atributo <lang> para indicar la lengua a la que pertenece la palabra en cuestión. De manera optativa recomienda también la especificación en este membrete del atributo <uso> a fin de indicar el modo de empleo de la palabra o expresión.

Aunque son dos rasgos que de momento no hemos adoptado en nuestro esquema de codificación, los señalamos aquí como una propuesta para el refinamiento en la codificación de palabras extranjeras.

Fórmulas y términos científicos

Una fórmula es una notación especial para expresar una declaración en matemáticas, química,etc.

TEI P1 recomienda dos membretes para la codificación de fórmula: <formula> y <formula.ext>, según la fórmula aparezca en línea, es decir, como parte del texto en curso, o desplegada, separada del texto que la rodea. Recomienda que el contenido de este elemento se exprese usando una notación externa especificada mediante un atributo "notación" que mencione el nombre de la notación que haya sido declarada en la DTD vigente.

Aunque TEI P1 no es demasiado claro en la explicación de la codificación de fórmula, apuntamos de nuevo aquí otro caso de refinamiento de esta propuesta de codificación inicial.

Símbolos

Nuestra propuesta de codificación incluirá bajo el membrete "símbolo" una lista abierta y ampliable a partir de la casuística que puede proporcionar la práctica de codificación, que incluye, al menos, los siguientes casos:

Símbolos matemáticos (incluimos secuencias de letras en expresiones como el triángulo ABC, los números irraciones y e)
Las letras (L A, las aes)
Símbolos químicos
Símbolos icónicos
Símbolos específicos de cualquier otra disciplina científica (por ejemplo, *en lingüística)
En general, formas que contengan sub o superíndices.

Su codificación tendrá además los siguientes rasgos.

GÉNERO NÚMERO FUNCIÓN
MASCULINO SINGULAR SUSTANTIVO
FEMENINO PLURAL ADJETIVO

Acrónimos

Consideramos "acrónimo" aquellas palabras formadas por las iniciales, y a veces, por más letras de otras palabras.

TEI P1, como veremos más abajo, codifica "acrónimo" como un tipo dentro de abreviatura.

Morfosintácticamente estas palabras se comportan como sustantivos y en su codificación tendremos en cuenta los siguientes rasgos:

GÉNERO NÚMERO
MASCULINO SINGULAR
FEMENINO PLURAL

Abreviaturas

Consideramos abreviatura a la abreviación de una palabra en la lenguas escrita, por ejemplo, p "página".

Para TEI P1, los grupos de palabras abreviadas pueden etiquetarse como una secuencia con el membrete <abrev>. Este membrete tiene dos atributos optativos:

Completo: Proporciona la forma expandida de la abreviatura.
Tipo: Clasifica las abreviaturas usando términos como título, iniciales, acrónimos, etc.

Morfosintácticamente estas palabras se comportan como sustantivos y su codificación tendrá en cuenta los siguientes rasgos:

GÉNERO NÚMERO
MASCULINO SINGULAR
FEMENINO PLURAL

Incluimos este membrete para dar cuenta de aquellos elementos no encuadrables en ninguno de los tipos anteriores.

En principio daremos a "sin clasificar" carácter de "comodín" a partir del cual pueden surgir otros tipos con características específicas que se sumarían a la categoría residual.


NOTAS

1  Obsérvese que hemos prescindido de cualquier rasgo de codificación distinto de lo estrictamente "tipológico" basado aquí en características puramente físicas.

EAGLES propone la codificación de rasgos "género" y "número" para la categoría residual. Nosotros de momento hemos decidido dejar para un análisis posterior (o anterior si consideramos que esta categoría es previa a lo estrictamente morfológico o morfosintático que trata esta tesis) la codificación de otros posibles rasgos que pensamos debe ser distintivos de cada una de las clases. En este sentido recogemos únicamente algunas propuestas (distintas para cada uno de los tipos) tomadas en algunos casos del capítulo cinco de TEI P1.

2  El principal problema que se encuentra en la práctica de codificación de corpus en cualquier lengua es precisamente decidir qué es y qué no es palabra extranjera. Aparte de estos criterios (tomados de la codificación de las "Convenciones de transcripción del Corpus Oral de la Lengua (tomados de la codificación de las "Convenciones de transcripción del Corpus Oral de la Lengua Española"), recomendamos recurrir al criterio que haya adoptado la Real Academia Española con el fin de actuar de una manera unánime e inequívoca en la asignación del membrete "extranjero".

Anterior  Siguiente  Índice capítulo 3  Índice General


ISSN:  1139-8736
Depósito Legal: B-39199-99