ISSN:  1139-8736
Depósito Legal: B-39199-99

1.3.2. TEXT ENCODING INITIATIVE (TEI)

La Text Encoding Initiative (TEI) es un proyecto internacional que pretende crear un estándar de codificación que facilite el intercambio de texto en formato electrónico.

La TEI surge en 1987 en un Simposio de la Association for Computers and the Humanities en Vassar College.

En esta reunión se definen tres objetivos principales para el proyecto:

1.  Definir un formato de intercambio de textos codificados electrónicamente
2.  Proporcionar un conjunto de recomendaciones o líneas maestras para la codificación de nuevo material textual. Éstas deberán codificar tanto los rasgos que tendrán que ser codificados como el modo de codificarlos.
3.  Documentarse sobre los sistemas de codificación ya existentes y desarrollar un metalenguaje que los describa. En este sentido se adoptará como metalenguaje, en la medida de lo posible, el estándar ISO 8879 (Standard Generalized Markup Language).

Después de la reunión de Vassar, la ACH, la Association for Literary and Linguistic (ALLC) y la Association for Computational Linguistics (ACL) se unieron como co-patrocinadores y precisaron un plan de trabajo de cuatro años para lograr los fines del proyecto. La financiación procede de la American National Endowment for the Humanities y las Comisión de las Comunidades Europeas (DGXIII), the Canadian Social Science and Humanities Research y la Andrew W. Mellon Foundation.

El plan de trabajo está coordinado por un Comité Directivo ("Steering Commitee") de seis miembros integrado por dos representantes de cada una de las organizaciones patrocinadoras (ACH, ALLC y ALC). Dos editores C. M. Sperberg-Mc Queen y Lou Bournard coordinan los cuatro comités de trabajo ("Working Committes"), cada uno de los cuales responde de una parte del trabajo:

El Comité 1, The Committe for Text Documentation, se ocupa de lo relacionado con la catalogación e identificación de rasgos básicos de los textos codificados. Recluta sus miembros entre personas que trabajan en archivos y bibliotecas.

El Comité 2. The Committe for Text Representation, se encarga de la codificación de aspectos tales como el formato o la apariencia del texto y los conjuntos de caracteres.

El Comité 3. The Committe for TextAnalysis and Interpretation se encarga de suministrar conjuntos de membretes específicos de las distintas disciplinas asociadas a los procedimientos de análisis propios de éstas, aunque de modo tal que permita su ampliación y generalización a otras disciplinas que utilicen procedimientos análogos.

El Comité 4. The Syntax and Metalanguage Committe. Una vez decidido el marco sintáctico de SGML como el más adecuado para todas las aplicaciones previstas dentro de la perspectiva de la TEI, proporciona la sintaxis básica de este metalenguaje, considerando hasta qué punto son recomendables todos los rasgos SGML. Revisa los principales sistemas existentes y desarrolla un metalenguaje formal con el que describir tanto estos sistemas como el desarrollado por las líneas maestras y establece una correspondencia con todo ello.

Una vez terminada la primera etapa del trabajo (Junio 1988-1990) en Julio de 1990 y como consecuencia del trabajo de estos cuatro comités se publican las Guidelines for the Encoding and Interchange of Machine-Readable Texts (TEI P1)i.1

En la segunda etapa de trabajo (Junio 1990-Junio 1992) se empiezan a revisar y ampliar los principios de codificación TEI P1 y los cuatro comités iniciales se transforman en trece con tareas más específicas.

Comité 1 Character Sets. Entre sus objetivos se incluye la creación y validación de una declaración de un sistema de escritura ("Writing System Declaration") para las nueve lenguas comunitarias (en su forma antigua y actual) y para eslavo, hebreo, etc.

Comité 2 Text Criticism. Se ocupa del todo el aparato crítico textual (glosas, notas del editor, lecturas dudosas, etc).

Comité 3 Hypertext and hypermedia. Entre sus objetivos incluye las evaluaciones tanto de los mecanismos disponibles para incorporar texto codificado según TEI P1 en sistemas hipertextuales ya existentes (por ejemplo, Hypercard, Guide) como de la posibilidad de usar TEI P1 como interlengua para estos sistemas.

Comité 4 Cuadros y fórmulas matemáticas. Trabaja con otros proyectos (por ejemplo, the American Mathematical Society, the American Association of Publishers, ...) revisa propuestas ya existentes y trata de integrarlas en le trabajo de TEI P1.

Comité 5 Language Corpora. Entre sus objetivos incluye buscar recomendaciones para las clasificaciones de texto de acuerdo con el tipo textual, tema, estrato sociolingüístico, ...

Comité 6. Phiysical description of mss and incunabula.

Comité 7. General Linguistics. Representación de análisis lingüístico como haces de rasgos atributo-valor, estructuras de árbol, alineamiento.

Comité 8. Spoken texts Se plantea todo lo relacionado con los problemas de transcripción de textos orales.

Comité 9. Literary Studies. Se encarga de la codificación de estructuras narrativas, métrica, estilística, influencias literarias, atribución de autor.

Comité 10. Historical Studies. Codificación de los rasgos textuales necesarios para la realización de estudios históricos.

Comité 11. Machine-readable dictionaries. Codificación de diccionarios impresos mono o multilingües, sin pérdida de ifnormación. Codificación de diccionarios modernos, etimológicos, históricos, ...

Comité 12. Computational lexica Utilización y codificación de recursos léxicos utilizados en sistemas de procesamiento del lenguaje natural.

Comité 13. Terminological Databases Estudio de los recursos terminológicos existentes. Propuestas de codificación en consonancia con las presentadas por INFOTERM y otros proyectos internacionales relacionados con la estandarización.

Tras el establecimiento de estos grupos de trabajo, se han sucedido las reuniones y presentaciones de borradores o trabajos. En este momento existen además listas públicas en las que se puede obtener información y trabajos disponibles sobre lo que será TEI P2.2


NOTAS

1 En este momento disponemos de una traducción al español de estas Normas de Verónica Zumárraga y Marcela Tabanera bajo la dirección de Francisco Marcos Marín en el marco de las actividades conmemorativas del Quinto Centenario.

2 Sobre los contenido de TEI P2 y la manera de obtnerlos, consúltese TEI EDJ8 "TEI Information Sheet: Obtaining TEI P2 and Using TEI-L".
La dirección de TEI-L (uno de los directorios públicos de TEI) es listserv@uicvm.uic.edu. Para suscribirse "susbscribe TEI-L J.Q. Public".

Anterior  I  Siguiente  I  Índice capítulo 1  I  Índice General


ISSN:  1139-8736
Depósito Legal: B-39199-99