ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez

2.7 Lexicografía basada en corpus

La lexicografía suele definirse como la descripción del vocabulario de una lengua, materializada en el complejo proceso de compilación de diccionarios. Esta descripción se hace por medio de una serie de principios lingüísticos, tomados normalmente de la lexicología (Lipka 1990; Tomaszczyk & Lewandowska 1990), y metodológicos, recogidos normalmente en manuales y publicaciones de lexicografía teórica (Alvar 1983; Haensch et al. 1982; Hausmann et al. 1989, 1990, 1991; Hartmann 1983; Chrisholm 1993, Hartmann & James 1998, Osselton 1995, etc.). La teoría y práctica de la lexicografía implica múltiples aspectos de entre los que, para resaltar la importancia y utilidad de los córpora, nos centraremos fundamentalmente en la obtención de información para la compilación de las entradas del diccionario.

Los lexicógrafos siempre han buscado fuentes de información para obtener la información necesaria para la descripción lingüística. Estas fuentes han sido, tradicionalmente (i) la intuición, (ii) otros diccionarios, (iii) fuentes tradicionales de recopilación manual de información sobre el uso de las palabras (citas de autores reconocidos, periódicos, libros, etc.) (Sinclair 1993). Por muy usual que haya sido durante siglos, confiar la descripción lingüística solamente a estas tres fuentes acarrea una serie de problemas.

La primera de las fuentes, el conocimiento intuitivo del lexicógrafo, plantea los mismos problemas que se han señalado en numerosas ocasiones en referencia al estudio lingüístico general. Las introspecciones del lexicógrafo pueden no ajustarse a la realidad, o al menos al uso lingüístico más frecuente. Confiar sólo en la introspección puede llevar al lexicógrafo a no darse cuenta de ciertas regularidades en el uso o significado de las palabras, o a pasar por alto estructuras sintácticas o colocaciones que son relevantes y deben incluirse en el diccionario.

La segunda de las fuentes de información (otros diccionarios), plantea problemas de otra índole, aunque esta práctica es mucho más frecuente y tácitamente aceptada de lo que pueda parecer a primera vista. No debemos olvidar que las descripciones lingüísticas hechas durante décadas son sin duda muy valiosas y acumulan gran cantidad de información que no se puede desdeñar a priori pero, por otra parte, debemos tener en cuenta que, de este modo, es muy difícil asegurarse de que no se siguen incluyendo en diccionarios usos o acepciones obsoletas (al menos sin indicarlo expresamente), o que no se incluyen distinciones de significado que se han incluido durante décadas en los diccionarios, pero que no se ajustan a la realidad del uso de los hablantes y, por supuesto, no constituyen una fuente de información apta para realizar una descripción actualizada de la lengua de estudio.

La tercera de las fuentes, la recopilación manual de citas, es un trabajo valiosísimo a la vez que tedioso y muy limitado, ya que sólo suelen recogerse citas que dan cuenta de curiosidades lingüísticas o usos que han llamado la atención del lexicógrafo.

Estas tres fuentes de información, aunque parcialmente válidas, no se consideran hoy día suficientes para la ardua labor de compilación de diccionarios (tanto monolingües como bilingües) que quieran dar una visión actualizada y completa del uso lingüístico. Existe, sin embargo otro tipo de fuentes que pasamos a considerar a continuación.


Índice General I Índice Capítulo 2 I Siguiente

ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez