ISSN: 1139-8736 |
4. Corpus y metodología
El material analizado en esta investigación es, como ya se anunció, un macrocorpus compuesto por dos corpus recogidos en 1977 y 19879. Ambos corpus, que pertenecen al Instituto de Filología "Andrés Bello" de la Universidad Central de Venezuela, provienen de grabaciones (de media hora de duración cada una) de hablantes nativos caraqueños. El corpus recogido en 1977 consta de 70 grabaciones, distribuidas según la edad (dos grupos generacionales: GG1 = de 14 a 30 años (34 hablantes); GG2 = de 30 a 45 años (36 hablantes)), el nivel socieconómico (tres niveles: alto (35 hablantes); medio (35 hablantes) y bajo (36 hablantes)) y el sexo (35 hombres y 35 mujeres) de los hablantes. El corpus recogido en 1987 consta de 160 grabaciones distribuidas equitativamente según la edad (GG1 = de 14 a 30 años; GG2 = de 30 a 45; GG3 = 45 a 60; GG4 = de 60 en adelante), el nivel socioeconómico (cinco niveles: alto, medio alto, medio, medio bajo y bajo) y el sexo de los hablantes (80 hombres y 80 mujeres)10. El cuadro 2 recoge las características de ambos corpus:
Cuadro 1. Distribución de los hablantes en los corpus analizados
|
Corpus 1977 |
Corpus 1987 |
Total |
||||||||||||||
|
Nivel socioeconómico |
Nivel socioconómico |
|
||||||||||||||
|
alto |
medio |
bajo |
alto |
medio alto |
medio |
medio bajo |
bajo |
|
||||||||
Edad |
H |
M |
H |
M |
H |
M |
H |
M |
H |
M |
H |
M |
H |
M |
H |
M |
|
GG1 |
6 |
5 |
6 |
5 |
6 |
6 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
74 |
GG2 |
6 |
6 |
6 |
6 |
6 |
6 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
76 |
GG3 |
- |
- |
- |
- |
- |
- |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
40 |
GG4 |
- |
- |
- |
- |
- |
- |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
4 |
40 |
Total |
12 |
11 |
12 |
11 |
12 |
12 |
16 |
16 |
16 |
16 |
16 |
16 |
16 |
16 |
16 |
16 |
230 |
H = hombre; M = mujer.
La búsqueda inicial de las cláusulas SH y SF fue realizada mediante la utilización del programa WordSmith Tools (Scott 1999), que sirvió para buscar todas las construcciones con el verbo ser conjugado.
Para la preparación del material sometido a estudio se seleccionaron en una primera instancia todas las construcciones con la estructura ilustrada en los ejemplos (1a-b) al inicio de esta comunicación. Después se procedió a eliminar aquellas oraciones que, bajo la apariencia de seudohendidas, no podían considerarse tales por lo siguiente: i) el relativo inicial tenía un antecedente léxico implícito, contextualmente recuperable; ii) el constituyente postcópula funcionaba como atributo de la entidad referencial presentada en la cláusula precópula. A continuación se suministra un ejemplo de cada tipo:
(3) | a. | hay óperas mucho más... digamos, dramáticas, y más pesadas, que a lo mejor te gusta oírlas cuando estás un poquito... deprimido, etc. ¿no? y obras mucho más alegres como el principio de La Traviata, por ejemplo, algo así que [...] estás contento y te pones a bañar y metes el cassette... entonces... depende mucho, pero realmente la que más me gusta es... Ballo in maschera de Verdi (87-ca1ma)11 |
b. | lo que está escrito es literatura y eso es para enseñar… (77-ca3me) |
En (3a) el antecedente implícito de "la que más me gusta" es "opera" u "obra" (la ópera/obra que más me gusta). En (3b), “lo que está escrito” funciona como una entidad referencial, sustituible por el pronombre "eso", a la que se le adjudica el atributo de ser “literatura”12.
Además de eliminar del corpus las construcciones ilustradas en (3a-b), se procedió a excluir también otras que, si bien podían considerarse seudohendidas, no estaban en alternancia con las SF porque no se encontraron SF verdaderamente similares.13 Se trata de tres tipos de SH: i) las que comienzan por sintagmas limitativos como lo único que, lo primero que, lo último que, lo máximo que, etc., como en (4a) (102 casos); ii) las que cuentan con el proverbo hacer en la cláusula precópula, como en (4b) (139 casos); iii) las que se inician con lo que pasa, lo que ocurre, 14 cuando ese constituyente puede considerarse un marcador conversacional, como en (4c) (140 casos). A continuación se ofrecen ejemplos de los tres tipos de SH eliminados del presente estudio:
(4) | a. | Lo único que como es langosta (77-cb1ff) |
b. | yo lo que hacía era rezar (87-ca3fb) | |
c. | lo que pasa es que pelea mucho (77-cb1fa) |
Para haber poder hablar de variación entre las SH ilustradas en (4a-c) y las SF correspondientes, deberían haberse encontrado en el corpus SF como las ilustradas en (5a-c), respectivamente, cosa que no sucedió:
(5) | a. | únicamente como es langosta |
b. | yo hacía era rezar | |
c. | pasa es que pelea mucho |
En el corpus sí se incluyeron los casos en que dentro de la CLA estaba presente el adverbio más, como se ilustra en (6)15:
(6) | a. | la que más así discute con ella soy yo (77-cb5fe) |
b. | también me gustan los "surps" pero me gusta más es la salsa (77-ca5fe) | |
c. | más que todo se ve es política (77-ca3ma) |
Notas
9 El estudio de la variación entre SH y SF d el corpus-77 ya fue parcialmente realizado en Sedano 1995, y el del corpus-87, en Sedano 2003 . Lo que no se ha hecho hasta ahora es analizar ambos corpus conjuntamente y someter los datos al programa GoldVard.Volumen 23 (2006) ISSN: 1139-8736 |