MARCO TEÓRICO
2.1. De la frecuencia a la disponibilidad
Es lógico que la metodología empleada para el estudio del léxico disponible, las fórmulas matemáticas aplicadas y los procedimientos estadísticos, así como los fundamentos epistemológicos que enmarcan los estudios cuantitativos del léxico hayan experimentado en el último medio siglo una revisión constante. Los postulados de la léxico-estadística a principios de la década de los 50 consideraban que el factor de selección más significativo (y exclusivo) para establecer el repertorio léxico compartido por una determinada sintopía era el índice de frecuencia20 (cfr. Michéa, 1949). Sin embargo, los recuentos realizados para la elaboración del Français Élémentaire ofrecían unos listados jerarquizados en orden decreciente, que mostraban una realidad parcial: si bien aparecían palabras gramaticales, sustantivos de carácter general, verbos y adjetivos, había otras que o bien reflejaban una frecuencia muy baja y quedaban excluidas de los recuentos, o no aparecían algunas de contenido semántico concreto (fourchette, lettre, timbre, ...), que eran muy conocidas y usadas por los hablantes. Era evidente, pues, que las frecuencias no podían considerarse, por sí solas, los índices más adecuados para la elección de aquellos vocablos que debían constituir el léxico fundamental21.
El primer reajuste de aquellos principios teóricos y metodológicos se centró en diferenciar palabras frecuentes, palabras comunes y palabras usuales22, ya que se había comprobado que algunos términos comunes, e incluso usuales, no eran frecuentes (cfr. Gougenheim, 1963, 1967). Además, se observó que la escasa frecuencia de ciertas palabras, especialmente sustantivos, se debía a que la producción léxica de los informantes estaba condicionada por el tema; se trataba de palabras ‘temáticas’ frente a otras que aparecían con mucha frecuencia, independientemente del tema, y que se clasificaron como ‘atemáticas’. Michéa (1950) ya observó que las palabras
20
El índice de frecuencia representa el número de veces que aparece una misma palabra o unidad léxica en el recuento de un corpus. Intenta mostrar los vocablos que se utilizan en una determinada comunidad de habla, pero pone de manifiesto ciertas limitaciones de los hablantes a la hora de manejar el caudal léxico de su lengua materna.
21
Carcedo (1998a: 6-22) expone, desde una perspectiva evolutiva, el desarrollo de los estudios léxico- cuantitativos: listas de frecuencia, léxicos básicos y disponibilidad léxica.
22
En el caso del español y desde una perspectiva particular, García Hoz (1953, 1967), tras el recuento de medio millón de vocablos pertenecientes al lenguaje oficial, familiar, informativo y de cultura general, establece el vocabulario usual, constituido por 12913 vocablos con una frecuencia media de 100; es el conjunto de palabras que emplea cualquier persona y que los estudiantes deben saber al finalizar la etapa escolar. De entre ellos, selecciona las 2171 voces más repetidas y forma el vocabulario común, presentes en los cuatro mundos seleccionados y con frecuencia superior a 40; son las palabras que se usan en todas las situaciones en las que el hombre se encuentra en la familia, en el trabajo y en la calle; es el vocabulario más importante y el primero que debe enseñarse en la escuela. Por último, selecciona los 210 vocablos que constituyen el vocabulario fundamental, con frecuencia no menor de 400 veces; son las palabras que más se repiten y las más conocidas por los niños en su momento de ingreso en la escuela.
estadísticamente más inestables estaban vinculadas a áreas temáticas concretas. Parecía obvio que una palabra frecuente fuera una palabra usual; pero diferentes trabajos experimentales pusieron de manifiesto que existía una asociación entre el léxico disponible y la situación comunicativa concreta; de ahí surgió la idea de trabajar con pruebas asociativas. Se inició la recolección del léxico disponible de una comunidad mediante la aplicación de técnicas asociativas controladas, que posibilitaban que los individuos actualizaran unidades léxicas, esencialmente, de carácter paradigmático, a partir de determinados centros de interés, los cuales actuaban como estímulos verbales para los hablantes; de ahí surge el concepto de disponibilidad; es decir, hay palabras que tienen escasa o nula probabilidad de aparecer si no es al hablar de determinados temas. Fue Michéa el primer lingüista que utilizó el término y lo definió así (1953: 342):
En présence d’une situation donnée, les mots que viennent les premiers à l’esprit sont ceux qui sont liés tout spécialment à cette situation et la caracterissent ... Un mot disponible est un mot qui, sans etre particulièrement fréquent, est cependant toujours pret à être employé, et se présente inmédiatement à l’esprit ou moment oú l’on en a besoin.
Los investigadores franceses destacan la relevancia del concepto de disponibilidad y la consideran como un complemento necesario de la información que suministran los diccionarios de frecuencias. El propio Michéa (1953: 341) estableció la oposición entre palabras frecuentes y palabras disponibles23 al considerar la disponibilidad como
“proprieté que possède un mot d’être evoqué d’une façon plus ou moins inmediate au cours de
l’association des idées”, concepción que posibilita interpretar la disponibilidad léxica
como el caudal léxico utilizable en una situación comunicativa dada. Era evidente, pues, que la frecuencia por sí sola no es un índice válido de uso y, por ello, quedaron establecidos dos tipos de vocabulario: frecuente y disponible. La importancia adquirida por el grado de disponibilidad es destacada por Gougenheim et alii (1964: 152)24:
Cette notion de degré de disponibilité correspond à la présence plus o moins immediate de ces mots dans notre memoire. Elle offre donc un intérêt à la fois linguistique, psychologique et pédagogique. Elle est de la plus haute importance pour l’établissement méthodique d’un vocabulaire de base qui ne soit pas uniquement un dictionnaire de fréquence.
Era el momento en que combinando el léxico frecuente (palabras más estables) y el léxico disponible (palabras que se actualizan al tratar determinados temas), se denominó léxico fundamental a la conjunción de los dos anteriores.
Otro gran avance que se produjo en la léxico-estadística vino motivado porque los índices de frecuencia también guardaban relación con el tipo de corpus seleccionado y
23
Las palabras ‘temáticas’ se relacionarán con el vocabulario de interés (disponible) y las ‘atemáticas’, con el vocabulario general (frecuente).
24
ello dio lugar a los léxicos básicos. En la década de los 60, los teóricos se plantearon cuál debería ser el corpus más adecuado para el análisis, pues si se quería mejorar la representatividad de los recuentos (conteos) léxicos, era necesario partir de material diverso, es decir, utilizar corpora de diferentes dominios para tomar en consideración no solo la mayor o menor frecuencia sino su aparición en diferentes áreas temáticas; asimismo, parece haber acuerdo general en que la lengua escrita es la que ofrece más posibilidades de tratamiento adecuado y riguroso, ya que ofrece la posibilidad de clasificar los textos, permite incluir cada uno de ellos en un determinado género y, por otro lado, facilita la labor de recolectar un universo completo y uniforme. Así hizo Juilland (1964) en su colección de léxicos básicos de las lenguas románicas al incorporar la idea de dispersión al concepto de frecuencia. Como la frecuencia de las palabras está muy influida por los temas que se desarrollan en los textos seleccionados, en lugar de agrupar todo tipo de textos, se divide el universo léxico en diferentes campos, delimitados ya sea por el contenido, ya sea por las condiciones formales de los mismos, y se observa si una palabra tiene la misma o diferente frecuencia en cada uno de éstos. Así surge el concepto de ‘rango’ o ‘dispersión’, que revela el valor general del vocablo al establecer su omnipresencia en los diversos tipos de texto que constituyen el corpus; en otras palabras, el índice de dispersión mide la distribución de la frecuencia. Como señala Ávila (1999: 75) la función de la dispersión es determinar la estabilidad de las frecuencias en las categorías establecidas; así, la dispersión tiene valor cero cuando todas las realizaciones de este elemento se encuentran localizadas solamente en un tipo de discurso o cuando el elemento en cuestión no aparece en ninguno de los tipos considerados. Por su parte, la dispersión uno indicará que el citado elemento aparece exactamente con la misma frecuencia en todos los tipos discursivos. Asimismo, la dispersión nos permite conocer cómo se distribuyen las apariciones de un mismo elemento en distintos ámbitos o tipos y si se diferencia en mucho o en poco el número de apariciones para cada elemento.
Y un requisito sine qua non para cualquier análisis estadístico que pretenda ser una proyección de la estructura léxica de una lengua es la representatividad del corpus. En general existe coincidencia en dividir el universo léxico en cinco mundos: drama, narrativa, ensayo, literatura técnico-científica y periodismo. Como señala López Morales (1983: 211)
La aparición de la dispersión en la escena léxico-estadística marcó un paso de avance en la disciplina: su función era determinar la estabilidad de la frecuencia a través de las categorías establecidas, gracias a lo cual los mundos léxicos, entidades homogéneas y diferenciadas entre sí, se convertían en las categorías representativas y básicas de cualquier ponderación.
Retomando los trabajos de frecuencia y disponibilidad, las pautas metodológicas de investigación establecidas por los franceses fueron continuadas en otros estudios, aunque con ciertas modificaciones. Así, el yugoeslavo Dimitrijévic (1969) publica su obra relacionada con el inglés de Escocia basada en once centros de interés25, pero mientras Michéa, Gougenheim, Rivenc y Sauvageot utilizan el criterio de listas cerradas de veinte palabras en sus encuestas, éste propone el criterio de listas abiertas con un tiempo fijo. Además, plantea la segmentación de unidades en diferentes tipos, como lexical phrases, ya que las respuestas pueden constar de dos o más palabras, idea que después ampliarán Nattiger y DeCarrico (1992) para la enseñanza del léxico. Un factor interesante es que introduce en las variables de su estudio la inteligencia (nivel o madurez) de los encuestados. Su investigación se realiza en Edimburgo y la población de educación secundaria estudiada se divide en Senior Secondary School (SSS) y Junior Secondary School (JSS).
Otro gran impulsor de estos trabajos fue Mackey (1971a), primer lingüista en percatarse de las ventajas que los trabajos de disponibilidad léxica presentaban para el estudio de las peculiaridades culturales, al señalar que la disponibilidad es una medida de las diferencias culturales y demostrar los grados de diferencias culturales entre diversas regiones de Francia y de Canadá. En el primer volumen de su obra recoge, esencialmente, los datos franceses y en el segundo se ocupa del francés canadiense; su objetivo era contrastar el léxico disponible de Francia con el del Canadá francohablante a fin de establecer una comparación intralingüística (analizar variedades geolingüísticas de la misma lengua) e intercultural, ya que la influencia que ejerce el medio concreto en el que se desarrolla la vida del hablante sobre el tipo de asociaciones que éste establece ante un estímulo determinado es palmaria. Demostró que las pruebas de disponibilidad léxica descubren en la peculiar organización léxica de los hablantes de una región determinada, el tipo de realidades habituales más fácil y comúnmente evocables en ciertas áreas temáticas. Además, matizó la universalidad de los centros de interés elegidos por Gougenheim et alii (1964), ya que defendía que si atendemos a factores culturales, nivel social o edad de los individuos pertenecientes a una comunidad de habla, dicha relación de estímulos queda relativizada y es necesario incorporar otros nuevos o modificar algunos; de ahí que incorporó seis centros a los dieciséis anteriormente establecidos26. También Galisson (1991: 163) ha considerado esa relación de dieciséis centros de interés excesivamente universalista y semánticamente muy
25
Los centros seleccionados son: (01) Animals, (02) Countryside, (03) Town, (04) Entertainment, (05)
Jobs and professions, (06) Science, (07) Means of transport, (08) Politics, (09) Parts of the house, (10) Food and drink, (11) Clothes.
26
Son: (17) L’eglise et la vie paroissiale, (18) Les sports et l’equipement, (19) Les outils, (20)
amplia (poco precisa en su delimitación). Sin embargo, es obvio que resultará tarea compleja establecer el número de áreas temáticas que debe incluir una investigación que pretenda ser exhaustiva pues es difícil determinar qué estímulos abarcan todos los intereses humanos.
En opinión de López Morales (1996), en la década de los setenta ya se concibe la disponibilidad léxica como el caudal de vocabulario que puede aparecer en una comunicación dada. Este autor (1984) ya manifestó que existían evidencias para diferenciar los léxicos básicos, que ofrecen una proporción real del uso de las diferentes clases de palabras, del léxico disponible, que señala el vocabulario concreto que el hablante podría utilizar en un contexto comunicativo dado. Se trata de dos procedimientos o análisis que, si bien son distintos, en el fondo son complementarios.
Por su parte, Njock (1979)27, siguiendo la línea de Mackey, realiza una investigación sobre diez centros de interés28 y utiliza como medida de la fuerza asociativa el ‘rango asociativo medio’ de una palabra para los informantes encuestados, entendiendo por rango asociativo la posición que ocupa la palabra para cada informante. La hipótesis sobre la que se basa la validez de este índice es que a mayor importancia o disponibilidad de una palabra para un individuo, más rápido la incluirá en su lista- respuesta del centro de interés.
Pero este desarrollo teórico-metodológico de la léxico-estadística no era ajeno a ciertas discrepancias. Especialmente, cabe destacar a Galisson (1971, 1979), quien trata de sustituir los centros de interés por los ‘temas predilectos’, al entender que el tema de predilección es un dominio de experiencia sobre el cual el individuo ejerce de forma preferente su reflexión; asimismo, argumenta que mientras el centro de interés solo ofrece un inventario detallado de referentes, los temas predilectos posibilitan la investigación sistemática de vocablos funcionales, es decir, realmente utilizables en un discurso posible. Este autor señala que los trabajos de disponibilidad clásica, siguiendo los pasos de Michéa, se basaron en una disponibilidad de tipo ‘nominal’ cuando realmente en la lengua hay verbos, adjetivos y adverbios disponibles, además de los sustantivos. La disponibilidad de Michéa no era asociativa puesto que los vocablos que proponía el francés fundamental estaban aislados. La disponibilidad que propone
27
Cfr. P. E. Njock (1979): L’univers familier de l’enfant africain. Quebec, CIRB. (apud Mª. J. Azurmendi, 1983).
28
Son: (01) Les parties du corps, (02) La nourriture et les bessoins, (03) Les vetêments (pour hommes et pour femmes), (04) La maison (materiaux de construction et meubles), (05) Le travail au champ, (06) La cuisine (ce qu'on y voit), (07) La salle de classe (ce que tu vois et/ou utilises), (08) Les moyens de locomotion (ce qui te permet de te déplacer), (09) La musique et la danse (les genres), (10) Les jeux et divertissements.
Galisson, tras sus investigaciones, es tanto temática como asociativa; es decir, busca todos los vocablos directa o indirectamente ligados al evocar un campo determinado de la experiencia.
En élargissant son champ de prospection pour en faire le sélecteur unique de toutes les unités lexicals thématisées et de leurs coocurrents privilégiés, nous transformons la disponibilité nominale de Michéa en disponibilité lexématique (1979: 57).
Los vocablos directamente ligados a la evocación de un campo determinado, vocables thématisés, serían los sustantivos y los verbos, y los vocablos indirectamente ligados a la evocación de un campo dado, vocables associés, serían los adjetivos, adverbios y diversas expresiones que los hablantes añaden a los sustantivos y verbos temáticos29.
Les substantifs et les verbes ont ordinairement vocation thématique au premier degré (en général, on peut directment les rattacher à un thème ou à un domaine d’experiénce), alors que les adjectifs et les adverbes ont, le plus souvent, vocation thématique au second degré (en général, on ne peut les rattacher à un thème que par l’intermédiaire des substantifs ou de verbes avec lesquels ils fonctionnent (1979: 84).
Este autor revisó los conceptos del francés fundamental para adaptarlos a la ‘competencia comunicativa’ de Hymes y propuso estudiar una disponibilidad basada en la evocación de determinados campos de la experiencia y que fuera tanto temática como asociativa. Todo ello para concluir (1991) que el aprendiz debe poseer tres tipos de conocimiento sobre el léxico de una lengua extranjera: coocurrents30, correlés31y collatéraux32, graduando estos conocimientos según niveles de aprendizaje. Además, todas las palabras tienen una carga cultural, aunque unas más que otras, y el profesor ha de procurar hacer explícitos los implícitos culturales.
Concluimos este apartado resaltando la trascendencia que supuso el concepto de disponibilidad léxica. Como indica López Morales (1996: 1)
Lo que comenzó a vislumbrarse era que la lengua -toda lengua- poseía un amplio conjunto de palabras de contenido semántico muy concreto, que únicamente manejaba si
29
Galisson propone realizar dos encuestas: una, lexemática, (sustantivos y verbos) y otra, sintagmática, la cual, partiendo de los listados de la primera, recogería la distribución sintagmática de los lexemas anteriores.
30
Manifiestan las relaciones sintagmáticas (‘billete de ida y vuelta’; ‘coche nuevo / de segunda mano’; ‘viejo verde / leña verde / película verde’). Tienen cierta correspondencia con lo que otros autores denominan colocaciones (‘subir / bajar / mantener los precios’).
31
Son palabras de la misma categoría sintáctica y que podrían intercambiarse con ésta; es decir, establecen sus relaciones en el eje paradigmático. Los sinónimos, antónimos, hiperónimos, ... constituyen los correlatos, microsistema léxico (billete / boleto; autobús / autocar, tren / metro, ...)
32
Son términos de la misma familia que la palabra en cuestión (amor, amoroso, enamorar, enamorado, ...).
lo permitía el tema del discurso. O dicho de otra forma: existe en el lexicón mental una serie de términos que no se actualizan a menos que no se necesiten para comunicar una información muy específica.