• No se han encontrado resultados

El caos ordena la lingüística La ley de Zipf

In document Caos, Fractales y Cosas Raras (3a. Ed.) (página 130-132)

XVIII Estructuras biológicas raras La sabia evolución

XXI. El caos ordena la lingüística La ley de Zipf

EN TODO texto escrito hay palabras que se repiten. Por ejem- plo, la preposición "de". Así, en un texto se puede contar cuán- tas veces aparece "de" y se encuentra un número. Si éste se di- vide entre el número total de palabras del texto, se obtiene su frecuencia y, de esta manera, la frecuencia de cada palabra que aparece en un escrito.

Ahora se enlistan las palabras del texto colocando en primer lugar la palabra que aparece con mayor frecuencia; en segun- do la palabra con segundo valor de frecuencia, y así sucesi- vamente. Al lugar que ocupa una palabra en ese texto se de- nominará rango de la palabra. Supongamos que en un texto la palabra de más frecuencia es "de"; en la lista ocupará el pri- mer lugar y por tanto tendrá el primer rango. Si el artículo "el" tiene segundo valor de la frecuencia ocupará el segundo lugar en la lista y tendrá rango dos, etcétera.

Del estudio de diferentes textos en varios idiomas se en- cuentra que existe una relación entre la frecuencia de una pa- labra y su rango. En efecto, mientras mayor sea el rango de una palabra, menor será la frecuencia con la que aparece en el texto. Esto es claro, ya que mientras mayor sea su rango, más abajo estará la palabra en la lista, lo que significa que menor será su frecuencia. ¿Cómo depende la frecuencia del rango? Pues resulta que depende en forma inversa (porque disminu- ye a medida que el rango aumenta) de la primera potencia del rango. Si denotamos con la letra f a la frecuencia y con la letra r al rango, entonces la relación matemática es que f depende de r como (1/r) (véanse los capítulos XIV y XV). Este resulta- do se llama la ley de Zipf.

Nos damos cuenta de que esta dependencia es precisamen- te la misma que se obtiene para otros fenómenos que ya estu- diamos y que recibe el nombre de dependencia (1/f). Como ya se vio, esta dependencia es la de una ley de potencias; en este caso la potencia -1, matemáticamente hablando. Y ya sa-

bemos que esta ley de potencias implica un comportamiento autosimilar.

La ley de Zipf también da la dependencia de la frecuencia de ocurrencia de una palabra con respecto al número de pala- bras que se usen, o sea, a la amplitud del vocabulario utilizado. Mientras menor sea el vocabulario, mayor será la frecuencia de las palabras en los primeros rangos. Así por ejemplo, en un texto en español con un vocabulario de alrededor de 10000 palabras, las frecuencias de las palabras de mayor rango, como "de", "el", "y", son 0.11, 0.06, 0.33, respectivamente.

La dependencia que indica la ley de Zipf se encuentra no solamente en muchos de los idiomas modernos, sino también en lenguajes especiales como la hagioantroponomía, que estu- dia el empleo del nombre de los santos como sobrenombres o apodos de personas; también lo estudia en su uso relativo a los apellidos de familias.

La ley de Zipf tiene vigencia no solamente en el lenguaje en general sino en la obra de escritores en particular. Por ejem- plo, en el caso de un buen escritor cuyo vocabulario activo sea de, digamos, unas 100000 palabras, las palabras que ocupan los primeros 10 lugares en la lista llenan alrededor de 25% del texto, es decir, la frecuencia total de estas 10 palabras es de 0.25. En contraste, en un texto en el que se usara una décima parte de aquel vocabulario (unas 10000 palabras), como el de un periódico, el porcentaje apenas crece a 30%. Esto se debe principalmente a que el escritor no podría evitar el viso de pa- labras como "de", "el", "y", "a", etc., las que generalmente ocu- pan los primeros rangos en cualquier texto.

Una de las formas de entender el origen de la ley de Zipf ha sido considerada con razonamientos como los que siguen: es cierto que los lenguajes han sido producidos por el cerebro humano que genera su estructura; se ha hecho el análisis de modelos dinámicos de lingüística acerca de los cuales existe mucho material que ha sido descubierto por la psicología cog- noscitiva, lo que ha permitido hacerse algunas ideas acerca de la forma como procesa la información un agente biológico, como el cerebro humano.

Se ha descubierto que esta dinámica presenta comporta- mientos caóticos como los que describimos en el capítulo VIII. Esto no debería extrañarnos ya que, como vimos, una de las ca- racterísticas de un régimen caótico es que puede generar varie- dad, mientras que cuando está dentro del régimen periódico, o sea regular, se produce la confiabilidad, ambas características necesarias en el lenguaje. La variedad permite que haya inno- vación, mientras que la confiabilidad permite que haya orden.

Consecuencia de construir el lenguaje con una dinámica que produzca un régimen caótico es que la estadística que re- sulta con respecto a las palabras sigue la ley de Zipf.

De hecho, este resultado se puede ver de manera más gene- ral. En vista de que muchos tejidos, órganos y sistemas biológi- cos son fractales, dan lugar a comportamientos caóticos que producen una ley, la de Zipf en el caso lingüístico, que tiene estructura fractal.

XXII. Economía.

In document Caos, Fractales y Cosas Raras (3a. Ed.) (página 130-132)