17. Otras formas de análisis
17.2. El análisis de contenido
Se puede afirmar, en sentido amplio, que el a n á l i s i s d ec o n t e n i d o “ es una técnica de interpretación de textos, ya sean escritos, grabados, pintados, filma dos” (Andréu Abela 2001:2) que se basa en procedimientos de descomposición y clasificación de éstos (Losito 1993). En el marco de una investigación social, los textos de interés pueden ser diversos: transcripciones de entrevistas, proto colos de observación, notas de campo, cartas, fotografías, publicidades televi sivas, artículos de diarios y revistas, discursos políticos, etcétera.
Dovring (1954-55: 389), en un artículo sobre la semántica cuantitativa sue ca del siglo XVIII, indica que en dicho contexto se dio la primera m anifesta ción del análisis de material impreso de un modo en el que se vislumbran mu chos de los problemas centrales del análisis de contenido, tal como se lo entiende en las ciencias sociales en la actualidad. Se trata del estudio del año 1743 sobre una colección de 90 himnos religiosos denominados “ Los cantos de Sión” , que generó una importante controversia alrededor de lo que hoy podría mos considerar el núcleo del análisis de contenido: ¿quién dijo qué, a quién, cómo y con qué efecto? Pero, como señala Losito (1993), los problemas de m é todo recién se anticipan de modo más evidente en un trabajo de fines del siglo X IX del psicólogo francés Benjamín Bourbon. Con el objetivo de delimitar el campo de la psicología, y diferenciarlo de la filosofía y la religión, Bourbon ana lizó algunos pasajes del Viejo Testamento, identificando palabras semántica mente medulares —a las que llamó motspleines essentiels— que luego clasifi có en categorías de diversos niveles de generalidad.
En el campo más específicamente sociológico suelen destacarse como ante cedentes del análisis de contenido las investigaciones de Thomas y Znaniecki (1918-1920) sobre los campesinos polacos, en el marco de las cuales examina ron, entre otros documentos, 754 cartas de inmigrantes de esa nacionalidad en Estados Unidos. Este material fue sometido a un tipo de análisis de contenido no cuantitativo; pero los autores de la Escuela de Chicago no llegaron a explicar sus procedimientos más allá de ciertas cuestiones muy rudimentarias referidas al empleo de una lógica inductiva que permitía evitar conclusiones arbitrarias.
Durante las primeras cuatro décadas del siglo X X , y anticipando en cierto sentido los actuales inedia studies (al menos en algunas de sus corrientes y lí-
2 Sensibilizando a su vez acerca del innegable (e importantísimo) papel que tiene el conoci miento personal en dichas tareas de análisis e interpretación.
OTRAS FORMAS DE ANÁLISIS 291
neas de investigación), comenzó a difundirse en Estados Unidos el interés por analizar materiales periodísticos, alcanzando un gran nivel de desarrollo y di- versificación. Dichas investigaciones se llevaban a cabo fundamentalmente en la Universidad de Columbia, y derivaban del reconocimiento de que los m e dios jugaban un papel político, social y cultural cada vez más importante en la sociedad de la época. Esta cuestión ya había sido destacada por Max Weber en un congreso de 1910 en Alemania, quien incluso propuso investigaciones em píricas sobre los medios de prensa, que por distintos motivos no llegaron a rea lizarse (Losito 1993).
Pero la formalización metodológica del análisis de contenido sólo empieza a tomar forma en los años cuarenta y cincuenta del siglo pasado, cuando se pu blican los primeros manuales especializados. La obra de Berelson (1952), Con tení Analysis in Comunication Research, que retoma desarrollos previos del mismo autor junto con Laszarsfeld, se convertiría casi inmediatamente en la referencia obligada. En su manual, Berelson (1952:18) define al análisis de con tenido como una técnica de investigación para la descripción objetiva, siste mática y cuantitativa del contenido manifiesto de la comunicación” . El énfasis puesto en la objetividad deja entrever que se trata de una perspectiva inscrita en el marco de la concepción estándar de la ciencia, y más específicamente, del consenso ortodoxo típico de las ciencias sociales norteamericanas de la época (véase apartado 2.2).
Por otra parte, tal como indica Stemler (2001), el interés por el tratamiento cuantitativo de los aspectos manifiestos del texto se basa en el presupuesto de que las palabras más mencionadas en él permiten dar cuenta del verdadero fo co de una comunicación. Sin embargo, pronto se reconoció que el análisis de contenido debería ir más allá de un simple conteo de palabras, y en este sentido la propuesta de Berelson fue cuestionada, dando lugar a otras formas de análi sis de contenido que incorporaron la exploración de cuestiones latentes o al menos -c o m o sugiere Krippendorff ( 19 8 0 ) - del contexto, en cuanto “marco de referencia donde se desarrollan los mensajes y los significados” (Andréu Abela 2001: 3).
En la actualidad se suele distinguir entre el análisis de contenido clásico, fiel a la cuantificación de los aspectos manifiestos del texto (aunque en versiones que incorporan algunos elementos contextúales), y el análisis de contenido cualitativo, desarrollado a partir de los años ochenta, que se basa en un conjun to de técnicas destinadas a interpretar su sentido latente u oculto.
^ El reconocimiento de las consistentes críticas que se le hicieron durante los últimos cincuenta años, así como la consecuente incorporación de elementos correctivos” en los métodos de análisis de contenido, hace que estudios de ti po clásico idénticos a los propuestos en la década de 1950 sean en el presente una absoluta rareza. En cambio, como señala Andréu Abela (2001: 20-22), el análisis de contenido clásico se presenta ahora a través de tres tipos: el análisis temático, el análisis semántico y el análisis de redes. El análisis de contenido te mático se centra en la presencia de términos, con independencia de las relacio nes que surjan entre ellos; “ las técnicas más utilizadas son las listas de frecuen cias, la identificación y clasificación temática, y la búsqueda de palabras en
2 9 2 METODOLOGÍA DE LAS CIENCIAS SOCIALES
contexto” . El análisis de contenido semántico pretende ante todo estudiar las relaciones entre los temas tratados en un texto; para esto se define cierta es tructura significativa de relación y se consideran todas las ocurrencias que con- cuerden con ella. Finalmente, el análisis de contenido de redes se centra en la ubicación relativa de ciertos componentes en el texto, asumiendo que la “ red léxica ideológicamente significativa que impregna el discurso se identifica so bre la base de la reiteración y da como resultado un esquema de la organización semántica de este discurso en forma de red” .
El análisis de contenido cualitativo no niega las ventajas del cuantitativo, al que suele tomar como una etapa inicial; sólo que busca enriquecerlo a través de procedimientos interpretativos, tratando de ir más allá de los aspectos m ani fiestos a través de la consideración del contenido latente y del contexto en el que se inscribe un determinado texto (Andréu Abela 2001).
Krippendorff (1980) sugiere que al hacer análisis de contenido el investiga dor debe comenzar por plantearse una serie de preguntas:
1) ¿Qué datos serán analizados? 2) ¿Cómo se los define?
3) ¿Cuál es la población de la cual se los toma? 4) ¿Cuál es el contexto relativo a los datos analizados? 5) ¿Cuáles son los límites del análisis?
6) ¿Cuál es el objetivo de las inferencias?
Sin embargo, debe quedar claro que estas preguntas, en conjunto, tienen sentido si el análisis de contenido se refiere a la estrategia global de investiga ción, no si se recurre a él instrumentalmente con el único fin de analizar textos producidos en el marco de otro tipo de estudio (por ejemplo cuando su uso se limita al análisis de preguntas abiertas en una encuesta, o a las transcripciones de entrevistas en profundidad).-
En todo caso, una vez definido el conjunto de textos (o imágenes a anali zar), la cuestión fundamental es construir un esquema de codificación (coding frame). Esto se puede hacer a príori, cuando las categorías que orientarán el análisis se definen de antemano, a partir de una opción teórica, o siguiendo un recorrido emergente. Esta última modalidad se encuentra mucho más difundi da, y consiste en la construcción‘de una suerte de cuestionario estandarizado ex posta partir de una exploración preliminar de los textos. En efecto, la lectu ra de algunos exponentes del conjunto de materiales por analizar permite iden tificar los temas abordados en éstos, así como las categorías relativas a ellos que aparecen en el texto. En otras palabras, se trata de identificar las “ respuestas implícitas” en el texto a un cuestionario imaginario al cual no responde, pero al que podría haber respondido. El esquema de codificación incluirá todas estas preguntas imaginarias (que pueden ser sólo enunciaciones de temas) y las dis tintas respuestas que para ellas aparecen en los textos preexaminados. Se ex ploran varios textos en esta etapa de construcción del esquema justamente pa ra darle un carácter más completo: basarse en un solo texto podría provocar importantes sesgos, o en todo caso una notable incompletitud.
OTRAS FORMAS DE ANÁLISIS
Con respecto a la construcción del esquema se ha señalado críticamente la tendencia de los investigadores a la autogratificación (self-ful filmen t), es decir, la tendencia a “imponer” categorías que se ajusten a sus hipótesis y presupues tos, sean explícitos o no. Asim ism o, se ha cuestionado el énfasis puesto en aquello que en el texto aparece de modo manifiesto. Para atender a la primera objeción se ha propuesto que la construcción del esquema se haga a partir del consenso entre codificadores (inter-coderagreement). Esto implica dos cosas: 1) que distintas personas construyan marcos individualmente, y que luego al cancen consensos contrastando las propuestas de cada una de ellas, y 2) que una vez definida una versión final del esquema de codificación, ella sea aplica da uniformemente por todos los codificadores (en caso que haya más de uno), considerando de igual modo cada pasaje del texto analizado. Con respecto a la segunda objeción, se ha propuesto incluir en el esquema aspectos contextúales no explícitos, referidos tanto a quien produjo el texto (por ejemplo variables sociodemográficas, afiliación política, etcétera) como al texto mism o (exten sión, tipo de relato, fecha de producción, etcétera).
Es evidente que la primera de las objeciones se relaciona directamente con los clásicos problemas de fiabilidad. A l respecto, el acuerdo entre codificadores también se suele tomar como base de los más difundidos y tradicionales exá menes de fiabilidad en el marco del análisis de contenido. Para esto se recurre generalmente a un coeficiente llamado K de Cohén:
P - P
K = A c
'- P e
donde PA es la proporción de unidades en la que los codificadores acuerdan y Pc es la proporción de unidades en las que el acuerdo se esperaría sólo por azar. Para calcular este coeficiente se parte de una matriz de acuerdos (una simple ta bla de contingencia) en la que cada codificador (de una pareja) representa res pectivamente las filas y las columnas. En las celdas se ubican tanto las frecuen cias empíricas (observadas) como las teóricas (esperadas) (véase apartado 15.2). La sumatoria de las diagonales definidas desde la primera celda (arriba a la iz quierda) hasta la última (abajo a la derecha), tanto de las frecuencias observa das como de las esperadas, resulta en PA y Pc respectivamente. El coeficiente adquiere el valor 1 cuando el acuerdo en la codificación es perfecto, y o cuando no hay más acuerdo que el esperado al azar. En general, se suelen tomar como sustanciales valores del coeficiente mayores a .6 (Stemler 2001).
Una vez alcanzada la versión final del esquema de codificación, y habiendo controlado el funcionamiento efectivo de los acuerdos entre codificadores en las pruebas piloto, éste se aplica a todos los textos en cuestión. Se trata de inter pelarlos de manera estandarizada a partir de este esquema de codificación. Por otra parte, el esquema constituye la base estructural de una matriz de datos, que luego será completada con los resultados de su aplicación al conjunto de textos bajo análisis. Queda claro que una vez construida y completada la matriz se procede a su análisis estadístico, recurriendo a las técnicas univariadas, biva- riadas y multivariadas habituales (véanse capítulos 14 ,15 y 16).
2 9 4 METODOLOGÍA DE LAS CIENCIAS SOCIALES
Sin embargo, el recurso a las técnicas tradicionales —por vía del análisis de contenido clásico— no constituye la única manera de abordar estadísticamente un texto. Aunque de difusión más limitada, también es frecuente seguir los modelos lexicométricos desarrollados en el marco de la escuela francesa de es tadística textual (Analyse des Données: Benzécri 1973, Bécue 1991, Lebart y Sa lem 1994). Se trata de enfoques más habituales en los estudios de comunica ción, opinión pública y marketing. Ellos se basan en el conteo de las frecuencias de unidades verbales básicas (en general las palabras) sin que medien codifica- ciohes previas, sobre las que luego se realizan distintos tipos de análisis estadís ticos (especialmente análisis de correspondencias). Para esto se dispone de soft wares específicos, especialmente el SPAD.T (Système Portable pour