• No se han encontrado resultados

Elementos básicos de informetría y audiometría

5. Casos prácticos

Como hemos visto hasta ahora, dentro del ámbito de las ciencias de la in- formación se han encontrado regularidades estadísticas que nos permiten des- cribir y realizar estudios técnicos sobre casos prácticos de diferentes disciplinas. Así pues, a continuación veremos algunos casos prácticos, utilizando un soft- ware estadístico (en este caso, Minitab), que muestran de manera sencilla cómo hacer un breve análisis de situaciones reales correspondientes a los ámbitos de la mediametría (aplicada a medios de comunicación), la informetría (aplicada a sistemas de información) y la bibliometría (aplicada a documentación).

Caso práctico 1 (Mediametría)

El objetivo del estudio de este caso es organizar y analizar un conjunto de valores numéricos correspondientes a una determinada variable, por tanto, en este caso será suficiente aplicar las técnicas estadísticas descriptivas correspon- dientes al cálculo de medidas de centralización y dispersión.

Supongamos que se pretende realizar un estudio acerca de la calidad de los noticiarios de televisión. Para ello, se entrevistan a 40 espectadores para que ca- lifiquen entre 0 y 10 los telediarios de las 21.00 h de las cadenas Tele1 y Tele2.

Los resultados obtenidos aparecen en la tabla siguiente:

ESPECTADORES TELE1 TELE2

1 5 7 2 5 6 3 2 7 4 5 6 5 5 5 6 4 8 7 5 6 8 3 7 9 5 7 10 6 7 11 5 8 12 4 7 13 6 6 14 5 7 15 5 9 16 4 7 17 7 7 18 6 7 18 7 6 20 7 7 21 7 7 22 9 6 23 6 6 24 7 5 25 8 6

26 7 7 27 3 8 28 9 7 29 7 8 30 4 7 31 7 6 32 7 8 33 8 6 34 4 4 35 6 7 36 10 6 37 6 7 38 2 7 39 3 7 40 10 9

Para obtener conclusiones acerca de la distribución de los datos, insertamos la información de la tabla anterior en una hoja de trabajo de Minitab:

Posteriormente seleccionamos Stat > Basic Statitistics > Display Descriptive Statistics y seleccionamos las columnas ‘TELE1’ y ‘TELE2’. De esta manera, cal- cularemos las medidas de centralización y dispersión más importantes de estos datos:

Descriptive Statistics: TELE1; TELE2

Variable N N* Mean SE Mean StDev Minimum Q1 Median Q3 Maximum TELE1 40 0 5,778 0,313 1,980 1,968 4,173 5,671 7,171 10,000

TELE2 40 0 6,794 0,153 0,967 4,268 6,312 6,933 7,267 9,218

De los datos anteriores podemos conocer, entre otros, que la media aritmé- tica de la satisfacción de los telespectadores es superior en TELE2.

Para analizar más adecuadamente los datos anteriores, construiremos un diagrama de cajas (boxplot), que nos ofrecerá más información respecto a la simetría de ambas distribuciones.

Para dibujar este tipo de gráficos, seleccionamos Graph > Boxplot, y añadi- mos las columnas ‘TELE1’ y ‘TELE2’. Si queremos mostrar los dos gráficos en el mismo panel, seleccionamos la opción Multiple Graphs y activamos la opción

El resultado obtenido es:

A partir de los gráficos anteriores, podemos deducir que ambas distribucio- nes son bastante simétricas dado que los datos correspondientes a las medias aritméticas y las medianas (línea que parte la caja) son bastante similares.

Por otra parte, vemos que los datos de ‘TELE2’ están agrupados, básicamen- te, en la franja que va de 6,5 a 7,5 y aparecen datos (marcados con *) que se encuentran alejados de dicha franja, estos valores también se llaman outliers. Podríamos decir, por tanto, que en el caso de ‘TELE2’ los datos están poco dispersos, es decir, que la mayoría de los espectadores tiene una valoración parecida del telediario.

Caso práctico 2 (Informetría)

Una de las aplicaciones prácticas típicas de la informetría consiste en ave- riguar si existe alguna correlación entre el impacto de una revista científica (medida por el número de veces que se cita en un año) y su uso (medido por el número de artículos solicitados durante un año).

El ISI (Institute for Scientific Information) establece cada año estas citas y las presenta en el JCR (Journal Citation Report).

En este caso concreto, se anota el número de solicitudes para las 15 revistas más usadas en el mes de enero de 2010 y se consulta el número de veces que se han citado en 2009.

TÍTULOS DE REVISTAS NÚM. DE

SOLICITUDES TOTAL CITAS 2009

Journal of Mathematics 52 189.994

Science and mathematic 65 261.127

Applied Algebra 64 358.844

Mathematical investigation 67 362.272

International Journal of Computational 67 378.848

Publicaciones Matemáticas 85 439.898

Epsilon 50 217.763

Applied Numerical Mathematics 64 436.765

Abstract mathematical 60 414.274

Numbers 59 334.333

Probability and computing 53 267.648

Matemáticas Divulgativas 76 422.933

Mathematical e-learning 63 403.321

Logic and computing 51 207.315

Astronomy 48 94.723

Para realizar un estudio acerca de la relación entre el número de solicitudes y el total de citas, realizaremos un análisis de regresión que nos dará informa- ción sobre el grado de relación entre las dos variables.

Nuevamente, utilizamos el software Minitab para realizar los cálculos. In- troducimos los datos del enunciado en una hoja de cálculo del programa:

Ahora, para comprobar si efectivamente ambas variables están relacionadas, calcularemos la recta de regresión y representaremos dicha expresión, que nos mostrará visualmente si existe o no correlación entre ambas variables. Además, también calcularemos el coeficiente de correlación de Pearson para ambas va- riables.

Para ello, seleccionamos Stat > Basic Statistics > Correlation e insertamos am- bas variables (C2 y C3):

Correlations: CITAS; NUM SOL

Pearson correlation of CITAS and NUM SOL = 0,795 P-Value = 0,000

Este resultado indica que la correlación entre las variables es positiva (coef. Pearson>0) y, dado que es próximo a 1, podríamos afirmar que la correlación entre ambas variables es bastante alta.

Ahora, para calcular la recta de regresión, seleccionamos Stat > Regression >

Los resultados obtenidos son:

De los datos anteriores, entre otros aspectos, obtenemos que la recta de regresión es:

CITAS = - 194.512 + 8.332 NUM SOL

De aquí, podríamos realizar previsiones a partir de conocer el número de solicitudes realizadas o bien el número de artículos citados. Por ejemplo, si qui- siéramos saber cuántas citas de artículos deberíamos encontrar si se han hecho 100 solicitudes obtendríamos:

CITAS=-194.512+8.332*100= 638.688

Por otra parte, el valor R-Sq = 63,2% nos indica que este modelo permite explicar aprox. el 63% del comportamiento de la variable ‘Citas’ respecto a la variable ‘Número de solicitudes’, cuanto más alto sea el valor R-Sq más fiable será el modelo a la hora de realizar predicciones. Además, el valor de P (p-valor) nos servirá para realizar contrastes de hipótesis.

Ahora realizamos un gráfico llamado nube de puntos (fitted line plot). Para ello seleccionamos Stat > Regression > Fitted Line Plot:

Y el resultado obtenido es:

Como vemos en el gráfico anterior, se estima que hay una notable correla- ción entre ambas variables. Este gráfico pretende demostrar que cuanto más próximos estén los puntos a la recta, mayor será la correlación entre las varia- bles.

Caso práctico 3 (Bibliometría)

La disciplina de la bibliometría se aplica a la gestión de documentación (artículos, revistas, etc.).

En este caso, mostraremos un ejemplo en el que se muestran, en miles, el número de personas subscritas a una prestigiosa revista española de documen- tación entre los años 1997 y 2004:

Año Suscriptores 1997 1998 1999 2000 2001 2002 2003 2004 594 811 1.090 1.585 2.339 3.011 3.273 3.667

Dado que solo disponemos de una variable, para realizar el análisis de los datos del enunciado, empezaremos por calcular los estadísticos descriptivos.

Para ello, seleccionamos Stat > Basic Statistics > Display Descriptive Statistics.

Descriptive Statistics: suscriptores

Variable N Mean Median TrMean StDev SE Mean suscript 8 2046 1962 2046 1190 421 Variable Minimum Maximum Q1 Q3

suscript 594 3667 881 3208

En la tabla anterior tenemos representados los parámetros estadísticos más importantes como la media aritmética, la mediana y los cuartiles.

Como la media y la mediana no son iguales, la distribución no es simétrica. De hecho, observamos que la distribución de datos es sesgada hacia la derecha ya que la media aritmética es superior a la mediana.

El diagrama de cajas muestra que el 50% de los datos está en la franja que abarca la caja. El rango intercuartílico es la distancia entre los extremos de la caja (Q3-Q1). La línea que parte la caja corresponde a la mediana (1962).

El diagrama de caja también nos indica que la distribución es sesgada a la derecha ya que el “bigote” que une el cuartil tercero Q3 con el valor máximo es más grande que el que une el cuartil primero Q1 con el valor mínimo de la distribución. Además, se puede observar que la mediana no está justo en el centro de la caja, lo cual indica que la distribución no es simétrica.

Ahora representamos gráficamente, mediante un histograma, la evolución de los datos de los subscriptores, seleccionamos Graph > Histogram:

Para analizar con más claridad la evolución de “subscriptores” a lo largo de los años, también podemos representar un diagrama de barras, seleccionamos

Graph > Chart:

En el anterior gráfico se puede observar claramente cómo las subscripciones se han incrementado progresivamente en los últimos años.

Caso práctico 4 (Mediametría)

En muchos casos, las subvenciones otorgadas a la producción de cine de un determinado país van ligadas a los resultados obtenidos en taquilla por parte de estas. En este sentido se realizan numerosos estudios acerca del número de espectadores que acuden al cine, qué tipo de películas ven y de qué origen.

En el último año, se han recogido los datos que aparecen en la siguiente tabla, acerca del número de películas vistas por un número determinado de espectadores y cuántas de ellas provenían de Estados Unidos o de España.

Número de espectadores Número de películas

españolas Número de películas americanas Menos de 30.000 37 54 Entre 30.000 y 70.000 22 34 Entre 70.000 y 110.000 15 25 Entre 110.000 y 200.000 9 15 Entre 200.000 y 400.000 7 19

Entre 400.000 y 1 millón 4 11

Más de 1 millón 2 9

Total 96 167

Podemos observar, gráficamente, que las películas americanas obtienen más beneficios que las españolas.

6. Conclusiones

Las disciplinas más importantes del ámbito de las ciencias de la información son, entre otras, la bibliometría, la informetría, la cienciometría, la webmetría y la mediametría. Todas estas disciplinas, mediante el uso de técnicas mate- máticas y estadísticas, permiten “medir” la calidad de la información y hacer estudios en este ámbito.

En las ciencias de la información las funciones matemáticas más usuales son la exponencial, la logarítmica y la hiperbólica. Además, se utilizan las variables aleatorias que permiten utilizar el ámbito de la estadística probabilística.

Así, las llamadas leyes de la información más utilizadas son la ley de Zipf, la ley de Bradford, la ley de Lotka y la ley de Price.

Por otra parte, todos los conceptos de estadística, básicamente la estadística descriptiva y la inferencial, también se aplican a las diversas disciplinas de las ciencias de la información.

De la misma manera, estas mismas técnicas matemáticas y estadísticas se pueden aplicar a otra disciplina muy ligada a los medios de comunicación, la audiometría, especialmente la televisión.

7. Bibliografía

Thierry Lafouge, Yves-François Le Coadic, Christine Michel. Elementos de esta-

dística y de matemática de la información.

Juan A. Araújo Ruiz y Ricardo Arencibia Jorge. Informetría, bibliometría y cien-

ciometría: aspectos teórico-prácticos. En: ACIMED. v. 10, n. 4 (2002).

César A. Macías-Chapula. Papel de la informetría y de la cienciometría y su perspec-

tiva nacional e internacional. En: ACIMED. v. 9. Suplemento (2001).

Tomás Aluja. La minería de datos, entre la estadística y la inteligencia ar- tificial. UPC.

Webgrafía [Consultada: 15/06/2011]

http://www.razonypalabra.org.mx/actual/mlopez.html: Revista electrónica de América

Latina

http://www.ejournal.unam.mx/ibi/vol16-33/IBI03305.pdf: Artículo de la Universidad de California (Rubén Urbizagastegui Alvarado)

http://www.papelenblanco.com : Blog sobre literatura

http://recursos.cnice.mec.es/media/publicidad/bloque8/pag3.htm : Media Publicidad http://www.barloventocomunicacion.com/files_notas_prensa/BAROMETRO_TV_3a_ oleada_abril_2010.pdf : Barlovento Comunicación

Capítulo II