Introducción de datos - Fase 4: Análisis y tratamiento de los datos

Aplicación Web de encuestas on-line

4 Conducta Cerrada con abierta ₁ Escala de Likert Sí

3.4. Fase 4: Análisis y tratamiento de los datos

3.4.1. Introducción de datos

Al finalizar el período de administración de la encuesta el 31 de agosto de 2015 se procedió a descargar en bruto los datos que se habían almacenado en la base de datos de Unipark. La creación de una matriz de datos personal que relacione los sujetos con las variables era fundamental para trabajar el análisis (Simonetti & Niño, 2006).

Solamente se descargaron los datos correspondientes a aquellos sujetos que habían completado el 100% de la encuesta (146). Teníamos un total de 217 entradas que incluían 167 variables distintas generadas por la aplicación de encuestas on-line a partir del diseño que creamos. La mayoría de las entradas no nos interesaban, como las referentes a la hora de acceso a la encuesta, el uso de java script o el tipo de navegador, así que fueron eliminadas. Algunas de ellas, como la ciudad a la que pertenecía la IP del sujeto, sí que fueron conservadas. Se hicieron descargas en los formatos xls (Excel) y sav (SPSS) con todos los datos previamente a la eliminación de aquellos superfluos.

Las variables que disponíamos en ese momento aún no estaban listas para poder trabajar con ellas ya que no tenían definición de tipología, codificación adecuada, nombres de trabajo y teníamos un exceso de variables debido a las necesidades de diseño de la encuesta on-line que nos forzó a generar muchas más de las necesarias.

146

3.4.2. Preparación de datos

Como acabamos de comentar antes de proceder al análisis hay que procesar y preparar los datos del cuestionario reduciendo su volumen mediante la codificación (Cohen et al., 2000). A partir de nuestra matriz –o banco- de datos personal se procedió a dotar a cada valor numérico extraído del cuestionario una categoría de análisis. Aunque este proceso ya se había realizado en parte al diseñar la encuesta on-line, debido a que la propia aplicación permitía dotar a las categorías de valores numéricos, hacía falta revisar que toda la codificación respondiera a una homogeneidad en los valores; por ejemplo, que en las escalas dicotómicas se usara en todas 0 y 1 o revisar que en las escalas de Likert las categorías fueran siempre de menor (1) a mayor (5).

La codificación también incluía dar un nombre de trabajo de SPSS y proporcionar etiquetas a las variables, así como qué códigos se usarían para los valores perdidos (Castañeda, Cabrera, Navarro, & de Vries, 2010), valores numéricos para la falta de respuesta. A partir de los proporcionados por la aplicación de Unipark utilizamos los siguientes: -66 para ausencia en categoría abierta debido a un filtro, -77 para ausencia en categoría cerrada debido a un filtro, -88 para ausencia en categoría cerrada por omisión del respondiente, -99 para categoría abierta por omisión del respondiente.

Finalmente el número de entradas se redujo a 140 con 134 variables. Aunque seguíamos teniendo más variables que las 50 establecidas en nuestro modelo muchas de ellas en SPSS estaban divididas en varías como por ejemplo la variable “Tareas realizadas” que se componía de 24 variables en SPSS, una para cada tarea educativa SIG; “Programas utilizados y su frecuencia” que incluía los 10 programas pre-seleccionados, las tres categorías abiertas para cada tipo de SIG y una variable creada adicional para la frecuencia de cada una de ellas lo que daba un total de 16 variables en SPSS o, como ya hemos comentado, “Programas por cursos” que se dividía en 52. Adicionalmente se crearon algunas variables más, por necesidades de reclasificación.

Reclasificaciones

Dependiendo del conjunto de datos de que disponemos se pueden realizar una serie de pruebas estadísticas u otras. No siempre los datos que hemos recolectado se adecúan a las pruebas o necesitamos reclasificar las variables o crear otras nuevas a partir de los datos que tenemos. Depurar la información consiste en evaluar el tipo de datos que tenemos, prepararlos, decidir qué técnicas podemos aplicar y qué esperamos obtener (Pallant, 2010).

147

Para poder cumplir con ciertas variables que habíamos definido en nuestro modelo de investigación necesitábamos crear algunas variables adicionales a partir de variables ya existentes. Esta reclasificación requería definir las nuevas variables según su escala, nombre, rango, valores perdidos, dígitos y decimales (Pallant, 2010). Las variables derivadas creadas fueron: “Frecuencia de uso de SIG”, “Frecuencia de tareas realizadas”, “Intensidad de uso”, y cuatro para “Docencia por curso”; en el capítulo III se describe exactamente cómo se crearon en cada uno de sus apartados.

Categorizaciones

Si bien para las preguntas cerradas la codificación numérica resulta sencilla debido al limitado espectro de respuestas, para las preguntas abiertas hay que realizar un proceso de codificación más complicado pues disponemos de textos escritos por los respondientes que pueden tener una amplia variabilidad. Para codificar las variables de tipo nominal surgidas de las preguntas abiertas hay que elaborar grupos a partir de lo que se repite (Pallant, 2010), traduciendo y estandarizando las respuestas (Cohen et al., 2000). En nuestro cuestionario teníamos las siguientes variables abiertas: la categoría de “Otras” en las asignaturas cursadas, que a su vez junto a la pregunta cerrada requería una reclasificación para formar grupos de asignaturas; la categoría de “Otros” dentro de cada tipo de programa SIG; la categoría de “Otras” para la universidad de formación; y los temas más habituales con SIG y más difíciles de Geografía.

Asignaturas

Dentro de la pregunta abierta para asignaturas adicionales a las pre-seleccionadas surgieron 13 asignaturas nuevas: Alemán, Educación física, Español, Estudios sociales, Filología alemana, Filología inglesa, Filosofía, Francés, Geología, Inglés, Música, Química y Teología. La mayoría de respuestas fueron muy claras y sólo se trató de traducir el nombre del alemán al castellano; en otros casos hubo que decidir que sólo la primera asignatura nombrada fuera la válida al apuntar más de una en la categoría o agrupar semejantes como Religionslehre y Theologie.

Todas las asignaturas resultantes fueron repartidas en cuatro grupos (Matemática y computación, Ciencias naturales, Ciencias sociales y lenguaje y Humanidades y filosofía) excepto Educación física, que generaron cuatro variables adicionales dicotómicas y también se creó una nueva variable nominal con 5 categorías excluyentes que utilizaba los grupos mencionados más la Educación física. La clasificación se realizó siguiendo las guías de nomenclatura internacional de la UNESCO para los campos de ciencia y tecnología, a partir

148

de los dos primeros dígitos, especialmente el primero, como se verá en el capítulo siguiente.

La UNESCO (United Nations Educational, Scientific and Cultural Organization -

http://www.unesco.org/) proporciona una clasificación estandarizada que podemos encontrar en la web de la Universidad del País Vasco, Departamento de Economía Aplicada, de forma detallada: http://www.et.bs.ehu.es/varios/unesco.htm.

Otros programas SIG

En la pregunta número 4 sobre la frecuencia de uso de diversos programas SIG pre- seleccionados y divididos por tipos se crearon tres opciones de respuesta abierta para cada tipo de SIG que permitía al respondiente añadir programas SIG no contemplados en la lista cerrada. Los programas que aportó la muestra por tipo fueron los siguientes:

Mobile SIG: Ninguno, la categoría quedó desierta.

Web SIG: Geographyalltheway.com, Klett GIS, LMZ BW GeoPortal, Sachsen GIS, Google Earth, Google Maps.

Desktop SIG: ArcGIS Pro, Google Earth, Spatial Commander.

Respecto a las categorías añadidas debemos comentar que Geographyalltheway.com es una página web de recursos de Geografía y no se la puede considerar un SIG en absoluto, aunque posea recursos TIC; Google Earth y Google Maps tampoco cumplen con los requisitos de un SIG, el primero es un globo virtual y el segundo es un servicio de cartografía web. LMZ (Landesmedienzentrum) BW GeoPortal (Geo-portal del Centro de Datos de Baden- Württemberg) es un servicio abierto que ofrece Web SIG, mapas digitales, globos virtuales y módulos de aprendizaje, a pesar de que no todo lo que incluye son servicios Web SIG sí que en algunos casos lo podemos considerar como tal; Klett GIS y Sachsen GIS, en cambio, sí son claramente Web SIG y ArcGIS Pro y Spatial Commander son Desktop SIG.

Universidades

Para perfilar las universidades donde estudió la muestra además de incluir las respuestas cerradas referentes a las universidades de BW también se añadió una respuesta abierta para aquellos sujetos que hubieran estudiado fuera del estado. Las universidades adicionales aportadas por la muestra fueron: Bayreuth, Marburg, Münster, Jena, Regensburg, Múnich, Osnabrück, Dresde, Würzburg, Potsdam y la Universidad Libre de Berlín.

149 Temas

La categorización de las preguntas abiertas referentes a los temas más habituales con SIG educativo y los temas más difíciles en la asignatura de Geografía fue algo más complicada ya que disponíamos de una gran cantidad de temas diferentes en alemán, con pequeños matices de diferencia entre algunos y con abundante uso de sinónimos. El primer paso fue traducir el texto del alemán al castellano intentando ser lo más fiel posible al original para posteriormente agrupar los temas, en lo que llamaríamos “subcategorías”, a partir de repeticiones y generalizaciones. Nuestro objetivo era crear las menores agrupaciones posibles, pero debido a la gran diversidad de temas sólo pudimos reducir su número a 50.

Para simplificar creamos una clasificación adicional más amplia y manejable que consideramos la clasificación básica, y la nombramos como “categorías”, utilizando 18 vertientes agrupadas a su vez en 4 “súper-categorías” correspondientes a la división clásica de la Geografía (Uhlig, 1971; Weichhart, 1975 y Hagget, 1983 en Holt-Jensen, 2009), como vemos en la Tabla 5, y respaldada por la nomenclatura de la UNESCO. Las más detalladas subcategorías y su relación con las categorías la podemos encontrar en la Tabla 6.

Tabla 5: Categorización de la Geografía según la UNESCO Geografía (54 / 2505) Súper-categoría Código UNESCO Categoría Código UNESCO Geografía física 2505.07 Biogeografía 2505.01 Climatología 2502

Geografía de los suelos 2511

Geomorfología 2506.07 Hidrogeografía 2508.06 Geografía humana 5403 / 2505.01 Geografía cultural 5403.01 Geografía de la población 5203 / 5403.02 Geografía económica 5401 Geografía histórica 5402 Geografía política 5403.05 Geografía rural 5404.02 Geografía social 5403.06 Geografía urbana 5404.01 Geografía regional 5404

Desarrollo regional y local 5401.05 Estudio específico de regiones 5404.99 Ordenación del territorio 3329 Técnicas 1105 Análisis espacial y estadístico 1209 / 2505.05

Cartografía y SIG 2504 / 2505.02

Tabla 5: Categorías y súper-categorías utilizadas para categorizar las respuestas de las preguntas abiertas dadas por la muestra respecto a los temas educativos habituales realizados con SIG y los temas más difíciles de tratar de Geografía en las clases. En negrita las categorías vacías. Fuente: propia a partir de

150

Tabla 6: Subcategorías de los temas de Geografía a partir de las respuestas abiertas

Categoría Subcategoría

Análisis espacial y estadístico Análisis espacial Teoría de localización

Biogeografía Ecosistemas

Protección del medio

Cartografía y SIG Cartografía

Gráficos y modelos Climatología Cambio climático Clima Meteorología Procesos atmosféricos Zonas climáticas

Desarrollo regional y local

Análisis regional Cambio global Desarrollo Desigualdades Paisaje

Estudio específico de regiones

Canteras del Alto Rin China

Cuenca del Rhur Economía alemana

Geomorfología de los Andes Oriente Medio Transporte en Europa Turismo en Kenia Geografía de la población Demografía Distribución de la población Migraciones

Geografía de los suelos Edafología

Pedosfera

Geografía económica

Agricultura

Cambio de estructura económica Economía

Energía

Estructura y dinámica económicas Globalización

Industria

Recursos naturales Regiones económicas Turismo

Geografía política Conflictos

Elecciones al parlamento

Geografía social Funciones sociales

Geografía urbana Metrópolis Morfología urbana Urbanización Geomorfología Geología Morfología glacial Tectónica de placas Hidrogeografía Hidrosfera

Ordenación del territorio Planificación territorial

Tabla 6: Subcategorías generadas a partir de los temas respondidos por la muestra en las preguntas abiertas por orden alfabético. Fuente: propia.

151

3.4.3. Análisis estadístico

Una vez los datos habían sido depurados, habíamos definido todas las variables con las que queríamos trabajar, se realizaron las reclasificaciones y categorizaciones pertinentes y disponíamos de una base de datos en SPSS ordenada y coherente procedimos a analizar los datos mediante técnicas estadísticas. El análisis se estructuró en una primera parte univariante descriptiva, una segunda parte bivariante de relaciones y diferencias y una tercera parte explicativa-predictiva mediante modelos de regresión. Las variables categóricas referentes a los temas de Geografía se incluyeron en el apartado descriptivo.

Descriptivo

La estadística descriptiva nos proporciona una visión sintética y comprensiva de los datos obtenidos de la realidad (Turbany, Barrios, & Carrera, 2012). Por un lado disponemos de la distribución de frecuencias para las variables cualitativas -nominales y ordinales- que permite organizar los datos y se puede representar gráficamente mediante diagramas de barras o circulares. Para las variables cuantitativas –de intervalo o razón-, por otro lado, podemos utilizar los índices de tendencia central, indicadores de posición, de variabilidad y dispersión y de forma –sesgo y curtosis-; el histograma se utiliza además para observar la distribución del conjunto de valores. Los índices de tendencia central informan sobre el centro de la distribución, los indicadores de posición nos proporcionan la ubicación de cada sujeto respecto al conjunto ordenado de valores, los indicadores de dispersión nos notifican la variabilidad de los valores y los de forma la simetría y apuntamiento de la distribución. Hay que tener en cuenta los valores anómalos que se detecten mediante los cuartiles primero y tercero –amplitud intercuartílica- (Turbany et al., 2012) ya que afectan a todos los estadísticos y a menudo pervierten los resultados.

En el análisis de resultados descriptivo utilizamos la distribución de frecuencias, los valores mínimos y máximos, los cuartiles (p25, p50 y p75) –para las posiciones-, la media, la mediana, la moda –para las medidas de tendencia central-, el rango, la varianza (σ²), la desviación estándar (σ) –para las medidas de variabilidad y dispersión-, el sesgo – para la simetría respecto a la distribución normal- y la curtosis –para la concentración en los valores centrales- (Briones, 1996; Hernández Sampieri et al., 1997; Rodríguez Gómez & Valldeoriola Roquet, 2009). Para presentar esos resultados nos servimos de tablas de frecuencias y estadísticas, histogramas y gráficos de barras y de sectores (Castañeda et al., 2010; Hernández Sampieri et al., 1997; Rodríguez Gómez & Valldeoriola Roquet, 2009). No todas las variables recibieron el mismo trato ya que aquellas de tipo nominal sólo podían recibir el tratamiento de frecuencias como hemos comentado, mientras que las de

152

intervalo y razón sí eran susceptibles del resto de técnicas (Pallant, 2010); no obstante las de tipo ordinal al ser semi-cardinales recibieron tratamiento como si fueran de intervalo. Para la distribución de frecuencias utilizamos la frecuencia absoluta (n), la frecuencia acumulada y la frecuencia relativa (porcentaje) (Hernández Sampieri et al., 1997; Simonetti & Niño, 2006) junto al índice de variación cualitativa (IVQ) –grados en que los casos se dispersan en las distintas categorías de la variable- en algunos casos (Turbany et al., 2012).

In document Análisis de la práctica educativa con SIG en la enseñanza de la geografía de la educación secundaria. Un estudio de caso en Baden-Württemberg, Alemania (página 146-153)