• No se han encontrado resultados

La Educación Virtual en el Ecuador “Análisis de los usos de la tecnología en los estudiantes de los Colegios de la ciudad de Loja

N/A
N/A
Protected

Academic year: 2017

Share "La Educación Virtual en el Ecuador “Análisis de los usos de la tecnología en los estudiantes de los Colegios de la ciudad de Loja"

Copied!
112
0
0

Texto completo

(1)
(2)

UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA

La Universidad Católica de Loja

ÁREA TÉCNICA

TÍTULO DE INGENIERO EN INFORMÁTICA

La Educación Virtual en el Ecuador

“Análisis de los usos de la tecnología en los estudiantes de los Colegios de la

ciudad de Loja”

TRABAJO DE TITULACIÓN.

AUTOR:

Alvarado Robles, Milton Iván

DIRECTOR

: Torres Díaz, Juan Carlos

(3)

APROBACIÓN DEL DIRECTOR DEL TRABAJO DE TITULACIÓN

Mgs.

Juan Carlos Torres Díaz.

DIRECTOR DEL TRABAJO DE TITULACIÓN

De mi consideración:

El presente trabajo de titulación: Análisis de los usos de la tecnología en los estudiantes de los Colegios de la ciudad de Loja realizado por Milton Iván Alvarado Robles, ha sido orientado y revisado durante su ejecución, por cuanto se aprueba la presentación del mismo.

Loja, Junio del 2016.

(4)

DECLARACIÓN DE AUTORIA Y CESIÓN DE DERECHOS

“Yo Alvarado Robles Milton Iván declaro ser autor del presente trabajo de titulación: Análisis de los usos de la tecnología en los estudiantes de los Colegios de la ciudad de Loja, de la Titulación de Informática siendo Juan Carlos Torres director del presente trabajo; y eximo expresamente a la Universidad Técnica Particular de Loja y a sus representantes legales de posibles reclamos o acciones legales. Además certifico que las ideas, conceptos, procedimientos y resultados vertidos en el presente trabajo investigativo, son de mi exclusiva responsabilidad.

Adicionalmente declaro conocer y aceptar la disposición del Art. 88 del Estatuto Orgánico de la Universidad Técnica particular de Loja que en su parte pertinente textualmente dice: “Forman parte del patrimonio de la Universidad la propiedad intelectual de investigaciones, trabajos científicos o técnicas y tesis de grado que se realicen a través, o con el apoyo financiero, académico o institucional (operativo) de la Universidad”

f. ...

(5)

DEDICATORIA

Dedico el presente proyecto primeramente a Dios quien me da salud y fortaleza para

seguir avanzando en este caminar de la vida.

A mis Amados padres Anita y Eugenio quienes me han entregado su amor y apoyo

desde los primeros días de mi vida.

A mis Queridas hermanas Natalia y Andrea quienes están brindándome su apoyo y

me motivan a seguir adelante en todo momento.

(6)

AGRADECIMIENTO.

Agradecer primeramente a mi Dios todo poderoso por darme la vida y acompañarme

en cada momento del camino.

A mi familia que es el mayor tesoro que Dios me ha dado, por todo el apoyo y por

motivarme a seguir avanzando.

Al director del proyecto por brindar y compartir sus conocimientos para el desarrollo

de este tema.

A mis amigos que de una u otra forma estuvieron colaborándome y apoyando para

cumplir el objetivo.

(7)

ÍNDICE DE CONTENIDOS.

APROBACIÓN DEL DIRECTOR DEL TRABAJO DE TITULACIÓN... ii

DECLARACIÓN DE AUTORIA Y CESIÓN DE DERECHOS...iii

DEDICATORIA ... iv

AGRADECIMIENTO. ... v

ÍNDICE DE CONTENIDOS. ... vi

ÍNDICE DE FIGURAS... ix

ÍNDICE DE TABLAS. ... x

ÍNDICE DE ANEXOS... xi

TERMINOLOGÍA. ...xii

RESUMEN... 1

ABSTRACT ... 2

1. INTRODUCCIÓN. ... 3

1.1. Introducción... 4

1.2. Objetivos. ... 5

1.2.1. Objetivo general... 5

1.2.2. Objetivos específicos. ... 5

1.3. Preguntas de investigación... 6

1.4. Hipótesis. ... 6

2. MARCO TEÓRICO. ... 7

2.1. La educación en Ecuador... 8

2.1.1. Estructura del sistema nacional de educación... 11

2.1.2. El uso de las nuevas tecnologías... 14

2.1.3. La economía con relación a la educación en Ecuador. ... 16

2.2. La Brecha digital... 19

2.2.1. Primera brecha digital. ... 20

2.2.2. Segunda brecha digital. ... 21

2.3. Determinantes de la Brecha Digital ... 22

2.4. Minería de datos... 29

(8)

2.4.3.2. Fase de Selección, limpieza y trasformación. ... 32

2.4.3.3. Fase de minería de datos. ... 32

2.4.3.4. Fase de Evaluación e Interpretación... 34

3. METODOLOGÍA. ... 36

3.1. Población y muestreo ... 37

3.2. Metodología de minería de datos KDD... 38

3.2.1. Fase de integración y recopilación... 38

3.2.2. Fase de Selección, Limpieza y Trasformación. ... 44

3.2.3. Fase de Minería de datos. ... 45

3.2.3.1. Identificar el modelo adecuado... 45

3.2.3.2. Seleccionar la tarea de minería de datos... 45

3.2.4. Fase de Evaluación e Interpretación. ... 47

3.2.4.1. Regresión Logística Binomial. ... 47

4. RESULTADOS. ... 49

4.1. Datos generales. ... 50

4.2. Usos de Internet. ... 52

4.3. Usos de Internet en actividades académico. ... 54

4.4. Usos de Internet para actividades de entretenimiento. ... 57

4.5. Perfiles del estudiante. ... 60

4.5.1. Perfiles para actividades académicas. ... 60

4.5.2. Perfiles para actividades de entretenimiento... 62

5. ANÁLISIS DE RESULTADOS... 65

5.1. Relaciones de la variable edad y las variables destacadas. ... 66

5.1.1. Relación entre edad y horas de conexión. ... 66

5.1.2. Relación entre edad y años de conexión... 67

5.1.3. Relación entre edad y perfiles de uso de Internet para actividades académicas y de entretenimiento. ... 68

5.2. Relaciones de las variables género y las variables destacadas... 69

5.2.1. Relación de la variables género y nivel de conocimiento ... 69

5.2.2. Relación de las variables género y perfiles de uso de Internet para actividades académicas y de entretenimiento. ... 70

5.3. Relaciones de las variables nivel de ingresos y las variables destacadas. ... 70

5.3.1. Relación de las variables nivel de ingresos y lugar de conexión. ... 70

5.3.2. Relación de las variables nivel de ingresos y días de conexión. ... 72

5.3.3. Relación de las variables nivel de ingresos y nivel de conocimiento. ... 73

(9)
(10)

ÍNDICE DE FIGURAS.

Figura 1. Analfabetismo en el Ecuador. ... 8

Figura 2. Analfabetismo por autoidentificación en el Ecuador. ... 10

Figura 3. Estructura del sistema de educación en el Ecuador... 11

Figura 4. Estructura del sistema de educación en el Ecuador... 12

Figura 5. Estructura del sistema de educación en el Ecuador... 13

Figura 6. Estructura del sistema de educación en el Ecuador... 13

Figura 7. Acceso a Internet en Ecuador. ... 14

Figura 8. Utilización de computadora por edad en Ecuador... 15

Figura 9. Utilización de Smartphone por nivel de instrucción en Ecuador. ... 16

Figura 10. Línea de pobreza por consumo en Ecuador... 17

Figura 11 Utilización de Internet por edad... 25

Figura 12. Acceso a Internet en el hogar por sexo en América Latina. ... 27

Figura 13. Proceso de Knowledge Discovery in databases... 31

Figura 14 Integración de un Almacén de Datos. ... 32

Figura 15. Género Estudiantes ... 50

Figura 16. Edad Estudiantes... 50

Figura 17. Ingresos Estudiantes ... 51

Figura 18. Lugar de conexión de Estudiantes ... 52

Figura 19. Días de conexión de Estudiantes... 52

Figura 20. Horas de conexión de Estudiantes... 53

Figura 21. Años de conexión de los estudiantes. ... 53

Figura 22. Videos para materias en la semana. ... 55

Figura 23. Post y Tweets académicos en la semana. ... 55

Figura 24. Chat académicos por semana... 56

Figura 25. Información académicos por semana... 56

Figura 26 Grupos de Apoyo para materias. ... 57

Figura 27. Horas de Chat por diversión ... 58

Figura 28. Horas de Redes Sociales por diversión. ... 58

Figura 29. Horas de Juegos en línea por diversión. ... 59

Figura 30. Horas de Descarga por diversión... 59

Figura 31. Horas de Videos por diversión. ... 60

Figura 32. Perfil Académico del uso de Internet... 62

(11)

ÍNDICE DE TABLAS.

Tabla 1. Tasa de analfabetismo por provincias del Ecuador ... 9

Tabla 2. Distribución de la población que asiste por tipo de establecimiento del Ecuador. .. 10

Tabla 3. Línea de pobreza por consumo del Ecuador... 17

Tabla 4. Tasa de variación de pobreza por consumo del Ecuador... 18

Tabla 5. Tasa neta de matrícula del Ecuador... 18

Tabla 6. Utilización de computador en el Ecuador. ... 28

Tabla 7. Variables sociodemográfica. ... 38

Tabla 8. Variables de conocimientos. ... 39

Tabla 9. Variables referentes al uso de Internet a lo Académico... 40

Tabla 10. Variables con respecto al uso de Internet entretenimiento. ... 41

Tabla 11. Variables de utilización de dispositivos. ... 42

Tabla 12. Encuestas realizadas. ... 43

Tabla 13. Variables seleccionadas... 44

Tabla 14. Discriminante clúster 2 perfiles actividades académicas. ... 47

Tabla 15. Discriminante clúster 2 perfil actividades entretenimiento. ... 47

Tabla 16. Prueba de Chi cuadrado hipótesis 1 y 2... 48

Tabla 17. Tipo de colegio... 51

Tabla 18. Nivel de conocimiento de Estudiantes... 54

Tabla 19. R de Pearson para tabulación cruzada entre edad y horas de conexión. ... 66

Tabla 20. R de Pearson para tabulación cruzada entre edad y años de conexión. ... 67

Tabla 21. R de Pearson para tabulación cruzada entre edad y horas de chat académico. .. 68

Tabla 22. R de Pearson para tabulación cruzada entre edad y horas de información académica. ... 68

Tabla 23. Tabulación cruzada entre género y nivel de conocimiento. ... 69

Tabla 24. Tau c de Kendall para tabulación cruzada entre género y nivel de conocimento. 69 Tabla 25. Tau b de Kendall para tabulación cruzada entre ingresos y lugar de conexión. ... 71

Tabla 26.Tabulación cruzada entre ingresos y días de conexión. ... 72

Tabla 27. Tau c de Kendall para tabulación cruzada entre ingresos y días de conexión... 72

Tabla 28. Tabulación cruzada entre ingresos y nivel de conocimientos. ... 73

Tabla 29. Tau c de Kendall para tabulación cruzada entre ingresos y nivel de conocimientos. ... 74

Tabla 30. Tau c de Kendall para ingresos y horas de chat para actividades académicas. ... 75

Tabla 31. Tau c de Kendall para ingresos y buscar información para actividades académicas. ... 75

Tabla 32. Tau c de Kendall para ingresos y horas de chat por diversión... 76

Tabla 33. Tau c de Kendall para ingresos y horas de redes sociales... 76

Tabla 34. Tau c de Kendall para ingresos y horas de juegos en línea. ... 77

Tabla 35. Tau c de Kendall para ingresos y horas de descarga de música y videos... 77

Tabla 36. Tau c de Kendall para ingresos y cuantos videos de youtube. ... 78

(12)

ÍNDICE DE ANEXOS

ANEXO 1. Encuestas aplicadas a los estudiantes. ... 84

ANEXO 2. Entrevista a directivo de la institución ... 86

ANEXO 3. Clúster de 2 para actividades académicas... 88

ANEXO 4. Clúster de 3 para actividades académicas... 89

ANEXO 5. Clúster de 4 para actividades académicas... 90

ANEXO 6. Discriminante de Clúster 2 para actividades académicas. ... 91

ANEXO 7. Discriminante de Clúster de 3 para actividades académicas. ... 91

ANEXO 8. Discriminante del Clúster de 4 para actividades académicas... 92

ANEXO 9. Clúster de 2 Grupos para el perfil entretenimiento... 93

ANEXO 10. Clúster de 3 Grupos para el perfil entretenimiento... 94

ANEXO 11. Clúster de 4 Grupos para el perfil entretenimiento... 95

ANEXO 12. Discriminante para Clúster de 2 Grupos para el perfil entretenimiento. ... 96

ANEXO 13. Discriminante para Clúster de 3 Grupos para el perfil entretenimiento. ... 96

(13)

TERMINOLOGÍA.

INEC.-Instituto Nacional de Estadística y Censo. SNE.-Sistema Nacional de Educación.

LOEI.-Ley Orgánica de Educación Intercultural. EGB.-Educación General Básica.

NTIA.-(National Telecomunications and Information Administration) Administración Nacional de Telecomunicaciones e Información.

ICT.- (Information and Communications Technology) Tecnologías de Información y Comunicación.

TIC.-Tecnologías de Información y Comunicación.

KDD.-(Knowledge Discovery in Data) Descubrimiento de Conocimiento en Datos. OLTP.-(On-Line Transaction Processing) Procesamiento Transaccional en Línea. OLAP.-(On-Line Analytical Processing) Procesamiento Analítico en Línea.

OR.-(odds ratio) es una medida estadística.

(14)

RESUMEN.

El presente trabajo de investigación se lo realizo a los estudiantes de los colegios de la ciudad de Loja para determinar cómo inciden los ingresos económicos de sus familias en el uso de internet para actividades académicas y para actividades de entretenimiento.

Se plantea dos hipótesis para verificar la incidencia del nivel de ingresos económicos y el uso de internet en el ámbito académico y en ámbito de entretenimiento de los estudiantes, para lo cual se utilizó el proceso de descubrimiento de conocimiento de bases de datos KDD y se aplicaron técnicas de minería de datos como: análisis clúster, análisis discriminante para obtener grupos homogéneos de estudiantes con características similares en el uso de internet y luego se utilizó regresión logística binomial para obtener modelos de minería de datos predictivos y posteriormente se hace una interpretación de todos los resultados que se obtuvo

(15)

ABSTRACT

This research was conducted as students from schools in the city of Loja to determine how they affect the income of their families in the use of Internet for academic activities and entertainment.

To two possibilities to verify the incidence of income level and Internet use in academia and scope of entertainment for students, for which the discovery process knowledge base of KDD data was used and applied mining techniques data such as cluster analysis , discriminant analysis to obtain homogeneous groups of students with similar characteristics in the use of internet and then regression was used binomial logistic for mining models predictive data and subsequently an interpretation is made all results obtained

(16)

CAPÍTULO I.

(17)

1.1. Introducción

El proyecto educación virtual en el Ecuador enfoca su investigación en buscar y analizar el uso de Internet y de las nuevas tecnologías que los estudiantes de los colegios de las ciudad de LOJA utilizan hoy en día.

Para obtener los resultados de la presente investigación se llevara a cabo diversos procesos los cuales siguen el presente orden; capítulo I descripción de objetivos, preguntas de investigación e hipótesis, en el capítulo II se abordara un análisis teórico en lo referente a la educación en el Ecuador, brecha digital y el proceso de minería de datos, en el capítulo III se describe la metodología empleada para el desarrollo de la investigación, en capitulo IV se presentan los resultados y el en capítulo V se analizan los resultados más relevantes que se obtuvieron.

La metodología a utilizar será la KDD (Knowledge Discovery in Data) que es una metodología utilizada en minería de datos y que consta de cinco fases, integración y recopilación de los datos, selección limpieza y trasformación de los datos, la fase de minería de datos, la evaluación e interpretación de los datos obtenidos, y la difusión y uso de los resultados. En la fase de minería de datos se busca una técnica y una tarea que mejor se ajuste a los datos que se tienen para luego poder obtener un modelo que resuelva de una manera eficiente el problema planteado.

La presente investigación nos ha permitido obtener y conocer información significante en el entorno de desarrollo de los estudiantes de los colegios como son, edad, género, ingresos económicos y los diversos usos de internet y tecnología que se utilizan en la actualidad.

(18)

1.2. Objetivos.

1.2.1. Objetivo general.

Determinar la incidencia del uso de Internet en actividades académicas y de entretenimiento y su relación con los ingresos económicos de las familias de los estudiantes de los colegios de la ciudad de Loja.

1.2.2. Objetivos específicos.

Los objetivos específicos para la presente investigación son:

 Levantar información sobre el uso del Internet de los estudiantes para actividades académicas y de entretenimiento.

 Identificar patrones en cuanto al uso de tecnología para clasificarlos en grupos.

 Identificar patrones en cuanto al uso de tecnología para clasificarlos en grupos.

(19)

1.3. Preguntas de investigación.

La investigación busca dar respuesta a la siguiente interrogante:

¿Cómo se relacionan los niveles de ingreso de las familias de los estudiantes con los usos de Internet en actividades académicas y en actividades de entretenimiento?

1.4. Hipótesis.

Las hipótesis planteadas para la presente investigación son:

Hipótesis 1:El nivel de ingresos determina como se utiliza Internet para el aprendizaje.

(20)

CAPÍTULO II

(21)

2.1. La educación en Ecuador.

La educación en el Ecuador desde el año 1990 ha evolucionado y mejorado constantemente, esto se puede apreciar en base a la reducción de la tasa de analfabetismo ya que en 1990 era de 11.7% y en 2001 fue de 9.0%, y más tarde en el año 2010 fue de 6.8%. (fig. 1)

Figura 1.Analfabetismo en el Ecuador.

Fuente: Inec censo 2010 Elaboración: Inec censo 2010

A nivel nacional este tasa de analfabetismo es muy significativa ya que se presenta una reducción de 2,2% en un periodo de 9 años, Inec también nos muestra lo que sucede con la tasa de analfabetismo a nivel de provincias del Ecuador en la que se puede situar a la provincia de Galápagos con 1,3% y la provincia de Pichincha en 3,5% que son las provincias con la menor tasa de analfabetismo, mientras que la provincia de Loja está en el séptimo lugar con un 5,8% (Tabla 1).

(22)
[image:22.595.131.494.123.649.2]

Tabla 1. Tasa de analfabetismo por provincias del Ecuador

PROVINCIA Tasa de Analfabetismo

por Provincias

1 Galápagos 1,3%

2 Pichincha 3,5%

3 El Oro 4,1%

4 Guayas 5,0%

5 Santa Elena 5,2%

6 Zamora Chinchipe 5,5%

7 Loja 5,8%

8 Carchi 6,2%

9 Napo 6,3%

10 Santo Domingo 6,3%

11 Orellana 6,5%

12 Morona Santiago 6,6%

13 Azuay 6,7%

14 Sucumbíos 6,8%

15 Pastaza 6,9%

16 Tungurahua 7,5%

17 Los Ríos 9,3%

18 Esmeraldas 9,8%

19 Manabí 10,2%

20 Imbabura 10,6%

21 Zonas no delimitadas 12,0%

22 Cañar 12,2%

23 Chimborazo 13,5%

24 Cotopaxi 13,6%

25 Bolívar 13,9%

(23)

Figura 2. Analfabetismo por autoidentificación en el Ecuador. Fuente: INEC censo 2010.

Elaboración: INEC censo 2010.

También se puede apreciar en cifras que la única gran diferencia de las personas que ingresaron a educación superior en establecimientos públicos fue de 12,1% mientras que en establecimientos privados fue de 23,9% con una diferencia de 11,8% (Tabla 2).

Tabla 2. Distribución de la población que asiste por tipo de establecimiento del Ecuador.

NIVELES

ESTABLECIMIENTO

PUBLICO

ESTABLECIMIEN TO

PRIVADO

TOTAL

PREESCOLAR 2,3% 2,2% 2,3%

EDUCACION BASICA

69,9% 55,0% 66,1%

BACHILLERATO 15,6% 18,9% 16,4%

EDUCACION SUPERIOR

12,1% 23,9% 15,2%

TOTAL

100%

100%

100%

Fuente: INEC Censo 2010 de población y vivienda. Elaboración: INEC Censo 2010 de población y vivienda.

(24)

2.1.1. Estructura del sistema nacional de educación.

El sistema nacional de educación (SNE) está regida por el Ministerio de educación, el cual dirige, organiza y planifica su funcionalidad en todo lo referente a la educación en el ecuador.

El sistema nacional de educación clasifica en dos niveles el tipo de educación, los cuales son: Escolarizado y No escolarizado (fig.3)

Figura 3. Estructura del sistema de educación en el Ecuador

Fuente:Reglamento General de la LOEI, 2012: art. 23

Elaboración: Elaboración propia.

La educación escolarizada es acumulativa, progresiva y conlleva la obtención de un título o certificado, esta puede ser catalogada en ordinaria o extraordinaria (Reglamento General a la LOEI, 2011: Art. 23)

La educación escolarizada conduce a la obtención del certificado de asistencia a Educación Inicial, del certificado de terminación de la EGB y del título de Bachillerato (Reglamento General a la LOEI, 2012: Art 23).

(25)

La educación no escolarizada se caracteriza por ser una oferta educativa esporádica en la cual su duración es menor a un año escolar. Este tipo de educación implica cursos temporales que no conducen a la obtención de un título o certificado como la escolarizada.

[image:25.595.95.535.248.560.2]

En la oferta ordinaria se toma en cuenta un rango específico de edad de los estudiantes, que empieza desde los 3 años de edad con la educación inicial hasta los 17 años que es la culminación del tercer año de bachillerato (fig.4).

Figura 4.Estructura del sistema de educación en el Ecuador.

Fuente:Reglamento General de la LOEI, 2012: art. 23

Elaboración: Elaboración propia.

(26)
[image:26.595.173.450.84.292.2]

Figura 5. Estructura del sistema de educación en el Ecuador

Fuente:Reglamento General de la LOEI, 2012: art. 23.

Elaboración: Elaboración propia.

[image:26.595.95.538.421.709.2]
(27)

2.1.2. El uso de las nuevas tecnologías.

El segundo factor que da un cambio significativo a la educación es el uso de las nuevas tecnologías, donde el principal componente es el internet, ya que es el recurso que en la actualidad más se utiliza.

También se involucra el avance tecnológico en los dispositivos electrónicos como son los computadores portátiles y de escritorio, así también la continua mejora de teléfonos celulares, Smartphone, Tablet.

Con estas nuevas tecnologías de información y comunicación que año tras año van mejorando y evolucionando a nivel mundial y que de cierta forma tienen un impacto directo sobre la educación de cada país y en el Ecuador también hay un gran cambio.

En las últimas encuestas realizadas por el instituto nacional de encuestas y censos del ecuador podemos apreciar que los hogares que tienen acceso a internet se incrementó desde el año 2009 al 2012 (fig.7)

Podemos apreciar que los hogares que tienen acceso a internet por medio de módem/teléfono se incrementó en un 12,5%, mientras que el internet por medio de cable/banda ancha decayó en un 25,9%. El internet inalámbrico desde el 2009 hasta el 2012 registro un incremento del 13,8%, y en estos tres últimos años es la tecnología más empleada en los hogares.

Figura 7. Acceso a Internet en Ecuador.

(28)

Otro recurso que actúa de manera directa en la educación de los niños, jóvenes y personas en general es la computadora, en el ecuador se puede ver que las personas que más utilizan este recurso se encuentran entre los 5 años de edad a los 24 años, con lo cual podemos decir que los niños en edad escolar inicial hasta los jóvenes en edad escolar bachillerato y superior son los que más utilizan este recurso (fig.8)

Figura 8.Utilización de computadora por edad en Ecuador.

Fuente: Encuesta Nacional de Empleo y Subempleo, ENEMDUR, Nacional Total. Elaboración: Encuesta Nacional de Empleo y Subempleo, ENEMDUR, Nacional Total.

Otro recurso que se utiliza hoy en día y que es de gran ayuda, ya sea para la comunicación como para obtener información del internet son los teléfonos inteligentes o Smartphone.

(29)

Figura 9. Utilización de Smartphone por nivel de instrucción en Ecuador.

Fuente: Encuesta Nacional de Empleo y Subempleo, ENEMDUR, Nacional Total. Elaboración: Encuesta Nacional de Empleo y Subempleo, ENEMDUR, Nacional Total.

2.1.3. La economía con relación a la educación en Ecuador.

La economía del país es el tercer y al parecer el más importante factor que influye en la educación de un país.

La economía del Ecuador a través del tiempo ha evolucionado y ha sufrido cambios continuamente debido a varios factores que afectan la estabilidad del país.

Una manera de medir el nivel de pobreza en el país es a través de la medición de la línea de pobreza de consumo por año, esto se puede llevar a cabo mediante encuestas de condiciones de vida que se realizan en el país.

En el Ecuador la institución encargada de realizar los estudios de condiciones de vida es el INEC, que presento sus datos en abril del 2015, donde se puede apreciar cambios muy significativos.

(30)

Tabla 3. Línea de pobreza por consumo del Ecuador.

AÑO

1995

1999

2006

2014

LINEA DE POBREZA

1,61

1,43

1,89

2,81

LINEA

POBREZA

EXTREMA

0,92

0,77

1,06

1,58

Fuente: INEC: ECV 2013-2014

Elaboración: elaborado por: INEC: ECV 2013-2014

Igualmente se puede apreciar que la pobreza por consumo se redujo desde el año 1999 en donde el ecuador sufrió una gran crisis económica que fue el cambio de su moneda (sucres a dólares) y que para ese año tuvo un índice de pobreza por consumo de 52,2%. (fig.10).

Desde el año 2006 al año 2014 la pobreza por consumo se redujo a nivel nacional en un 32,6% permitiendo así que aproximadamente 1.3 millones de ecuatorianos dejen de ser pobres. (fig.10).

Figura 10. Línea de pobreza por consumo en Ecuador.

(31)
[image:31.595.120.509.175.412.2]

Entre las provincias del ecuador que tuvieron un alto índice de tasa de variación desde año 2006 al 2014 en lo que se refiere a pobreza por consumo, se puede señalar a cinco provincias que tuvieron un alto índice de tasa de variación, entre ellas está la provincia de Loja (tabla 4)

Tabla 4. Tasa de variación de pobreza por consumo del Ecuador.

POSICION

DOMINIOS

2006

2014

TASA VARIACION

1 GUAYAS 34,8% 19,1% -45,1

2 MANABI 53,2% 31,4% -41,1

3 CARCHI 54,6% 32,7% -40,2

4 PICHINCHA 22,4% 13,8% -38,6

5 LOJA 47,2% 31,3% -33,6

6 LOS RIOS 49,1% 33,3% -32,2

7 BOLIVAR 60,6% 43,3% -28,5

8 EL ORO 28,1% 20,2% -28,1,

9 TUNGURAHUA 36,2% 26,8% -26,1

10 IMBABURA 43,7% 32,4% -25,9

Fuente: INEC: ECV 2013-2014. Elaboración: INEC: ECV 2013-2014.

También cambio el sistema de educación en el país, lo que permitió que las personas sin distinción de edad o de raza, tenga más oportunidades de acceder a la educación independientemente del tipo de institución educativa que accedieran.

El INEC presento datos de tasa de matrícula a nivel nacional del año 2014, donde se compara con la tasa de matrícula del año 2006 donde se puede apreciar un crecimiento de 4,3 en la tasa neta de matrícula en nivel básico y un 16,4 en la tasa neta de matrícula a nivel medio (tabla 5)

Tabla 5. Tasa neta de matrícula del Ecuador.

TASA NETA DE MATRICULA

2006

2014

DIFERENCIA

BASICA DE 5 A 14 AÑOS 90,9% 95,2% 4,3

MEDIA DE 14 A 17 AÑOS 48,3% 64,7% 16,4

(32)

2.2. La Brecha digital.

Desde la creación y evolución del ser humana, ha existido toda clase de desigualdad social y esto se debe a muchos factores y condiciones de vida de las personas, es así que en los años 90 desde el lanzamiento del browser (Word Wide Web), también aparece la brecha digital, que no es más que otra desigual social que se crea con el cambiar y con la transformación de las nuevas tecnologías que evolucionan constantemente.

Se conoce como ¨brecha digital¨ o ¨digital divide¨ al término utilizado para diferenciar quienes tienen y no tienen acceso a internet y fue la National Telecommunications and Information Administration (NTIA) quien adopto este término y quien a base de estudios e investigaciones desde el año 1995 amplio las variables de medición y de diferenciación del mismo.

A partir de ese entonces muchos estudios e investigaciones se hicieron para poder definir lo que realmente es la brecha digital, dando como resultado algunos conceptos que tienen relevancia hasta nuestros días.

El termino Digital Inequality o desigualdad social fue dado por DiMaggio y Hargittai (2001) quienes adoptaron este término para diferencial la desigualdad social que existe con la aparición del Internet.

Pippa Norris (2001) considera que brecha digital está enmarcada a tres aspectos, la división global, la división social y la división democrática.

La misma Hargittai (2002) considera que la primera brecha digital se distingue por acceso formal y acceso real.

Serrano y Martínez (2003) ¨La brecha digital es la separación que existe entre las personas que utilizan las Tecnologías de Información y Comunicación (TIC) de las que no tienen acceso a las TIC o que a pesar de tenerlas no saben cómo utilizarlas¨

En cambio DiMaggio, Hargittai, Celeste y Shafer (2004) Definen como Digital Inequality o Desigualdad Digital basados en 5 dimensiones que la distinguen.

(33)

2.2.1. Primera brecha digital.

Desde el año 1995 que se presentaron los primeros estudios sobre el uso de Internet se nombró como brecha digital a división que existía entre las personas que tenían o no tenían acceso a Internet, este nivel fue nombrado como ¨primera brecha digital¨ Hargittai (2002).

En este primer nivel de brecha digital se hace referencia al acceso formal a Internet y el acceso real a Internet, donde el acceso formal se define como la disponibilidad de las infraestructuras necesarias para conectarse a la red (van Dijk & Hacker, 2003).

El acceso real en cambio se define como el uso en si del Internet, si teniendo la infraestructura necesaria, la disponibilidad, se presentan otros factores que hace que los personas no utilicen este servicio.

En el acceso real se puede distinguir dos barreras importantes:

1. La barrera psicológica. Que es causada por la falta de interés, miedos, desmotivación por las nuevas tecnologías (van Dijk, 2005, 2006; Van Dijk & Hacker, 2003)

2. La barrera de habilidades. Que es causada por la falta de habilidades para manejar, operar, y entender el uso de aparatos tecnológicos (van Dijk & Hacker, 2003).

(34)

2.2.2. Segunda brecha digital.

La segunda brecha digital se da una vez superada la primera, cuando se empiezan a relacionar los diferentes ámbitos donde incursiona el Internet, la tecnología y el uso que le dan los diferentes grupos de individuos (Hargittai, 2002).

Algunos autores diferenciaron la segunda brecha digital en base a dimensiones que se tomaban muy en cuenta a la hora de definir la desigualdad digital, a continuación tenemos algunos de ellos.

¨La estratificación social derivada del desigual acceso, adaptación y creación de conocimiento vía el uso de las tecnologías de la información y la comunicación¨ (Warschauer, 2003) este autor aclara que lo más importante es como las personas usan las nuevas tecnologías, teniendo en cuenta tres dimensiones:

• El desigual acceso a Internet.

• La desigual habilidad para usar Internet. • Las diferentes finalidades de uso de Internet.

En cambio DiMaggio, Hargittai, Celeste y Shafer, (2004) determinan 5 dimensiones para distinguir la desigualdad digital, estas son:

• Los medios técnicos o infraestructura de conexión. Se encuentran diferencias entre la capacidad de conexión y los distintos dispositivos que se utilizan para navegar por la red.

• La autonomía de uso. La libertad para navegar por la red, no todos los usuarios tienen la misma libertad.

• Los patrones de uso de internet. Existen usos y patrones relacionados con la intensidad y finalidad de uso de Internet.

• Las redes de soporte social. Se hace referencia al apoyo social informal que de una u otra manera incentiva al uso de Internet.

(35)

Jan Van Dijck, (2005) dimensiona a la brecha digital en términos de accesos, lo cual define en 4 fases de acceso que son secuenciales.

• Acceso motivacional (Motivational Access). • Materiales de Acceso (Material Access). • Habilidades de Acceso (Skills Access). • Usos de Acceso (Usage Access).

Para definir la Brecha digital Selwyn, (2010) divide en 6 etapas primordiales que son:

• Acceso formal y teórico a ICT y contenido. • Acceso efectivo a ICT y contenido.

• Uso de ICT.

• Responsabilidad con ICT y su contenido. • Resultados, actuales y percibidos. • Consecuencias, actuales y percibidas.

2.3. Determinantes de la Brecha Digital

Basados en los estudios realizados por los diversos autores podemos decir que los factores que más influyen para determinan la brecha digital son los siguientes.

Ingresos.- Es el factor principal que determina esta gran separación digital que existe en el mundo, como ya lo explica Serrano y Martínez, (2003) las TIC han sido parte esencial de los recientes cambios dramáticos en la economía y la sociedad, donde se ve la separación de los sectores sociales de bajos ingresos con respecto a los que tienen mayores ingresos y con posibilidad y opción de acceso a la información.

(36)

También se toma en cuenta a Warschauer (2003) en la primera dimensión, “el desigual acceso a Internet” y a DiMaggio, Hargittai, Celeste y Shafer (2004) donde se analiza “Los medios técnicos o infraestructura de conexión.” se enfocan claramente al nivel de ingresos, tanto de un país como los niveles de ingreso personales, ya que si se tiene mejores ingresos, se podrá adquirir mejor tecnología y mejor infraestructura para hacer uso del Internet y de los nuevos aparatos electrónicos.

Rodríguez (2006) referencia que muchos países que carecen de los avances técnicos, de infraestructura y de capacidad institucional, se han visto rezagados del resto del mundo, el problema no radica en que la tecnología beneficia a los ricos, si no que impone más límites y penurias a los pobres.

En la investigación de Ayala (2007) donde realizó encuestas con una muestra de 1017 casos con personas de 12 a 60 años en la ciudad de Santiago de Chile se obtuvo que las personas que tienen un nivel de ingresos bajo utiliza más el Internet como fuente de entretenimiento, mientras que los que tienen un nivel de ingresos más alto utilizan el internet para servicios e información.

También Livingstone y Helsper (2007) en su investigación de uso de Internet en usuarios de entre 9 y 19 años donde se encontró que los que no tienen acceso o tienen acceso esporádico pertenecen a la clase social con menos ingresos, y los usuarios que utilizan con más frecuencia están distribuidos en todos las clases sociales y cuentan con uno o más lugares de acceso (casa, colegio) y finalmente los usuarios permanentes pertenecen a las clases media y alta, y cuentan con conexión desde su habitación.

En la investigación realizada por Torres (2012) a cinco universidades del Ecuador, se encontró que el nivel de ingresos de los estudiantes incide en los usos académicos de Internet, dando una varianza que explica el nivel de ingresos del 9%.

(37)

Internet para las actividades académicas, y el nivel de ingresos no incide en las actividades de entretenimiento.

Edad.-Es otro de los factores que determina en gran medida la brecha digital, al pasar de los años se puede observar que más personas tienen acceso a internet y por esa razón personas de todas las edades tienen acceso a todo tipo de contenido, en Jones y Fox (2009) se realiza una investigación con personas de diferentes edades, encontrando que los usuarios de Internet que están dentro de un rango de edad entre 18-32 años son aquellos que más utilizan Internet, tanto para la comunicación como para el entretenimiento, los usuarios comprendidos entre edades de 12-32 años son más propensos para utilizar redes sociales, blogs, crear perfiles en los diversos sitios de comunicación personal.

Los usuarios que están en edades entre 12-17 años se relacionan más con actividades de entretenimiento como juegos en línea, chats, y los diversos correos electrónicos que existen en la web.

En cambio los usuarios comprendidos entre las edades de 33-44 años se relacionan más con las compras en línea, y los usuarios de 33-72 años se dedican a buscar información relevante de acuerdo a sus perspectivas y educación.

Para Castaño, Martin, Vásquez y Martínez (2009) es una correlación lineal y directamente proporcional con la brecha de género respecto a la última vez que se utilizó Internet. (fig.11)

Para la relación de edad y genero se puede ver que tanto para mujeres y hombres en los diversos rangos de edad los que más utilizaron Internet fueron los más jóvenes las edades comprendidas entre 16-34 años y van disminuyendo conforme las edades.

Mientras que la diferencia entre mujeres y hombres de diferente edades es más notable con edades de mayor rango, así se tiene que la diferencia entre mujeres y hombres para las edades comprendidas de 65-74 años es de -23,0% una notable diferencia que ubica al género masculino como los que más utilizan Internet.

(38)
[image:38.595.116.508.89.297.2]

Figura 11 Utilización de Internet por edad.

Fuente: Castaño, Martin, Vásquez y Martínez, 2009. Elaboración: Castaño, Martin, Vásquez y Martínez, 2009.

En los estudios realizados por Hargittai (2002) hay claras diferencias en lo que se refiere a las edades por la capacidad de utilizar la web, porque los usuarios comprendidos entre las edades de 18-19 años tuvieron más éxito en realizar las tareas planteadas mientras que los usuarios comprendidos entre las edades de 70-80 años solo tuvieron un 3.3% de culminar las 5 tareas propuestas.

Hargittai concluye que la gente en la adolescencia y la gente en sus 20 años son más rápidas que las personas de entre 30 y 40 años.

También en las investigaciones de Livingston (2007) se demuestra que la edad es un factor determinante dentro de la brecha digital, en la cual se obtuvo que los niños comprendidos entre las edades de 9-11 años utilizan internet para jugar, para la escuela y para usos creativos como un dibujo o una historia, mientras que los usuarios comprendidos en edades de 12-17 años utilizan el Internet para trabajos de la escuela así como los sitios para revisión de exámenes y también utilizan internet para jugar y descargar música.

(39)

Genero.- Los autores Castaño, Martin, Vásquez y Martínez (2009) nos dicen que analizar la situación de las TIC desde una perspectiva de género conlleva la necesidad de diferenciar la existencia de varias brechas digitales, de carácter y alcance diferente:

1.-La primera brecha digital de género aparece en el acceso a la tecnología siendo esto de carácter cuantitativo.

2.- La segunda en la utilización que se hace de ella y marca el grado de incorporación efectiva a la misma (mayor alcance y de carácter cualitativo) 3.- La tercera es el uso de los servicios de las TIC más avanzados (de carácter

cualitativo y de gran importancia para la evolución de las dos anteriores)

Hargittai (2002) en los estudios realizados encuentra que en promedio, las mujeres completaron 4.19 % tareas en comparación con 4.26% en los hombres, estos datos no son muy significativos para diferenciar si el género tiene relevancia a la hora de utilizar el Internet.

Más tarde Hargittai y Shafer (2006) en su nueva investigación para probar si existe diferencias en las habilidades en línea entre hombres y mujeres, demuestra que utilizando regresión OLS (Ordinaly least squares) se encuentra que no hay estadísticamente diferencias significativas entre hombres y mujeres a la hora de realizar diversas tareas con respecto a la utilización de Internet.

Lo que si puede diferenciar es que las mujeres son más propensas a cuestionar su competencia en línea mientras que los hombres navegan sin ningún límite y sin cuestionarse.

En América latina no se ve una marcada diferencia en lo que es utilización y uso de las TIC con referencia en el género.

(40)

Figura 12. Acceso a Internet en el hogar por sexo en América Latina.

Fuente: CEPAL. Elaboración: CEPAL.

Educación.-El tipo de educación de los usuarios esta diferenciado a dos niveles, el primero sería con respecto a cursos, talleres, a un título en general, como ya lo demostró (Van Dijk 2006) “los usuarios de mayor nivel educativo hacen mejor uso del tiempo de conexión, de las herramientas, tienen mejores habilidades”.

El segundo nivel sería una educación con respecto a sus habilidades para conocer más sobre el manejo en sí de las nuevas tecnologías, en el estudio realizado en Holanda por Van Dijk (2005) nos muestra que “las principales fuentes de adquisición de habilidades de uso de internet provienen de aprendizaje por uso propio”

Factores Étnicos.-Este factor incide en gran medida en lo que es desigualdad digital, en el Ecuador el nivel de analfabetismos de las etnias Indígena de 20,4%, la Montubia 12,9 %, y la Afro ecuatoriana 7,6 % donde si se hace una relación con las provincias donde las personas utilizan computadora se puede ver que Manabí 28.30%, Bolívar 26,60 % y Esmeraldas 24,80%, (Tabla 6) están en los niveles más bajas en lo que es utilización de computador y que estas provincias son donde se asientan las clases etnias indígena, afro ecuatoriana y montubia.

(41)

En el Ecuador se encontró que las personas que más utilizan un computador hasta el año 2013 fueron las que encuentran en las provincias de Pichincha y Azuay. (Tabla 6).

Tabla 6. Utilización de computador en el Ecuador.

(42)

2.4. Minería de datos

Todas las empresas, gobiernos e instituciones hoy en día manejan grandes cantidades de información, y necesitan de un proceso o metodología para almacenarla y luego ser reutilizada, para estas operaciones es necesario integrar algunas ciencias como son, las estadísticas, las matemáticas, el cálculo, etc. y es ahí que en base a las nuevas necesidades de manejar estas grandes cantidades de información que se crea la Minería de datos.

Se puede definir a la minería de datos como “El proceso de extraer conocimiento útil y comprensible, previamente desconocido, desde grandes cantidades de datos almacenados en distintos formatos” (Written & Frank 2000).en donde el principal objetivo de la minería es encontrar modelos intelegibles que ayuden con esta tarea.

La minería de datos es “el proceso que tienen como propósito descubrir, extraer y almacenar información relevante de amplias bases de datos, a través de programas de búsqueda e identificación de patrones” (Angeles & Santillan 1998)

2.4.1. Tipos de datos.

Dependiendo del tipo de dato se podrá aplicar la técnica de minería de datos, Hernández (2007) propone tres tipos de datos, estos son.

Base de datos relacionales:Es una colección de relaciones (tablas), donde cada una de ellas tienen un conjunto de atributos (columnas o campos) y puede contener un gran número de duplas (registros y filas).

Otros tipos de base de datos:Las empresas, organizaciones e instituciones trabajan con datos complejos que pueden ser:

• Bases de datos espaciales: que tienen información relacionada con el espacio, ubicación e información geográfica.

• Bases de datos temporales: que contienen atributos relacionados con el tiempo donde este es muy relevante.

(43)

La World Wide Web: Que es el mayor repositorio de información donde existe gran cantidad de datos de diferente tipo y debido a su complejidad tienen su propia metodología llamada Minería Web y está conformada por tres categorías:

• Minería de contenidos: que encuentra patrones de datos de las páginas web. • Minería estructurada: que entiendo por estructura los hipervínculos y URL´s. • Minería del uso: que descubre información cuando el usuario navega.

2.4.2. Tipos de Modelo.

Una vez analizado los datos y extraer conocimiento de los mismos en forma de relaciones, patrones o reglas estos de representan en modelos, los cuales se diferencias en modelos predictivos y modelos descriptivos.

Los modelos Predictivos procuran estimar valores futuros o desconocidos (variables independientes o predictivas) de variables de interés (variables dependientes u objeto).

Los modelos Descriptivos exploran e identifican patrones de las propiedades de los datos que explican y resumen el comportamiento de cierta actividad.

2.4.3. El proceso de descubrimiento de conocimiento en base de datos.

Se utiliza KDD (Knowledge Discovery in Data bases) para describir todo un proceso que consta de fases y asi llegar a resolver problemas y conflictos.

En (Fayyad y col 1996) describe a KDD como “El descubrimiento de conocimiento en bases como proceso no trivial de identificar patrones válidos, novedosos, potencialmente útiles, y en última instancia, comprensibles a partir de los datos”.

(44)

Figura 13. Proceso de Knowledge Discovery in databases.

Fuente: Hernández et al., 2007. Elaboración: Hernández et al., 2007.

A partir de los datos iniciales, la primera face de KDD es la integración y recopilación que es donde se determina las fuentes de información que pueden ser útiles (Hernández et, al 2008)

La fase de selección, limpieza y transformación que es donde se elimina y corrigen datos incorrectos, la siguiente fase es la de minería de datos que es donde se decide cual es la tarea a realizar ya sea por agrupación o clasificación, a continuación esta la fase de evaluación e interpretación que al parecer es la fase más importante dentro del proceso de KDD porque en esta fase se evalúan los patrones y los expertos analizan los resultados obtenidos.

2.4.3.1. Fase de Integración y Recopilación.

En esta fase se integran información coleccionada de distintas fuentes, que a su vez está tratada y unificada, dando como resultado un almacén de datos que más tarde servirá para agregar y cruzar efectivamente la información interpretada. (fig. 14)

(45)

Figura 14 Integración de un Almacén de Datos.

Elaboración: Elaboración propia.

2.4.3.2. Fase de Selección, limpieza y trasformación.

En esta fase se mejora la calidad y se elige los datos y variables adecuadas para resolver el problema planteado.

Se tratan problemas como:

• Valores que no se ajustan al comportamiento general de los datos. • Valores irrelevantes e inconsistentes.

• Datos y valores faltantes y perdidos.

En base a modelos y herramientas se pueden tratar estos problemas y resolverlos de la manera más adecuada para obtener los resultados requeridos.

2.4.3.3. Fase de minería de datos.

En esta fase se produce nuevo conocimiento en base a la información ya obtenida hasta el momento , para construir un modelo donde se describe patrones y relaciones de datos para poder predecir, entender mejor los datos y explicar situaciones pasadas.

Se toman en cuenta tres puntos importantes para la construcción el modelo:

1. Determinar el tipo de tarea de minería. 2. Elegir el tipo de modelo apropiado.

(46)

Estos algoritmos pueden ser de tarea predictiva o descriptiva.

Las predictivas son:

• Clasificación: Cada registro de la base de datos pertenece a una clase y el objetivo es predecir la clase de las nuevas instancias o registros.

• Regresión: Aprende una función real que asigna a cada instancia un valor real (valores numéricos) y el objetivo es minimizar el error entre el valor predicho y el valor real.

Las descriptivas son:

• Clustering: Es la mejor tarea dentro de las descriptivas, ya que consiste en obtener grupos a partir de los datos, los mismos que están agrupados de tal manera que tengan similitudes entre si y que se diferencien de otros grupos. Está relacionado con la sumarizacion porque cada grupo que se forma es u n resumen de los elementos que lo forman para describir de una manera más precisa los datos obtenidos.

• Correlaciones: Se utiliza para examinar el grado de similitud de los valores de las variables numéricas, se utiliza el coeficiente de correlación r para medir la correlación lineal.

• Reglas de asociación: este algoritmo identifican relaciones no explicitas entre atributos categóricos. Las reglas de asociación secuenciales se utilizan para determinar patrones secuenciales en los datos.

Técnicas de minería de datos: Entre las principales técnicas de la minería de datos tenemos:

• De inferencia estadística: Que consiste en explicar el comportamiento de una variable a partir del conocimiento de otras, se diferencian respecto al tipo de variable de respuesta, esta pueden ser numéricas, binarias o categóricas y al tipo de variable explicativa que puede ser numérica o categórica.

(47)

problemas de inteligencia artificial y aprendizaje automático en minería de datos.

• Arboles de decisión: Que son técnicas donde el árbol de decisión es un conjunto de condiciones organizadas en una estructura jerárquica y siguiendo las condiciones que se cumplan desde la raíz hasta las hojas se tomara una solución o acción final.

• Métodos relacionales y estructurales: Utilizan un lenguaje de presentación relaciona, permitiendo descubrir patrones más complejos utilizando estructuras de sus propios datos y relaciones.

• Redes neuronales: Son técnicas de aprendizaje automático cuya finalidad es emular los procesos biológicos de la capacidad humana para procesar información.

2.4.3.4. Fase de Evaluación e Interpretación.

En esta fase se mide la calidad de los patrones descubiertos por los algoritmos de minería de datos, se debe tener en cuenta tres cualidades específicas de estos patrones que deben ser precisos, comprensibles e interesantes, además se divide en 2 procesos, el primero es para el aprendizaje (entrenamiento) y el segundo es la evaluación (test), según las aplicaciones utilizadas podremos obtener diversos criterios de medidas de estos patrones.

Las técnicas más conocidas para la evaluación son:

• Evaluación de clasificación: Donde el algoritmo de aprendizaje emplea normalmente una evidencia o muestra S formada por ejemplos de la función objetiva f de acuerdo a su distribución.

• Evaluación mediante validación cruzada: Este método divide el conjunto de la evidencia en k subconjuntos disjuntos de tamaña similares se calcula un error de muestra parcial y se repite este procedimiento K veces, el resultado recoge la media de los experimentos con K subconjuntos de prueba independiente. • Evaluación por bootstrap: Se aplica en casos donde hay nuevos ejemplos y e

(48)

funciones objetivas, utiliza el error cuadrático medio, la raíz cuadrática y los errores relativos.

(49)

CAPÍTULO III.

(50)

3.1. Población y muestreo

La población objetivo son los estudiantes de los colegios de la ciudad de Loja, desde el 9 año de educación básica hasta el tercer año de Bachillerato.

La muestra es de tipo probabilístico, por ser una población finita se aplicara la fórmula:

Dónde:

n = tamaño de la muestra.

N = valor de la población.

Z = valor critico de coeficiente de confianza 95% = 1,96

d = Margen de error aceptado 5% = 0,05

p = proporción de ocurrencia del evento.

q = proporción de no ocurrencia de un evento.

Remplazando valores:

Dando como resultado n = 346

(51)

3.2. Metodología de minería de datos KDD.

Para el desarrollo de esta investigación se utilizara la metodología de minería de datos KDD (Knowledge Discovery in Data) la cual consta de cinco fases pero solo se trabajara hasta la fase cuatro.

3.2.1. Fase de integración y recopilación.

Esta fase se realizó mediante la aplicación de encuestas a cada uno de los estudiantes de las instituciones educativos (Anexo 1) y también una entrevista a un docente de las instituciones educativas (Anexo 2).

La encuesta realizada a los estudiantes fue proporcionada por el director del proyecto ¨La educación virtual en el Ecuador“(Torres 2012) donde se aplican 16 ítems dirigidos a evaluar las variables sociodemográficas y las características más fundamentales sobre el uso de internet tanto en el ámbito académico como en el entretenimiento.

Las variables utilizadas para la investigación están divididas en cinco bloques las cuales se han clasificado de la siguiente forma:

[image:51.595.107.519.528.748.2]

• Primer bloque: Variables sociodemográficas.

Tabla 7. Variables sociodemográfica.

CAMPO VARIABLE TIPO DE DATO DESCRIPCION VALORES

Colegio Nominal Cadena Colegio del estudiante

Ninguno

Tipo Nominal Numérico Tipo de colegio 1=Fiscal 2=Privado 3= Fiscomisional Edad Real Numérico Edad del

estudiante

Ninguno

Genero Dicotómica Numérico Genero del estudiante.

1=Hombre 2=Mujer

Ingresos Nominal Numérico Ingresos mensuales del núcleo familiar.

(52)

• Segundo bloque: Variables de conocimiento y preferencia del estudiante.

Tabla 8. Variables de conocimientos.

CAMPO VARIABLE TIPO DE DATO

DESCRIPCION VALORES

Lugar de

conexión Nominal Numérico Lugar desde dondese conecta más al internet

1= Desde la casa 2=Desde el cyber café.

3=Desde el trabajo. 4=Desde el colegio 5=Desde una red móvil

Días de

conexión

Ordinal Numérico Cuantos días a la semana se conecta al internet

1=7

Nivel de

conocimiento Ordinal Numérico Nivel conocimiento en elde manejo de internet.

1=10

Horas al día Nominal Numérico Horas de conexión al día.

Ninguno

(53)
[image:53.595.104.521.166.727.2]

• Tercer Bloque: Variables referentes al uso de Internet en lo Académico

Tabla 9. Variables referentes al uso de Internet a lo Académico.

CAMPO VARIABLE TIPO

DE DATO

DESCRIPCION VALORES

Grupo de Facebook

Escala Numérico Tienes grupo de Facebook para apoyarte en temas de clase

1= SI 2=.NO

Grupo Whatsapp

Escala Numérico Tienes grupo de Whatsapp para apoyarte en temas de clase

1= SI 2=.NO

Usas twiter Escala Numérico Usas Twiter para apoyarte en temas de clase

1= SI 2=.NO

Usas mensajería celular

Escala Numérico Usas mensajería celular para apoyarte en temas de clase.

1= SI 2=.NO

Mensajes por Facebook.

Nominal Cadena Cuantos mensajes envías por semana.

Ninguno

mensajes Whatsapp

Nominal Cadena Cuantos mensajes envías por semana.

Ninguno

Mensajes twiter Nominal Cadena Cuantos mensajes envías por semana.

Ninguno

Mensajes celular

Nominal Cadena Cuantos mensajes envías por semana.

Ninguno

Cuantos videos Nominal Numérico Para entender las materias cuantos videos miras a la semana

Ninguno

Cuantos post Nominal Numérico Cuanto post o tweets sobre temas académicos realizas a la semana

Ninguno

Horas chat Nominal Numérico Aproximadamente cuantas horas chateas sobre temas académicos a la semana

Ninguno

Horas de información.

Nominal Numérico Aproximadamente cuantas horas buscas información académica a la semana

(54)
[image:54.595.102.523.162.729.2]

•Cuarto bloque: Variables referentes a la uso de internet con respecto al entretenimiento.

Tabla 10. Variables con respecto al uso de Internet entretenimiento.

CAMPO VARIABLE TIPO DE DATO

DESCRIPCION VALORES

Horas_chat_diver Nominal Numérico Aproximadamente cuantas horas a la semana chateas por diversión.

Ninguno

Horas_redes Nominal Numérico Aproximadamente cuántas

horas a la semana utilizas redes sociales por diversión

Ninguno

Horas_juegos Nominal Numérico Aproximadamente cuántas

horas a la semana utilizas juegos en línea?

Ninguno

Horas_descargas Nominal Numérico Aproximadamente cuántas

horas a la semana descargas música, videos y programas

Ninguno

Videos_entrete Nominal Numérico Aproximadamente cuántos

videos para entretenimiento miras en youtube cada semana

Ninguno

Seguidores_twitter Nominal Cadena Aproximadamente cuántos

seguidores tienes en twitter? Ninguno

Amigos_facebook Nominal Cadena Cuántos amigos tienes en

Facebook Ninguno

Contactos_linkedln Nominal Cadena Cuántos contactos tienes en LinkedIn

Ninguno

Otra_red Nominal Cadena Otra red social: ¿Cuál? Ninguno

Blog Escala Numérico Tienes un blog 1= SI

2=.NO

Cuenta_youtube Escala Numérico Tienes cuenta en youtube 1= SI

2=.NO

Instagram Escala Numérico Tienes cuenta en instagram 1= SI

2=.NO

whatsap Escala Numérico Tienes Whatsapp 1= SI

(55)
[image:55.595.95.530.150.746.2]

• El quinto Bloque: Variables referentes a la utilización de dispositivos electrónicos, valoración del internet y la comunicación con los profesores a través de las redes de comunicación.

Tabla 11. Variables de utilización de dispositivos.

CAMPO VARIABLE TIPO DE

DATO DESCRIPCION

VALORES

manejo_smartphone Escala Numérico Nivel de uso de Smartphone con cámara fotográfica y acceso a internet 1=10

manejo_teléfonoint Escala Numérico Nivel de uso de Teléfono móvil con

acceso a internet 1=10

menejo_teléfonosin Escala Numérico Nivel de uso de Teléfono móvil sin

acceso a internet 1=10

computador_portátil Escala Numérico Nivel de uso de Computador portátil 1=10

manejo_tablet Escala Numérico Nivel de uso de Tablet (iPad; Galaxy Tab, Kindle, etc) 1=10 manejo_camaradig Escala Numérico Nivel de uso de Cámara digital 1=10

manejo_ipod Escala Numérico Nivel de uso de iPod / MP3 Player 1=10

internet_trabajos Escala Numérico Internet te permite elaborar los trabajos más rápido y con menos esfuerzo 1=10 internet_confianza Escala Numérico Tu confías en la información de internet

para realizar sus tareas 1=10

internet_biblioteca Escala Numérico Internet te permite prescindir de la

Biblioteca 1=10

internet_aprendizaje Escala Numérico Internet facilita el proceso de

aprendizaje 1=10

internet_calificacione s

Escala Numérico Internet te permite mejorar sus

calificaciones 1=10

internet_academico Escala Numérico Tu presentas trabajos académicos copiados desde Internet 1=10

profesor_consultas Escala Numérico Tu profesor contesta sus consultas por correo electrónico

1=SI, 2=NO 3= A VECES profesor_chat Escala Numérico Chatea contigo sobre aspectos

académicos

1=SI, 2=NO 3=A VECES profesor_redes Escala Numérico Tu profesor comenta en redes sociales

sobre temas académicos

1=SI, 2=NO 3=A VECES profesor_material Escala Numérico Te envía materiales digitales para que

estudies

1=SI, 2=NO 3=A VECES profesor_videos Escala Numérico Te recomienda videos sobre temas

académicos

1=SI, 2=NO 3=A VECES profesor_paginas Escala Numérico Tu profesor tiene una página web, blog o

perfil de Facebook

1=SI, 2=NO 3=A VECES profesor_twitter Escala Numérico Tu profesor tiene cuenta de twitter 1=SI,

(56)
[image:56.595.125.494.155.503.2]

En número de encuestas realizadas en los planteles educativos se detallan así Tabla 12.

Tabla 12. Encuestas realizadas.

COLEGIOS MUESTRADE

ESTUDIANTES

ADOLFO VALAREZO 53

BERNARDO VALDIVIEZO 64

CALAZANS 60

DANIEL ALVAREZ BURNEO 49

HERNAN GALLARDO MOSCOSO 43

LA DOLOROSA 52

LA SALLE 43

PIO JARAMILLO ALVARADO 52

SAN FRANCISCO DE ASIS 54

27 DE FEBRERO 48

TOTAL 518

Elaboración: Elaboración propia.

(57)

3.2.2. Fase de Selección, Limpieza y Trasformación.

En esta fase se realiza un control de calidad de los datos obtenidos en la recolección y su objetivo principal es obtener datos validos con el menor error posible para luego obtener resultados más acordes con la realidad y poder hacer una mejor interpretación de los mismos.

Para el inicio de la investigación se obtuvo una base de datos con un total de 532 encuestas, las mismas que luego de ser tratadas y tabuladas a mano fueron separas aquellas encuestas que tuvieron datos atípicos, quedando así 518 encuestas.

Luego se procedió a seleccionar a las variables más relevantes que serán utilizadas para la comprobación de las hipótesis planteadas en el proyecto, en lo que respecta a las variables del grupo académico quedaron como 4 variables relevantes las mismas son: cuantos-videos, cuantos-post, horas de chat, horas de información.

[image:57.595.107.520.443.716.2]

Para el de grupo de entretenimiento se procedió a obtener la media de cada una de ellas y se eligió a las que tienen el valor más alto, quedando así: horas chat, horas redes y videos entretenimiento.

Tabla 13. Variables seleccionadas.

Elaboración: Elaboración propia.

GRUPOS DE VARIABLES

VARIABLES VARIABLES

SELECCIONADAS VARIABLESDESTINO

INGRESOS INGRESOS 1 INGRESOS 2 INGRESOS 3 INGRESOS 4 INGRESOS 5 Nivel Ingresos

ACADEMICO CUANTOS VIDEOS CUANTOS POST. HORAS CHAT. HORAS INFORMACION CUANTOS VIDEOS CUANTOS POST. HORAS CHAT. HORAS INFORMACION Perfil Académico

ENTRETENIMIENTO HORAS CHAT DIVERSION. HORAS REDES.

HORAS JUEGOS.

HORAS DESCARGA

VIDEOS

ENTRETENIMIENTO

HORAS CHAT DIVERSION.

HORAS REDES.

VIDEOS

ENTRETENIMIENTO

Perfil

(58)

3.2.3. Fase de Minería de datos.

Es la fase donde se extrae conocimiento en base a los datos obtenidos en paso anterior, esta información será comprensible para ser utilizado por el usuario, se construye un modelo que es conformado por relaciones y patrones de los datos almacenados, para llegar a obtener predicciones que interpreten de mejor manera los datos obtenidos. Para esto se define el modelo, tarea y el algoritmo de minería de datos se va a utilizar.

3.2.3.1. Identificar el modelo adecuado.

Para identificar el modelo a seguir, se toma en cuenta los objetivos que se pretende obtener y también las hipótesis que hay que resolver, para la presente investigación se utilizaran dos tipos de modelo los cuales son: el modelo descriptivo que permite agrupar a los estudiantes en grupos homogéneos y también se utilizara el modelo predictivo el cual nos permite comprobar las hipótesis planteadas.

3.2.3.2. Seleccionar la tarea de minería de datos.

La tarea seleccionada en base a los modelos ya definidos anterior mente es:

Clusterizacion: Que es una tarea descriptiva la cual nos permite obtener grupos a partir de características similares descritos en la base de datos.

Para la presente investigación se empleara la clasificación no jerárquica en base a la investigación realizada por Días de Rada (2002) que recomienda trabajar con clusterizacion no jerárquica en muestras altas aplicando al algoritmo K-means.

(59)

Los pasos propuestos por Xu, R. y Wunsch (2009) para ejecutar el algoritmo K-means son:

1. Inicializar cada partición K de forma randómica o en base a centroides preexistente. Calcular la matriz prototipo de clúster M=[m1,...,mK]

2. Asignar cada sujeto al clúster más cercano.

3. Recalcular la matriz prototipo del clúster en base a la partición actual.

4. Repetir los pasos 2 y 3 hasta que no hayan cambios en el centroide de los clúster.

Para la ejecución del algoritmo K-means se escogió para las variables en lo referente a las actividades académicas:

1. ¿Para entender las materias cuantos videos miras en youtube a la semana? 2. ¿Cuantos post o tweets sobre temas académicos realizas por semana?

3. ¿Aproximadamente cuantas horas chateas sobre temas académicos por semana? 4. ¿Aproximadamente cuantas horas buscas información académica en internet por semana?

Las cuales fueron agrupadas en el perfil para actividades académicas y se realizaron grupos de 2, 3 y 4, seleccionado el grupo de 2 con dos categorías: normal (clúster 1) y moderno (clúster 2) para mejor interpretación de los resultados.

Las variables seleccionadas para utilizar en el algoritmo K-means para el perfil actividades de entretenimiento fueron:

• Aproximadamente cuantas horas a la semana chateas por diversión.

• Aproximadamente cuántas horas a la semana utilizas redes sociales por diversión. • Aproximadamente cuántos videos para entretenimiento miras en youtube cada semana

De las cuales se obtuvo grupos de 2, 3 y 4 y se escogió al grupo de 2 con dos categorías nombradas normal (clúster 1) y moderno (clúster 2) para mejor interpretación de los resultados.

(60)

Tabla 14. Discriminante clúster 2 perfiles actividades académicas.

Número de caso de clúster

Pertenencia a grupos pronosticada

Total

1 2

1 514 0 514

2 0 4 4

1 100,0 ,0 100,0

2 ,0 100,0 100,0

a. 100,0% de casos agrupados originales clasificados correctamente. Elaboración: Elaboración propia.

En la prueba de discriminación para el grupo de 2 clúster en el perfil actividades de entretenimiento se obtuvo un porcentaje de 99,6% de exactitud de clasificación correcta Tabla 15.

Tabla 15. Discriminante clúster 2 perfil actividades entretenimiento.

Número de caso de clúster

Pertenencia a grupos pronosticada

Total

1 2

Original Recuento 1 15 0 15

2 2 501 503

% 1 100,0 ,0 100,0

2 ,4 99,6 100,0

a. 99,6% de casos agrupados originales clasificados correctamente. Elaboración: Elaboración propia.

3.2.4. Fase de Evaluación e Interpretación.

En esta fase se verifican las hipótesis planteadas en base a los patrones obtenidos en la fase anterior, se utilizan algunas medidas y técnicas de minería de datos para conocer si las hipótesis se cumplen o no.

3.2.4.1. Regresión Logística Binomial.

Figure

Tabla 1. Tasa de analfabetismo por provincias del Ecuador
Figura 4. Estructura del sistema de educación en el Ecuador.Fuente: Reglamento General de la LOEI, 2012: art
Figura 5. Estructura del sistema de educación en el Ecuador.
Tabla 4. Tasa de variación de pobreza por consumo del Ecuador.
+7

Referencias

Documento similar

No había pasado un día desde mi solemne entrada cuando, para que el recuerdo me sirviera de advertencia, alguien se encargó de decirme que sobre aquellas losas habían rodado

Where possible, the EU IG and more specifically the data fields and associated business rules present in Chapter 2 –Data elements for the electronic submission of information

The 'On-boarding of users to Substance, Product, Organisation and Referentials (SPOR) data services' document must be considered the reference guidance, as this document includes the

In medicinal products containing more than one manufactured item (e.g., contraceptive having different strengths and fixed dose combination as part of the same medicinal

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

Products Management Services (PMS) - Implementation of International Organization for Standardization (ISO) standards for the identification of medicinal products (IDMP) in

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)