i
CARÁTULA
UNIVERSIDAD TÉCNICA PARTICULAR DE LOJA
La Universidad Católica de Loja
ÁREA TÉCNICA
TÍTULO DE INGENIERO EN INFORMÁTICA
Aplicar Minería de Datos para definir perfiles ocupacionales en selección de
personal requeridos por áreas críticas en la Armada del Ecuador
TRABAJO DE TITULACIÓN
AUTOR: Almeida Cárdenas, Diego Miguel
DIRECTOR: González Eras, Alexandra Cristina.
CENTRO UNIVERSITARIO SAMBORONDÓN
ii
APROBACIÓN DEL DIRECTOR DEL TRABAJO DE TITULACIÓN
Ingeniera.
Alexandra Cristina González Eras.
DOCENTE DE LA TITULACIÓN
De mi consideración:
El presente trabajo de titulación: Aplicar Minería de Datos para definir perfiles ocupacionales en selección de personal requeridos por áreas críticas en la Armada del Ecuador, realizado por Diego Miguel Almeida Cárdenas, ha sido orientado y revisado durante su ejecución, por cuanto se aprueba la presentación del mismo.
Loja, enero de 2016
iii
DECLARACIÓN DE AUTORÍA Y CESIÓN DE DERECHOS
“Yo Diego Miguel Almeida Cárdenas declaro ser autor del presente trabajo de titulación: Aplicar Minería de Datos para definir perfiles ocupacionales en selección de personal requeridos por áreas críticas en la Armada del Ecuador, de la Titulación de Ingeniero en Informática, siendo Alexandra Cristina González Eras directora del presente trabajo; y eximo expresamente a la Universidad Técnica Particular de Loja y a sus representantes legales de posibles reclamos o acciones legales. Además certifico que las ideas, conceptos, procedimientos y resultados vertidos en el presente trabajo investigativo, son de mi exclusiva responsabilidad.
Adicionalmente declaro conocer y aceptar la disposición del Art. 88 del Estatuto Orgánico de la Universidad Técnica Particular de Loja que en su parte pertinente textualmente dice: “Forman parte del patrimonio de la Universidad la propiedad intelectual de investigaciones, trabajos científicos o técnicos y tesis de grado o trabajos de titulación que se realicen con el apoyo financiero, académico o institucional (operativo) de la Universidad”
f. ……… Autor: Diego Miguel Almeida Cárdenas
iv
DEDICATORIA
v
AGRADECIMIENTO
vi
ÍNDICE DE CONTENIDOS
Contenido
CARÁTULA ... i
APROBACIÓN DEL DIRECTOR DEL TRABAJO DE TITULACIÓN ... ii
DECLARACIÓN DE AUTORÍA Y CESIÓN DE DERECHOS ... iii
DEDICATORIA ... iv
AGRADECIMIENTO ... v
ÍNDICE DE CONTENIDOS ... vi
RESUMEN ... 1
ABSTRACT ... 2
INTRODUCCIÓN ... 3
1. MINERÍA DE DATOS Y SU APLICACIÓN A LOS RECURSOS HUMANOS ... 5
1.1. Introducción al ámbito de la Selección de Personal ... 6
1.2. Conceptos básicos sobre Gestión de Personal ... 6
1.3. La Minería de Datos como apoyo a la Selección de Personal ... 8
1.3.1. Contextualización ... 8
1.3.2. Técnicas de minería ... 9
1.3.3. Selección de la Técnica de Minería ... 11
1.3.4. Metodologías de Minería de datos ... 11
1.3.5. Selección de la Metodología ... 13
1.3.6. Descripción de la Metodología CRISP-DM ... 14
2. CONTEXTUALIZACIÓN DE LA PROBLEMÁTICA ... 18
2.1. Procesos de Selección de Personal en la Armada... 19
2.2. Problemas presentados en la Selección de Personal ... 21
2.3. Propuesta de Trabajo ... 23
2.3.1. Objetivo ... 23
2.3.2. Objetivos Específicos ... 23
2.3.3. Resultados Esperados ... 24
3. FASE I: COMPRENSIÓN DEL NEGOCIO ... 25
3.1. Contexto ... 26
3.2. Objetivos de negocio ... 26
3.3. Criterios de éxito de negocio ... 27
3.4. Inventario de recursos ... 28
3.5. Requerimientos, presunciones, y restricciones ... 29
vii
3.7. Terminología ... 31
3.8. Costos y beneficios ... 32
3.9. Objetivos y Criterios de éxito de minería de datos ... 34
3.9.1. Determinación de los objetivos de la minería de datos... 34
3.9.2. Criterios de éxito de la minería de datos ... 34
3.10. Plan del proyecto ... 35
3.11. Evaluación inicial de herramientas y técnicas ... 41
4. FASE II: COMPRENSIÓN DE DATOS ... 42
4.1. Recolección de datos iniciales ... 43
4.2. Informe de colección de datos iniciales ... 46
4.2.1. Contexto ... 46
4.2.2. Criterios de Selección ... 47
4.2.3. Lista de Fuentes de Datos ... 47
4.3. Informe de descripción de datos ... 48
4.4. Informe de exploración de datos ... 50
4.5. Informe de calidad de datos ... 50
5. FASE III: PREPARACIÓN DE DATOS ... 53
5.1. Selección de datos ... 54
5.1.1. Razonamiento para la inclusión/exclusión ... 56
5.1.2. Conclusiones de selección de datos ... 57
5.2. Informe de Limpieza de datos ... 57
5.3. Construir datos ... 59
5.4. Integrar datos ... 59
5.5. Formatear datos ... 60
6. FASE IV: MODELADO ... 61
6.1. Selección de la técnica de modelado ... 62
6.1.1. Técnicas de modelado ... 62
6.1.2. Presunciones del modelado ... 65
6.2. Generación de la prueba de diseño ... 65
6.3. Construcción del modelo ... 66
6.4. Evaluación del Modelo ... 74
6.4.1. Parámetro de ajustes ... 74
6.4.2. Modelos ... 74
6.4.3. Descripciones del modelo ... 77
6.5. Evaluación del modelo ... 81
6.5.1. Evaluar el modelo ... 81
6.5.2. Parámetros de ajustes revisados ... 82
viii
7. FASE V: EVALUACIÓN ... 95
7.1. Evaluación de los resultados ... 96
7.1.1. Evaluar los resultados ... 96
7.1.2. Estudio de Casos ... 100
7.1.3. Evaluación de los resultados de la minería de datos en lo que concierne a criterios de éxito de negocio 104 7.2. Modelos aprobados ... 105
7.3. Proceso de revisión ... 106
7.4. Determinación de los próximos pasos ... 107
7.4.1. Lista de posibles acciones ... 108
7.5. Decisión ... 108
8. FASE VI: DESARROLLO ... 109
8.1. Desarrollo del plan ... 110
8.2. Plan de supervisión y mantenimiento ... 110
8.3. Informe definitivo de producto ... 111
CONCLUSIONES ... 112
RECOMENDACIONES ... 113
BIBLIOGRAFIA ... 114
1 RESUMEN
La Armada del Ecuador, como institución que contribuye directamente a la seguridad de la nación, cuenta como base fundamental de su gestión a las unidades operativas, donde la selección del personal para integrar estas áreas críticas se ha venido realizando en forma voluntaria y prácticamente no se han utilizado criterios técnicos precisos, que orienten adecuadamente dicha selección, por lo que se ha considerado la utilización de la información histórica disponible del personal, para encontrar parámetros de selección válidos, para la aplicación efectiva de esta selección utilizando Minería de Datos.
Se considera a la metodología CRISP-DM y el método de árboles de decisión como los más adecuados, y se aplican a una muestra de la población, cuyos datos se han procesado utilizando la aplicación WEKA, para el análisis y construcción de un árbol de decisión adecuado a la información existente.
El análisis realizado y la metodología aplicada generaron un árbol de decisión con un porcentaje bastante aceptable de aciertos, con cuatro parámetros relacionados con la selección de personal, cuyos datos se pueden obtener de las bases de datos para cualquier selección futura.
2 ABSTRACT
The Navy of Ecuador, as an institution that contributes directly to the nation´s security, has as the foundation of its management to operational units, where the recruitment to integrate these critical areas has been carried out on a voluntary basis and have virtually no precise technical criteria used as to properly orient the selection, which has been considered using the available historical information of personnel, to find valid selection parameters for the effective application of this selection using Data Mining.
It´s considers the CRISP-DM methodology and method of decision trees as the most appropriate, and applied to a sample of the population, whose data have been processed using the WEKA application for analysis and construction of a suitable decision tree to existing information.
The analysis and methodology generate a decision tree with a very acceptable percentage of hits, with four parameters related to recruitment, whose data can be obtained from the database for future selection.
3
INTRODUCCIÓN
A medida que las empresas o instituciones van creciendo, también se va extendiendo la dificultad de los sistemas y/o procesos para cumplir con sus metas, y parte importante de las tareas necesarias es seleccionar al personal que va a ocupar los puestos que exigen competitividad y eficiencia; en algunas instituciones además, la selección de personal tiene una importancia trascendental, ya que ciertos puestos, deben ser ocupados por gente que esté comprometida y capacitada para que la gestión no sea solo eficiente, sino que se evite caer en errores graves que comprometan la seguridad del material y del personal, o que puedan afectar de alguna forma a otras personas ajenas a las funciones ejecutadas.
Una de las instituciones en donde la selección de personal tiene gran importancia es la Armada del Ecuador, que posee gran cantidad y diversidad de personal y procesos complejos y relacionados con áreas consideradas críticas, directamente enlazadas a las funciones primordiales de seguridad nacional, apoyo a la seguridad interna, control de actividades ilícitas y desarrollo nacional.
El presente documento plantea un estudio enmarcado en la Minería de Datos, que intenta establecer los parámetros requeridos y las condiciones de selección (algoritmo) que se deben aplicar a las poblaciones de candidatos a los cursos de las áreas críticas de la Armada, siendo las especialidades consideradas Superficie, Submarinos, Aviación Naval, Infantería de Marina e Inteligencia.
En el Capítulo 1 se realiza un análisis más detallado del método y metodología de desarrollo más apropiado de Minería de Datos relacionado a la selección de personal, así mismo, se analiza la selección de personal en la Armada y se plantean los objetivos y los resultados esperados para este trabajo.
En el Capítulo 2 se inicia la metodología CRISP-DM, siendo analizada la primera fase de comprensión del negocio, analizando todas las implicaciones que tiene la selección de personal y estableciendo los objetivos y criterios de éxito de la Minería de Datos.
En el Capítulo 3, se continúa con la segunda fase que corresponde a la comprensión de los datos, es decir, recolectar y analizar datos, que puedan contribuir al análisis posterior.
4
En el Capítulo 5, se realiza el modelado, que consiste en elaborar el diseño del modelo de Minería de Datos seleccionado y realizar las primeras pruebas para verificar su funcionamiento.
En el Capítulo 6, se evalúa al modelo desarrollado para comprobar si lo obtenido corresponde a los criterios de éxito establecidos y se realizan los ajustes necesarios, para luego definir el modelo aprobado y tomar una decisión respecto a las acciones posteriores.
En el Capítulo 7, se realiza el plan de desarrollo del modelo, así como se detalla todo lo requerido para su supervisión y mantenimiento, realizando el informe definitivo del producto, obteniendo a continuación las respectivas conclusiones y recomendaciones.
Este trabajo resulta sumamente útil para los procesos de selección de personal, ya que la aplicación efectiva de los parámetros provenientes del modelo, derivarán en procesos definidos y un mejor desempeño del personal en las áreas consideradas críticas de la Armada, brindando a la sociedad un mejor y más efectivo empleo de los medios disponibles.
Para lograr esto, se inició estableciendo una metodología de desarrollo para Minería de Datos, luego se seleccionó el método a utilizar que mejor se aplica a la selección de personal (en este caso árboles de decisión) para realizar las pruebas sobre un grupo de muestra del personal de oficiales y tripulantes; todo esto utilizando la aplicación abierta WEKA, de la Universidad de Waikato (Nueva Zelandia), llegando a obtener los parámetros de selección adecuados para ser aplicados en procesos de selección futuros.
Los objetivos principales se establecieron en obtener las formas de selección y generar un algoritmo que determinen los parámetros buscados y las respectivas rutas de selección para las especialidades, lo cual se logró aplicándolo sobre un grupo de muestra de 100 personas pertenecientes a la Armada del Ecuador.
El trabajo tuvo ciertas dificultades en cuanto a la obtención, selección y filtrado de los datos, tomados de la base de datos principal para su limpieza y uso definitivo; pero también se pudo obtener datos muy útiles e información nueva relacionada a la selección de personal.
5
6
1.1. Introducción al ámbito de la Selección de Personal
Dentro de las empresas o instituciones, la gestión de los Recursos Humanos que se requiere para su funcionamiento, es la base para desarrollar la actividad principal de dicha empresa o institución, y en el caso de las instituciones públicas de un Estado es fundamental para lograr el desempeño adecuado a la función de servicio a los ciudadanos.
En este sentido, algunas instituciones del estado son relevantes para el bien común y el desarrollo nacional, y una de estas instituciones son las Fuerzas Armadas, que contribuyen de forma directa a la seguridad externa y apoyan a la seguridad interna del estado ecuatoriano.
Es por esto que la gestión de los Recursos Humanos en cualquiera de las áreas de Fuerzas Armadas, resulta relevante para lograr un buen desempeño de las tareas asignadas, y en el caso de la Armada del Ecuador – al igual que en las otras dos fuerzas Ejército y Fuerza Aérea – existen áreas críticas en donde se plasman acciones directas de seguridad y que se encuentra a cargo de personal que debe operar costosos sistemas, equipos, armamento y efectuar operaciones cuya mala ejecución, pueden causar graves accidentes y afectación a dichos sistemas, equipos o las personas involucradas y/o ajenas a la actividad realizada.
La administración de personal y sus primeras tareas, que son el reclutamiento y la selección, deben por tanto ser realizadas con el compromiso de la importancia de esta actividad; sin embargo, la selección del personal para los cursos en las áreas críticas, han tenido una orientación llevado por la tradición y preferencia individual, y no se han considerado factores técnicos cuya fuente está oculta en los datos del personal, que pueden ser una buena base para la toma de decisiones en este campo.
Por ende, nuestro propósito es que a través de nuestro trabajo, se logre determinar factores que ayuden a la toma de decisiones en cuanto a la selección de personal en la Armada del Ecuador, para lo cual, se iniciará con la familiarización de los términos relacionados a este tema.
1.2. Conceptos básicos sobre Gestión de Personal
Con respecto a la administración de personal, Dessler (2001) indica que se cumplen cinco funciones básicas: planear, organizar, dotar de personal, dirigir y controlar, que representan al proceso de la administración de personal y que cada una representa lo siguiente:
1. Planificar, se refiere a establecer metas y normas para el futuro de la institución.
2. Organizar, significa implementar la estructura de trabajo, de autoridad y de comunicaciones, así como dar disposiciones a los empleados.
3. Dotar de personal, consiste primero en determinar qué tipo de empleados se requieren, seleccionarlos, establecer normas de desempeño y evaluarlos, dar compensaciones, asesoramiento, capacitación y desarrollo.
7
5. Controlar, significa establecer estándares, evaluarlos y establecer formas de mejoramiento. Por su parte, Silíceo (2006) indica que la administración de personal debe “comprender y coordinar” las siguientes funciones: Reclutamiento, Selección, Introducción o Inducción, inventario de los recursos humanos, evaluación del potencial y desempeño, entrenamiento o capacitación y planeación de vida y carrera; estas funciones están relacionadas con el concepto de administración de recursos humanos, que insiste en que el fin último es lograr un sistema efectivo de planeación de vida y carrera, y a su vez significa “contar con el personal adecuado en número, perfil, preparación, potencial y actitud, que vaya de acuerdo con los objetivos y cultura de la organización” (Silíceo, 2006, p. 45)
Como se puede observar en ambos casos, dentro de la administración de personal los factores de reclutamiento y selección o dotación de personal, son importantes argumentos para las bases del proceso de gestión de los Recursos Humanos, y como indican Chiavenato, Villamizar y Aparicio (1983), existen dos formas de considerar al personal, la primera es como personas, es decir, con personalidad, aspiraciones y valores entre otras, y la segunda como recursos, es decir con habilidades, capacidades, destrezas y conocimientos; ambas consideraciones son importantes y su estudio constituye la base de la teoría de las organizaciones; la selección de personas se hace para alcanzar los objetivos de la empresa, pero a su vez, las personas tienen objetivos individuales y se valen de la empresa para alcanzarlos, es decir, existe una relación individuo – organización que bien orientada puede ser una relación cooperativa y satisfactoria pero a su vez puede ser tensa y conflictiva.
Esto centra la atención en el candidato, y los mismos autores indican que con respecto al candidato para una organización, se distinguen dos tipos: candidatos reales, que son aquellos que buscan oportunidades de ubicación en un puesto o algún tipo de beneficio, y los candidatos potenciales, que son quienes tienen la capacitación para llenar las vacantes en forma satisfactoria por su perfil, pero que no necesariamente están buscando el puesto.
En base a los tipos de candidatos (ambos válidos), la selección de personal se puede definir como “un proceso dinámico, cuyo objetivo es encontrar la persona más adecuada (por sus características personales, aptitudes, motivación etc.) para cubrir un puesto de trabajo en una empresa determinada” (López, 1999, p. 13).
Entonces, para lograr la finalidad de la selección de personal se debe iniciar con el reclutamiento y la selección; al respecto el mismo autor López (1999) indica que la selección de personal es distinto que el reclutamiento, en el sentido de que este último (el reclutamiento) también es un proceso dinámico, pero que no sigue un proceso determinado, y que su función es buscar a un candidato idóneo para un puesto determinado considerando el entorno en el cual se debe realizar.
8
candidatos potenciales calificados y capaces a ocupar cargos dentro de la organización” (p. 18), mientras que la selección de personal se orienta más a escoger a un grupo de candidatos para determinar quien cumple el mejor perfil para el puesto.
En este trabajo, nos centraremos en el proceso de selección de candidatos potenciales, entendiendo que ya ha sido realizado el reclutamiento y se busca determinar al mejor capacitado para un puesto (en este caso un alumno que a futuro ocupará un área crítica) dentro de las especialidades operativas.
1.3. La Minería de Datos como apoyo a la Selección de Personal 1.3.1. Contextualización
Los datos son el elemento básico de la Minería de Datos, tal como lo indican Pardo y otros (2013), que señalan como aporte de Davenport y Prusak:
Son la mínima unidad semántica, y se corresponden con elementos primarios de información que por sí solos son irrelevantes como apoyo a la toma de decisiones. La información se puede definir como un conjunto de datos procesados y que tienen un significado (relevancia, propósito y contexto), y que por lo tanto son de utilidad para quién debe tomar decisiones, al disminuir su incertidumbre (p. 1163)
Este enfoque de utilidad de los datos es recogido en la definición de la Minería de Datos, dado por Conolly y Begg (2005) que la expresa como “el proceso de extraer información válida, previamente desconocida, comprensible y útil de bases de datos de gran tamaño y utilizar dicha información para tomar decisiones de negocios cruciales”.
9
con las centros educativos superiores, utilizando una serie de métodos de selección (pruebas, discusiones grupales, entrevistas etc.), pero que esto demanda un enorme esfuerzo y la observación de la selección establece la existencia de patrones, pero que son muy complejos para aislarlos. Por esto, se puede relacionar que dada la enorme complejidad de los procesos de selección y el avance de la Minería de Datos en este tema, pueden apoyarse mutuamente para hacer más efectivo el proceso.
Por tanto, la Minería de Datos es totalmente aplicable a la Gestión de Recursos Humanos en muchas formas y en diferentes campos de aplicación de acuerdo a las necesidades de esta gestión, y específicamente tiene también su atención en lo que respecta a la selección de personal, que puede convertirse en uno de los puntos cruciales para un adecuado futuro desempeño de la fuerza laboral de cualquier empresa o institución, sin embargo, el proceso de selección tiene varias dificultades, como lo indican Sivaram y Ramar (2010), ya que en los métodos tradicionales de selección existe una gran desproporción (aproximadamente 1 a 20) entre los candidatos seleccionados y los candidatos entrevistados, generando un gran gasto de recursos y tiempo. Ahora bien, hay que tomar en cuenta que existe un patrón en los métodos tradicionales que se mantiene en los candidatos seleccionados que puede ser aprovechado, y considerando que estos métodos de selección de personal – como ya se dijo en el párrafo anterior - por un lado generan gastos en tiempo, personal y recursos para la empresa o institución y por otro, se mantiene una gran brecha entre los seleccionados y los candidatos considerados, se puede observar la gran utilidad para la aplicación de la Minería de Datos en estos procesos, aprovechando la ventaja que dan estos patrones de selección.
1.3.2. Técnicas de minería
En cuanto a las técnicas de Minería de Datos que pueden ser utilizados para reclutamiento de personal (y otras afines), Strohmeier y Piazza (2013) indican que en relación a la gran amplitud de las técnicas de minería de datos, quienes apoyan en mejor forma a las funciones de selección de personal son los árboles de decisión, el análisis de conglomerados, el análisis de asociación, las máquinas de vectores y las redes neuronales, mientras que Sivaram y Ramar (2010) en forma muy similar, indican que entre las más populares para extracción de información están los árboles de decisión, máquinas de soportes de vectores y redes neuronales; estas abren un amplio espectro para nuevos descubrimientos relacionados al manejo de Recursos Humanos.
10
Tabla 1. Técnicas de Minería de Datos aplicables para Selección de Personal,
TÉCNICA EXPLICACIÓN
Arboles de Decisión
Organizan los datos en base a una decisión inicial tomando en cuenta la influencia que debe tener cada rama, son sistemas relativamente simples de manejar pero tienen poco campo de complejidad para tareas en las que se requiere más detalle; muchos de los procesos de recursos humanos requieren el enfoque selectivo, en donde los árboles de decisión están directamente relacionados a este tipo de enfoque.
Análisis de Conglomerados (Clustering)
Es el agrupamiento de datos para poder identificar tipologías o grupos en donde existen datos similares, en los cuales se requiere diferenciar de otros datos existentes, de forma de obtener datos filtrados para conseguir información sobre lo que se demanda conocer, utilizando herramientas estadísticas, algoritmos matemáticos u otras para el tratamiento de los datos; además, de acuerdo a López y González (2007) el utilizar conglomerados disminuye la precisión por el hecho de que al ser datos agrupados necesariamente tendrán cierta homogeneidad, por lo que resulta útil cuando las poblaciones de conglomerados son muy numerosas, lo que en caso de selección de personal se puede utilizar si se tiene grandes bases de datos Análisis de
Asociación
Se utilizan para analizar relaciones entre sucesos que aparentemente no están relacionados, pero que en realidad corresponden a eventos que pueden generar nuevos eventos y que si tengan relación; se utilizan para realizar análisis exploratorios que conlleven a predecir comportamientos futuros de eventos, una de los algoritmos utilizados para asociación es el algoritmo a-priori.
Este tipo de exploración es utilizable dentro de selección de personal, ya que el procedimiento de selección utiliza normalmente una serie de sucesos, que adecuadamente orientado para su uso con análisis de asociaciones pueden generar nueva información.
Apoyo a las máquinas de vectores
11
TÉCNICA EXPLICACIÓN
Redes neuronales
Esta técnica se suele utilizar para descubrir categorías comunes en los datos, tiene capacidad para detectar y aprender patrones más complejos y sobre todo, puede trabajar con datos incompletos; debido a esta característica, y ya que muchas veces la información utilizada para selección de personal está incompleta, su uso puede ser útil para esta tarea.
Fuente: Strohmeir y Piazza (2013)
1.3.3. Selección de la Técnica de Minería
En el caso de selección de personal, se debe tomar en cuenta que los tipos de datos son de distinta índole (no solo numéricos), por lo que la técnica adecuada debe tomar en cuenta esta consideración o su “conversión” a datos numéricos; al respecto, Strohmeier y Piazza (2013) indican que entre las principales categorías de técnicas de búsqueda utilizados para temas relacionados a la gestión del talento humano y sus subdominios fueron los árboles de decisión y análisis de conglomerados y, luego de sus mediciones (casos de variable n), determinaron que las técnicas empleadas más frecuentes eran árboles de decisión (n = 28), redes neuronales (n = 27), máquinas de vectores soporte (n = 15), el análisis de asociación (n = 11), análisis de grupos (n = 11), conjunto aproximado (n = 10), análisis discriminante (n = 4), la regresión logística (n = 4) y la regresión (n = 3) (p. 2414).
Se observa que los árboles de decisión ha sido la técnica más utilizada; como lo expresan Sivaram y Ramar (2010), los árboles de decisión tienen un enfoque simple para encontrar el “conocimiento” oculto en los datos y que este método tiene la ventaja de ser fácil de interpretar, comprender para comparar información y tomar decisiones, por lo que se considera que los árboles de decisión se orientan adecuadamente al carácter selectivo de la búsqueda de información oculta, relacionado a la selección de personal como fundamente principal de este trabajo.
1.3.4. Metodologías de Minería de datos
12
Begg (2005) indican la importancia de llevar una “técnica sistemática”, insistiendo en la importancia de llevar una metodología para obtener buenos resultados.
Dentro de las metodologías existentes, Moine, Haedo y Gordillo (2011) establecen las siguientes metodologías, que son las más utilizadas:
Tabla 2. Metodologías más utilizadas para Minería de Datos METODO
LOGIA GENERALIDADES
SEMMA Creada por el SAS Institute, se define como “el proceso de selección, exploración y modelado de grandes volúmenes de datos para descubrir patrones de negocio desconocidos”.
Su nombre se basa en las fases básicas: Sample (Muestreo) Explore (Exploración), Modify (Modificación), Model (Modelado) y Assess (Valoración) y promueve una guía general del trabajo a realizar, ya que se encuentra enfocada en aspectos técnicos, pero excluye el análisis y comprensión del problema que se está abordando.
Catalyst De acuerdo a Moine (2013), Catalyst es una metodología que recomienda revisar primero la problemática antes de iniciar el trabajo con los datos, y en los casos que no se tenga un problema bien definido, iniciar utilizando P3TQ (Product, Place, Price, Time, Quantity) que plantea la formulación de dos modelos: El Modelo de Negocio y el Modelo de Minería de Datos. El primero proporciona una guía para identificar un problema de negocio y los requerimientos reales de la Organización, mientras el segundo proporciona una guía de pasos para la construcción y ejecución de modelos de minería de datos. En sus dos modelos, está compuesta por una serie de pasos llamados “boxes”, luego de una acción, se evalúan los resultados y se determina el próximo paso (box) a seguir, lo que permite una flexibilidad muy grande y una amplia variedad de caminos posibles.
13 METODO
LOGIA GENERALIDADES
Las tareas generales se proyectan a su vez en tareas específicas pero no se propone como realizarlas.
Fuente: Moine, Haedo y Gordillo (2011)
1.3.5. Selección de la Metodología
Para comparar estas metodologías, se ha establecido la siguiente tabla de contraste:
Tabla 3. Contraste de Metodologías METODO
LOGIAS COMPARACIÓN
SEMMA VS CATALYST
Catalyst presenta una guía o primer modelo para identificar un problema de negocio y los requerimientos reales de la organización, mientras que SEMMA carece de un análisis del problema.
SEMMA presenta un buen análisis de aspectos técnicos, mientras que Catalyst en forma similar, tiene un segundo modelo que desarrolla la solución en el aspecto técnico. SEMMA VS
CRISP-DM
SEMMA solo se afianza en aspectos técnicos ya que en su orientación se asume que va directamente a resolver un problema preestablecido (orientado solo al desarrollo del proceso), mientras que CRISP-DM da mucha importancia a la situación de la empresa y presenta un análisis completo adaptable a la realidad de cualquier empresa
(orientado a los objetivos empresariales)
En la parte técnica, ambas metodologías tienen similitudes: El muestreo, exploración y manipulación de datos de SEMMA se corresponden a las fases de Análisis y
Preparación de datos de CRISP-DM, mientras que ambas tienen las fases de Modelado y Evaluación; pero CRISP-DM además tiene la fase inicial de Análisis del Problema y la fase final de Resultados (ambos relacionados a los objetivos de la empresa, orientado a la gestión por procesos).
CATALYST VS CRISP-DM
Catalyst estructura en “boxes” el proceso de creación, que le da un proceso de desarrollo con múltiples opciones con dos modelos, el primero analiza el problema y el segundo desarrolla la solución, mientras que CRISP-DM es un proceso continuo y progresivo en donde se analiza todo el proceso de creación relacionado a la empresa. Si bien ambas metodologías cubren los aspectos del problema desde el punto de vista de la empresa y el desarrollo de la solución, CRISP-DM ha sido más utilizado por empresas que trabajan continuamente en proyectos de Minería de Datos y es el sistema más utilizado actualmente para proyectos de minería de datos.
Fuente: Moine, Haedo y Gordillo (2011)
14
empresarial al técnico de CRISP-DM, indicando que “la metodología CRISP-DM está más cercana al concepto real de proyecto de investigación”; por lo visto en la tabla anterior y al tratarse de un problema que debe ser estructurado desde su enfoque organizacional hacia el enfoque técnico, CRISP-DM es la metodología que mejor se adapta para lo requerido en este trabajo.
1.3.6. Descripción de la Metodología CRISP-DM
La guía metodológica a seguir es la elaborada por Chapman y otros (2007), cuyo modelo comprende seis componentes principales relacionados como se muestra en el siguiente gráfico:
Datos
1- Comprensióndel Negocio
2- Comprensión de los Datos
3- Preparación de los Datos
4- Modelado
[image:22.595.173.449.256.526.2]5- Evaluación 6- Desarrollo
Figura 1. Composición básica del modelo CRISP DM. Elaborado en base a la metodología CRISP-DM
Fuente: Infante y otros (2010)
15
Figura 2. Comprensión del negocio del modelo CRISP DM. Elaborado en base a la metodología CRISP-DM
Fuente: Infante y otros (2010)
[image:23.595.129.494.87.302.2]La comprensión del negocio se maneja inicialmente a nivel directivo, consultando como está estructurada la empresa o institución y se plantean las necesidades que a su vez generan los objetivos buscados y criterios de éxito del negocio; luego se continúa con la evaluación de la situación, en donde se analiza el entorno del trabajo a realizar, verificando el inventario de recursos, requerimientos, presunciones y restricciones existentes así como los riesgos, contingencias y beneficios, para posteriormente determinar los objetivos de la Minería de Datos y sus criterios de éxito desde el punto de vista de la Minería de Datos, y por último producir el Plan del Proyecto y una primera evaluación de las herramientas y técnicas a utilizar.
Figura 3. Compresión de datos del modelo CRISP DM. Elaborado en base a la metodología CRISP-DM
Fuente: Infante y otros (2010)
16
de los datos, etc., que son parte de la exploración de los datos y termina con la verificación de la calidad de los datos como base del proyecto de minería de datos.
Figura 4. Preparación de datos del modelo CRISP DM. Elaborado en base a la metodología CRISP-DM
Fuente: Infante y otros (2010)
En esta fase se trabaja únicamente con los datos, realizando la decisión de cuales datos van a ser usados de acuerdo al proyecto de minería, preparar los datos para poder trabajar con ellos, realizar una limpieza si se requiere, igualmente construir, generar nuevos registros e integrar datos si es necesario, y finalmente volver a formatear los datos para que se adapten a las necesidades del análisis que se va a efectuar.
Figura 5. Fase de Modelado del modelo CRISP DM. Elaborado en base a la metodología CRISP-DM
Fuente: Infante y otros (2010)
17
realizar una descripción del mismo y finalmente evaluarlo y revisar o corregir los parámetros de ajuste.
Figura 6. Fase de Evaluación del modelo CRISP DM. Elaborado en base a la metodología CRISP-DM
Fuente: Infante y otros (2010)
En esta fase se trata de evaluar el modelo en diferentes factores como la exactitud y la generalidad, para determinar el grado en que el modelo es aceptable o deficiente respecto a las necesidades del negocio para lo que fue creado, para posteriormente revisar el proceso en su conjunto para determinar posibles cambios o re-consideraciones, lograr determinar los siguientes pasos y tomar una decisión al respecto, sobre mantener o modificar parte o partes del modelo.
Figura 7. Fase de Desarrollo del modelo CRISP DM. Elaborado en base a la metodología CRISP-DM
Fuente: Infante y otros (2010)
18
19
2.1. Procesos de Selección de Personal en la Armada
La Constitución Política del Ecuador, en su artículo 227 dice textualmente que “la administración pública constituye un servicio a la colectividad que se rige por los principios de eficacia, eficiencia, calidad, jerarquía, desconcentración, descentralización, coordinación, participación, planificación, transparencia y evaluación” y de acuerdo a la Ley Orgánica de la Defensa Nacional en su artículo 26, dicta -entre otras cosas- que la Armada del Ecuador – al igual que las otras ramas de las Fuerzas Armadas - debe “desarrollar el poder militar para la consecución de los objetivos institucionales, que garanticen la defensa, contribuyan con la seguridad y desarrollo de la Nación”; de estas y otras normas legales, se desprenden varias responsabilidades asignadas a la Armada del Ecuador, entre ellas la de organizar, reclutar, clasificar, formar, capacitar y entrenar al personal de Oficiales y Tripulantes; estas tareas tienen mayor énfasis en las áreas que comprometen riesgo en las operaciones y que son críticas para el cumplimiento de los objetivos de la institución, y estas deben ser realizadas por personal comprometido con el nivel de responsabilidad y con las capacidades necesarias tanto físicas, académicas y psicológicas para un buen desempeño, ya que de no ser así, puede causar enormes daños a la institución y sus objetivos.
[image:27.595.135.491.404.629.2]Dentro de la organización de la Armada, y para efectos de este trabajo, las áreas críticas consideradas se resumen en el siguiente gráfico:
Figura 8. Esquema funcional de las áreas críticas de la Armada. Fuente: DIGREH
20
Tabla 4. Especialidades y tareas y cursos que deben desarrollar en la Armada. ESPECIALIDAD /
SUBESPECIALIDAD DETALLE
Superficie: Quienes operan los buques de guerra y buques auxiliares
Todos los Oficiales y Tripulantes que se gradúan en la Escuela Superior Naval y en la Escuela de Grumetes, tienen la orientación básica hacia la Especialidad de Superficie; los Oficiales y Tripulantes que son designados para esta especialidad, tienen que realizar el Curso de Superficie durante seis meses, luego pasan a operar los buques de guerra como Fragatas, Corbetas, Lanchas Misileras y los Buques Auxiliares como Transportadores, Tanqueros o Remolcadores.
Submarinistas: Operan los submarinos
Los Oficiales y Tripulantes designados para esta especialidad, deben realizar un curso de un año, luego de lo cual pasan a ser parte de las dotaciones de los dos submarinos que posee la Armada del Ecuador; en estos, la capacidad del Oficial y Tripulante para soportar el encierro y operar con seguridad y conocimiento los equipos dan la pauta para que puedan integrar las dotaciones de estas unidades.
Aviación Naval: Operan los aviones de exploración y helicópteros
Los Oficiales y Tripulantes designados para esta especialidad, deben realizar el Curso Básico de Aviación, los Oficiales como pilotos de aviones de ala fija y los tripulantes como mecánicos de aviación; para los Oficiales, la capacidad y habilidad de vuelo son primordiales para lograr graduarse, mientras que para los Tripulantes, deben alcanzar un nivel de conocimiento adecuado para trabajar como técnicos aeronáuticos.
Infantería de Marina: Realizar operaciones anfibias y especiales y brindan defensa externa e interna a bases navales.
21 ESPECIALIDAD /
SUBESPECIALIDAD DETALLE
Inteligencia: Realizan operaciones de búsqueda de información como base para las operaciones militares y seguridad interna.
Esta es una subespecialidad, tanto Oficiales como Tripulantes vienen de otras especialidades previas para realizar el curso; sin embargo, la selección de este personal es importante ya que integrarán un área delicada de las Fuerzas Armadas, en donde la capacidad, cautela y sagacidad son importantes para ingresar.
Fuente: DIGREH
El área del problema a tratar se establece en la Selección de Personal para cursos de especialización en estas áreas críticas de la Armada, y para la selección de personal de las especialidades y subespecialidad indicada en la tabla anterior, se sigue un procedimiento que se lleva de acuerdo al siguiente gráfico:
Figura 9. Esquema funcional resumido de selección de personal para las áreas críticas de la Armada.
Fuente: DIGREH
El proceso de selección considera únicamente como factor primordial de selección de personal el factor voluntario, y de no ser aplicable (por no alcanzar los cupos) se considera el análisis de perfiles para disponer la especialidad de los Oficiales y Tripulantes candidatos.
2.2. Problemas presentados en la Selección de Personal
22
de acuerdo a su antigüedad, para que escojan la especialidad o subespecialidad en la que querían formarse hasta completar el cupo para cada caso.
Sin embargo, este tipo de consideración para la selección presenta diversos problemas, que los podemos detallar en la siguiente tabla:
Tabla 5. Problemas existentes para la selección de personal en las áreas críticas de la Armada
FACTOR CONSIDERACIÓN / PROBLEMA ORIENTACIÓN A LA SOLUCIÓN
CAPACIDADES La preferencia personal no siempre está relacionada con las
capacidades del Oficial o Tripulante para poder desempeñarse de forma adecuada.
Determinar la mejor opción de desempeño de acuerdo al análisis histórico de casos, que permitan determinar los mejores perfiles del candidato
DISTRIBUCIÓN EQUITATIVA
Este tipo de consideración hacía que en su tiempo, las opciones menos populares o menos consideradas reciban a las personas con menor desempeño académico,
descompensando la equidad con la que debería distribuirse al personal en las especialidades.
Orientar a la obligatoriedad del cumplimiento de los perfiles
seleccionados para lograr un mejor desempeño personal.
Fuente: DIGREH
Dentro de la Selección de Personal, algunas veces el personal que ha sido escogido para cada una de las especialidades presenta problemas de adaptación y desempeño en las áreas asignadas, existiendo deserción y bajo rendimiento en los cursos, siendo en algunas ocasiones, motivo de pérdida del curso, lo que afecta en gran medida a todo el sistema; a continuación en la siguiente tabla se detalla los problemas relacionados:
Tabla 6. Problemas derivados de la mala aplicación de selección de personal para las áreas críticas de la Armada.
ÁREA DEL PROBLEMA
DETALLE
PRESUPUESTARIO Se afecta al presupuesto considerado para la capacitación de esa persona en esa especialidad
DISPONIBILIDAD DE CUPOS
Se pierde un cupo (puesto) que la pudo ocupar otra persona que seguramente pudo haber tenido un mejor desempeño.
DISPONIBILIDAD DE FUERZA LABORAL
23 ÁREA DEL
PROBLEMA
DETALLE
PROCEDIMIENTO La selección de personal implica el análisis de mucha información existente en las bases de datos, lo cual toma mucho tiempo del personal encargado para procesar estos datos.
Fuente: DIGREH
Para evitar estos problemas, se considera que al no existir un procedimiento normativo sobre las consideraciones a tomar en cuenta para aplicar los mejores perfiles para la selección de personal en relación a la gran cantidad de datos existentes, una aplicación informática basada en el análisis de datos, dará la pauta adecuada para la solución y puede ser la base para establecer un procedimiento estándar, por lo tanto, la solución del problema va orientado hacia la aplicación de un proyecto de Minería de Datos en el campo de la Selección de personal, en base al análisis de los requisitos de los perfiles de las especialidades y subespecialidad de las áreas críticas en la Armada y el correspondiente procesamiento de los datos relacionados.
2.3. Propuesta de Trabajo
2.3.1. Objetivo
El principal objetivo determinado para este trabajo es:
Desarrollar un modelo de minería de datos para determinar los factores adecuados para la selección de personal en cada una de las especialidades en las áreas críticas de la Armada.
2.3.2. Objetivos Específicos
Los objetivos específicos, basados en el objetivo principal son:
Identificar los procedimientos de selección de personal utilizados en las áreas críticas de la Armada orientado a su utilización con Minería de Datos.
Desarrollar un modelo de minería de datos para determinar los factores adecuados de selección de personal para áreas críticas de la Armada.
Para el desarrollo de estos objetivos se han considerado inicialmente las siguientes estrategias y consideraciones a ser aplicadas:
Investigar la metodología de Minería de datos y perfiles ocupacionales, esto es la base para definir posteriormente los factores a considerar para establecer los procedimientos de selección de personal relacionados con la minería de datos.
La Minería de Datos está orientada a la aplicación de soluciones a nivel de recursos humanos.
24
Durante el trabajo se seleccionará la metodología, la técnica y el modelo más adecuado para la obtención de los objetivos planteados.
2.3.3. Resultados Esperados
Con este trabajo se pretende obtener:
Un estudio para la solución en el campo informático basado en Minería de Datos, que pueda definir en forma oportuna y adecuada los patrones de selección de personal previo a los cursos de perfeccionamiento básicos en las áreas críticas de Superficie, Submarinos, Aviación Naval, Infantería de Marina e Inteligencia, para apoyar a que el personal de oficiales y/o tripulantes seleccionados a estos cursos - y que posteriormente ocuparán los puestos dentro de las áreas críticas - sea el más idóneo para dichas áreas.
Los medios de verificación para este trabajo se refieren al análisis de la información histórica del personal que labora en estas áreas para determinar los parámetros de selección previa a su aplicación, basada en los siguientes aspectos:
Los datos de salida del proceso, deben estar acordes con los perfiles más adecuados para cada especialidad, en base a los datos de entrada escogidos de la base de datos.
25
26 3.1. Contexto
En cuanto a la selección del personal de alumnos para los diferentes cursos de especialidad (conocidos como cursos de perfeccionamiento), se ha realizado un análisis de la situación en este campo y se ha observado que el actual proceso de selección de personal para las áreas críticas de la Armada (Superficie, Submarinos, Aviación Naval, Infantería de Marina e Inteligencia) presenta el inconveniente de no tener un procedimiento técnico para seleccionar al personal más idóneo que cubran las necesidades de los perfiles requeridos.
Para solucionar este inconveniente, es necesario en primer lugar, estudiar los perfiles necesarios para cubrir en forma adecuada los requerimientos de cada especialidad; en segundo lugar, investigar cuales son las características y datos existentes del personal que podrían aportar para encontrar patrones ocultos de selección; y luego, realizar el análisis respectivo a fin de determinar los mejores criterios de selección.
Para lograr esto, si bien existirían varios procedimientos y técnicas, se debe considerar que la Minería de Datos proporciona las herramientas adecuadas para realizar esta selección de criterios, y es una poderosa herramienta tanto de selección, como para encontrar factores o información no considerada inicialmente; por este motivo, se busca optimizar este proceso realizando un proyecto de Minería de Datos, considerando la utilización del método de árboles de decisión y la metodología CRISP-DM.
El primer punto a considerar es que existen una organización y perfiles para cada una de las especialidades y cuyo análisis nos dará una pauta del trabajo a realizar, por lo que se encuentra detallado en el Anexo A “ORGANIGRAMAS FUNCIONALES Y REQUISITOS PARA CADA FUNCIÓN”.
3.2. Objetivos de negocio
Si existiera una mala selección de personal se presentan varias desventajas, entre ellas tenemos que incluso una baja tasa de deserción de los cursos, causa un tremendo impacto en el proceso de la carrera del Oficial o Tripulante, afectando directamente a su carrera profesional y causando un gran problema presupuestario y administrativo en la gestión de la Armada.
Por estos motivos, utilizando la información histórica existente en la Dirección General de Recursos Humanos, se pretende lograr que esta selección de parámetros sea la más adecuada para apoyar a que los futuros oficiales y tripulantes contribuyan efectivamente y no sean un factor de riesgo para las diferentes operaciones.
27
Otra parte del problema es que se pierde el cupo que podría haber sido asignado a otra persona y el respectivo presupuesto asignado para ese cupo en ese curso, afectando de este modo a la planificación de carrera del personal de la Armada, al no contar con el personal estimado disponible en esa especialidad y ser necesario realizar reajustes u asignación de un nuevo cupo para el siguiente curso; todos estos problemas causan además demoras administrativas en los procesos educativos y de personal.
Por tanto, el Objetivo primordial del negocio, que está relacionado al objetivo del trabajo, es el siguiente:
Determinar los factores de selección de personal para cada una de las especialidades de Superficie, Submarinos, Aviación Naval, Infantería de Marina e Inteligencia, de tal forma de poder aplicarlos en una selección futura adecuada para los próximos aspirantes a los cursos en estas especialidades.
Las preguntas relacionadas a este objetivo son:
¿Cómo afecta el desempeño profesional de cada persona como parámetro de selección adecuado para los próximos cursos?
¿La información existente en la base de datos de personal de la Dirección General de Recursos Humanos es adecuada para una buena selección del personal en cuanto a los parámetros requeridos para la selección?
Otro objetivo relacionado es que los parámetros para la selección, sean coherentes con un desempeño aceptable del personal de Oficiales y Tripulantes (a futuro), tomando en cuenta las siguientes condiciones básicas establecidas en la Armada para los cursos en general:
1. Que en cada una de las materias supere el mínimo requerido (16/20) 2. Que el promedio de su desempeño sea de mínimo 16/20
3. Que no tenga problemas de conducta ni adaptación.
Otra consideración es que la evaluación durante el primer año posterior al término del curso la evaluación de desempeño de cada Oficial y Tripulante que terminan los cursos sea muy buena, es decir, supere el 18/20.
Por tanto, en relación al “negocio”, este trabajo pretende que a futuro la selección de personal para las cinco áreas críticas en la Armada del Ecuador, sea realizada de forma eficiente y sin que se presenten los problemas que aquejan actualmente a este procedimiento.
Los factores considerados para el trabajo de Minería de Datos se pueden ver en el Anexo B “REPORTE DE REQUERIMIENTOS QUE DEBE CUBRIR EL MODELO DE MINERÍA”.
3.3. Criterios de éxito de negocio
28 Tabla 7. Criterios de éxito del negocio
FACTOR CRITERIO DE ÉXITO CARACTERÍSTICAS
SELECCIÓN DE
PERSONAL
Determinar rangos verdaderos en los que la selección de personal se pueda basar para clasificar correctamente al personal en las especialidades consideradas.
Rangos de selección medibles respecto a los factores
considerados.
NOTA MÍNIMA EN CADA MATERIA
Que cada Oficial o Tripulante en curso iguale o supere el mínimo requerido en cada materia.
Superar la nota de 16/20 en cada materia; se establece un margen de error de +/- 5% NOTA MÍNIMA
EN CADA CURSO
Que cada Oficial o Tripulante en curso iguale o supere el promedio general en cada curso realizado.
Superar el promedio general de 16/20; se establece un margen de error de +/- 5%
CONDUCTA Que su conducta supere la evaluación de conducta en un nivel adecuado al buen comportamiento.
Superar la evaluación de 18/20; se establece un margen de error de +/- 5%
EVALUACIÓN DE
DESEMPEÑO
Que el promedio de la evaluación del desempeño de los Oficiales y Tripulantes que terminan los cursos, posterior a un año de labores sea adecuado.
Promedio de desempeño sea igual o superior al 18/20.
Fuente: DIGREH
3.4. Inventario de recursos
Dentro de esta estructura de la Dirección General de Recursos Humanos, tenemos el Centro de Tecnologías de la Información de la Dirección General del Talento Humano, que es la encargada de manejar la Base de Datos de todo el personal de la Armada, a cargo del Sr TNNV-IG Álvaro Armijos Ramírez.
La base de datos está fundamentada en SQL Server y el Hardware disponible en la Dirección General de Recursos Humanos se muestra en la siguiente tabla:
Tabla 8. Recursos disponibles del proyecto de minería (Servidores y aplicaciones) Servidor
No S.O. Procesador Aplicaciones
1 ESXI 02 Procesadores Intel Xeon Six Core 2.67 GHz. RAM: 12 GB
DigpergyeWeb
Sistema de evaluación 2 ESXI 02 Procesadores Intel Xeon Six Core 3.47
GHz. RAM: 12 GB
Discos: 02 Discos de 146 GB c/u
29 Servidor
No S.O. Procesador Aplicaciones
06 Discos de 500 GB c/u
3 ESXI 5.5 02 Procesadores Intel Xeon Six Core 2.67 GHz. RAM: 12 GB
Discos: 02 Discos de 146 GB c/u Discos: 06 Discos de 500 GB c/u
Elastix-digreh
4 ESXI 01 Procesador Intel Xeon Quad Core 2.66 GHz. RAM: 6 GB
Discos: 06 Discos de 250 GB c/u
Chat Virtual OTRS Otrs.Digreh Reclutamiento 5 Windows
Server 2003
02 Procesadores Intel Xeon Quad Core 3.00 GHZ. RAM: 4 GB
Discos: 08 Discos de 146 GB c/u
Sueldos
6 ESXI 01 Procesador Intel Xeon CPU E5-2630 2.3 GHz. RAM: 16 GB
Discos: 02 Discos de 300 GB c/u 03 Discos de 1 TB c/u
Antivirus2008 Digpergye02 Docuserver2008 Biométrico Dominiodigper
Fuente: CETEIN (DIGREH)
Dentro del Centro de Tecnologías de la Información, existe personal de Ingenieros de Sistemas, programadores, digitadores y secretaria, que realizan la revisión, actualización y mantenimiento de los servidores, aplicaciones y bases de datos; dentro del manejo de la Base de Datos, el encargado principal es el Ingeniero de Sistemas Alex Ramírez.
3.5. Requerimientos, presunciones, y restricciones
Los requerimientos, presunciones y restricciones se detallan en la siguiente tabla: Tabla 9. Requerimientos, presunciones y restricciones
FACTOR DETALLE
30
FACTOR DETALLE
Los datos principales deben estar agrupados y adaptados a un solo formato para ser válidos, y su resultado debe estar comprensiblemente resumido para su entendimiento y procesamiento.
PRESUNCIONES Se debe asumir que los datos del personal existentes, tanto en su base como en su desarrollo, contienen la información suficiente para poder realizar un análisis con minería de datos que arroje resultados utilizables y verificables.
El grupo objetivo para este trabajo se basa en el personal que ha terminado los cursos y luego se ha desempeñado en su área respectiva, tomando en consideración solo el tiempo que efectivamente se encontró laborando en su área durante un tiempo mayor a cinco años; con estos datos, se puede aplicar en los Oficiales y Tripulantes que se encuentran por ingresar para determinar los perfiles adecuados.
RESTRICCIÓN Existe cierta información en la base de datos que tiene carácter confidencial, por lo que el acceso a esta información debe ser coordinado o manipulada de tal forma que no sea asociada a una persona en particular sino a un perfil específico, por tanto, es importante manejar los datos para que se adapten a esta situación.
Fuente: DIGREH
3.6. Riesgos y contingencias
Existen varios riesgos asociados a este Proyecto de Minería de Datos, para esto se detallan considerando los planes de contingencia respectivos en la siguiente tabla:
Tabla 10. Riesgos y contingencias
RIESGO PLAN DE CONTINGENCIA
Acceso restringido a ciertos datos del personal que pueden ser importantes para lograr los objetivos
Se debe realizar el acercamiento con el Director General de Recursos Humanos actual para la autorización respectiva, considerando que este puesto no es fijo sino que la autoridad puede variar entre un año y dos.
Base de Datos con información insuficiente
31
RIESGO PLAN DE CONTINGENCIA
para lograr el objetivo de Minería de Datos
Sistema de base de datos de la Dirección General de Personal sea inestable debido a su antigüedad y por tanto el manejo de datos sea riesgoso.
Se considerará la implementación de una estación adicional (si es requerido) que maneje los datos en forma paralela y con las debidas seguridades para evitar daños en la base de datos principal o exportar los datos requeridos para no trabajar directamente sobre los servidores; además se considerará realizar los ajustes requeridos al sistema de hardware de la estación de servidores para esta implementación de ser necesario.
La estructura de datos sea diversa y se dificulte la compilación de datos de la base de datos principal
Se debe realizar la implementación de ajustes a los datos y metadatos para organizar la información y permitir su manipulación y exportación de forma adecuada.
Dentro de la estructura de los datos no exista los datos o tablas necesarias para un análisis adecuado de lo que se intenta implementar.
Se deberá realizar la búsqueda de la información, verificando donde se encuentran los datos importantes para exportarla e implementarla dentro de las condiciones de selección de personal.
Fuente: DIGREH
3.7. Terminología
La siguiente tabla, muestra los términos que van a servir para la comprensión del proyecto: Tabla 11. Términos y su significado
TÉRMINO SIGNIFICADO
Antigüedad Es el establecimiento del nivel de desempeño de cada militar en relación a su promoción y en relación al tiempo de servicio en relación a otras promociones.
CETEIN Acrónimo de Centro de Tecnologías de la Información
Candidato Oficial o Tripulante que debe ser considerado (o aspira) para un curso, ya sea obligatorio u opcional (debe distinguirse de la persona que va a ingresar a las escuelas de formación que se llaman “aspirantes”)
32
TÉRMINO SIGNIFICADO
Cursos de Formación
Son los cursos en donde se preparan a los nuevos ciudadanos que ingresan a las Escuelas Superior Naval y de Grumetes para formarlos como Oficiales o Tripulantes de la Armada del Ecuador
Cursos de
Perfeccionamiento
Son los cursos en donde se preparan a los Oficiales y Tripulantes ya graduados para que adquieran especialidades profesionales que les permitan desempeñarse en su carrera naval.
Encomios Son recompensas dadas al personal militar por acciones meritorios en diferentes campos
DIGREH Dirección General de Recursos Humanos de la Armada del Ecuador
Promoción Es el grupo de Oficiales o Tripulantes que se graduaron en un mismo año en las Escuelas de Formación
Reclutamiento Proceso por el cual se promueve a las personas externas y/o internas de una institución a formar parte de esta o de cursos, comisiones, trabajos etc, para integrar dicha institución en beneficio de la gestión de esta.
Sanciones Son los castigos impuestos al personal militar por el incumplimiento del Reglamento de Disciplina, que es registrado en su libreta de vida naval.
Fuente: DIGREH
3.8. Costos y beneficios
De acuerdo a la infraestructura existente en la Dirección General de Recursos Humanos, se tienen los siguientes costos estimados relacionados al proyecto:
[image:40.595.88.533.542.770.2]Los costos estimados para este proyecto se indican en la siguiente tabla: Tabla 12. Costos estimados del proyecto
No ÍTEM UNIDAD CANTI
DAD
VALOR UNITARIO
VALOR
TOTAL SITUACIÓN
1 Adecuación de los servidores
General 1 $200,00 $200,00 Se requiere adecuación de servidores para poder trabajar con los datos (solo si es requerida)
2 Implementación de una estación de trabajo
General 1 $700,00 $700,00 Computadora a instalarse de forma temporal mientras se manejan los datos (Adquisición solo si es requerida)
3 Implementación del algoritmo
33
No ÍTEM UNIDAD CANTI
DAD
VALOR UNITARIO
VALOR
TOTAL SITUACIÓN
(memoria externa, CD-RW o similar solo si es requerido)
4 Gastos asociados al proceso (gastos administrativos)
General 1 $200,00 $200,00 Si es requerido
5 Entrenamiento Curso 2 $0,00 $0,00 Cursos a ser dados al personal que administrará el sistema
6 Programa de selección
General 1 $0,00 $0,00 Implementación de la búsqueda de información sobre perfiles
TOTAL $1150,00
Fuente: DIGREH
[image:41.595.91.524.450.758.2]De acuerdo a los costos considerados para este proyecto, se establece el siguiente cuadro de costo – beneficio:
Tabla 13. Costo – Beneficio del Proyecto
No ÍTEM COSTO BENEFICIO
1 Adecuación de los servidores
$200,00 Facilidad de acceso a la información de los servidores sin afectar su funcionamiento normal.
2 Implementación de una estación de trabajo
$700,00 Poder realizar pruebas en base directamente conectado a la base de datos, al no ser necesario llevarse el equipo hasta el fin del proyecto, se aumenta la seguridad del manejo de los datos.
3 Implementación del algoritmo
$50,00 Tener la disponibilidad de manejar en forma aislada ciertos datos que sean requeridos 4 Gastos asociados al
proceso (gastos administrativos)
$200,00 Utilizar para gastos varios administrativos o no considerados.
34
No ÍTEM COSTO BENEFICIO
6 Proceso de selección $0,00 El sistema permitirá a la Armada del Ecuador, tener una evaluación adecuada del personal que van a ser seleccionados para los cursos de perfeccionamiento, evitando la deserción y mejorando su desempeño profesional.
TOTAL $1.150,00
Fuente: DIGREH
3.9. Objetivos y Criterios de éxito de minería de datos
3.9.1. Determinación de los objetivos de la minería de datos
Para lograr determinar los factores comunes que se presentan en la selección de personal para cada una de las especialidades de Superficie, Submarinos, Aviación Naval, Infantería de Marina e Inteligencia, se establece el siguiente objetivo:
Determinar los valores de los parámetros relacionados a las rutas de clasificación encontradas por el algoritmo dentro de la clasificación de las cinco especialidades consideradas, de acuerdo al método del árbol de decisión utilizado y que logre una clasificación con el menor error determinable. Derivado de este objetivo principal, se deben considerar dos divisiones para la aplicación futura de la selección:
1. Estimar en cada grupo de Oficiales y Tripulantes que van a iniciar cursos de perfeccionamiento las personas que tengan el mejor perfil para cada una de las especialidades consideradas.
2. Estimar de todo el grupo de Oficiales y Tripulantes de una determinada promoción, quienes tienen el mejor perfil para la especialidad de Inteligencia.
Esta división es necesaria ya que debe indicarse que el segundo punto está relacionado únicamente a la especialidad de inteligencia, que es la única que pueden optar todos los Oficiales y Tripulantes independiente de su formación en la Escuela Superior Naval o de Grumetes.
3.9.2. Criterios de éxito de la minería de datos
Los criterios de éxito para este proyecto son los siguientes:
1. Cuando se aplique el modelo a una población candidata que requiera su clasificación para los cursos, esta clasificación este acorde a lo previsto por el modelo en un porcentaje lo más alto posible.
35 3.10. Plan del proyecto
Tabla 14. Plan del Proyecto con recursos, entradas, salidas y dependencia
No ETAPA DURACIÓN DETALLE REQUERIDOS RECURSOS ENTRADAS SALIDAS DEPENDENCIA
1 Análisis de los datos de la Base de Datos
10 horas Revisión de la base de datos junto a los servidores de la DIGREH
Información de los tipos de datos disponibles en la BD
Todos los tipos de datos de la BD de personal
Comprensión
de los datos Instalación del sistema en el sector
2 Selección de los
datos relevantes 20 horas Escoger los tipos de datos que serán requeridos para el análisis de la Minería de Datos
Información detallada de los tipos de datos de la BD
Todos los tipos de datos de la BD de personal
Selección de
los datos Disponer de la información detallada
3 Selección inicial de herramientas y técnicas
5 horas Escoger la técnica de Minería de Datos y sus herramientas
asociadas
Disponibilidad de técnicas de Minería de Datos y sus
herramientas
Datos
seleccionados para Minería de Datos Seleccionar la técnica y herramienta más adecuada Datos seleccionados sean adecuados
4 Revisión y estructuración de los datos
relevantes
10 horas Verificar formato y compatibilidad de los datos, datos faltantes en base a la técnica seleccionada.
Acceso completo a la estructura de los datos
Datos, técnica y herramientas seleccionadas
Estado de los datos (formato, compatibilidad y faltantes) Datos seleccionados deben permitir su modificación
5 Soluciones de estructura de la base de datos
10 horas Solucionar problemas de estructura o datos faltantes en la BD
Acceso completo a la estructura de los datos
Estado de los
36
No ETAPA DURACIÓN DETALLE REQUERIDOS RECURSOS ENTRADAS SALIDAS DEPENDENCIA
6 Desarrollo del
modelo 20 horas Configurar el modelo de Minería de Datos a aplicar en la BD
Acceso completo a la estructura de los datos y aplicabilidad en sitio del modelo considerado. Datos estructurados y completos, técnica y herramientas seleccionadas Modelo inicial de Minería de Datos a aplicar en la BD
Modelo
compatible con la estructura de la BD
7 Prueba inicial de
modelo 10 horas Aplicar el modelo en la BD y observar los resultados obtenidos inicialmente hasta verificar
funcionamiento.
Acceso completo a la estructura de los datos y aplicabilidad en sitio del modelo considerado.
Modelo inicial de Minería de Datos Resultados obtenidos en la prueba inicial Modelo desarrollado debe ser aplicable a la Base de Datos en sitio.
8 Ajustes del modelo
y/o base de datos 15 horas Realizar los ajustes al modelo o la base de datos para que los resultados sean los esperados (es
necesario realizar otras pruebas hasta terminar los ajustes)
Acceso completo a la estructura de los datos y aplicabilidad en sitio del modelo considerado.
Resultados obtenidos en la prueba inicial al aplicar el modelo
Modelo y/o base de datos ajustado para optimizar resultados esperados Posibilidad de realizar varias pruebas adicionales para verificar las soluciones
9 Prueba del modelo 5 horas Se realiza la prueba definitiva del modelo con la presencia de la autoridad relacionada
Acceso completo a la estructura de los datos y aplicabilidad en sitio del modelo considerado.
37
No ETAPA DURACIÓN DETALLE REQUERIDOS RECURSOS ENTRADAS SALIDAS DEPENDENCIA
10 Evaluación del
modelo 10 horas Se realiza la evaluación de los resultados arrojados por el modelo y se comparan con los resultados esperados.
Modelo y Base de
Datos final Modelo y base de datos final Evaluación final del sistema
Modelo probado satisfactoriamente
11 Instrucción 6 horas Se imparte la instrucción de operación de la aplicación al personal encargado de manejar la Base de Datos y del sistema de selección de personal.
Documentos del sistema y evaluación disponibles
Evaluación y funciones del sistema; usuarios del sistema
Usuarios del sistema capacitados en el uso de la aplicación de Minería de Datos
Modelo probado satisfactoriamente y material de instrucción disponible