• No se han encontrado resultados

Aprobación del modelo Proceso de revisión

In document Introducción de la Propuesta (página 105-115)

14. Aparece el cuadro de dialogo de Finalización del asistente, donde se escribe el nombre de informe, clic en Finalizar.

5.14.5.2 Aprobación del modelo Proceso de revisión

En este ítem es necesario revisar de forma minuciosa si algún elemento o actividad fueron pasados por alto en el proceso del proyecto de Data Mining. En pocas palabras consiste en una revisión de calidad realizada no sobre los datos, sino sobre el proceso que generó los resultados del Data Mining.

Entre las actividades que se llevaron a cabo para obtener los resultados se encuentran:

- Identificar posibles fallas en el proceso de Data Mining

- Identificar pasos del proceso de Data Mining que podrían conducir a error

- Identificar posibles acciones alternativas en el proceso de Data Mining.

Errores y Soluciones al momento de crear un Proyecto de Data Mining en SQL Server Business Intelligence Development Studio

Error N° 1. En la Vista de Origen de Datos

Error: Las relación entre las tablas no están de uno a muchos entre la tabla que se va utilizar como caso y las anidadas.

160

Figura 70. Error en Vista de Origen de Datos

Solución: Modificar las relaciones entre las tablas, de tal manera, que estas queden en cardinalidad de uno a muchos.

161

162 Error N° 2. Especificación de tipos de tablas en la Estructura de Minería de Datos

Error: La tabla seleccionada como anidada no tiene relación con la tabla caso con una cardinalidad de uno a muchos.

Figura 72. Error de Relación de Varios a Uno con la Tabla Casos

Solución: En la Vista de Origen de Datos relacionar la tabla anidada con la tabla caso.

163 Error N° 3. En la Especificación de los Datos de Aprendizaje

Error: No se especifican las llaves primarias, los campos de entrada ni los campos que se desean predecir.

Figura 73. Especificación de Columnas para el Análisis

Solución: Colocar de cada tabla que se ha seleccionado una campo con llave primaria, colocar los campos que se utilizarán como entrada y los que se van a predecir.

164 5.15 Beneficios Claves del Uso de Data Mining

1. El Uso de Data Mining contribuye en gran manera a la toma de decisiones tácticas y estratégicas, proporcionando un sentido automatizado para identificar información clave y extracción de conocimiento desde grandes volúmenes de datos generados por procesos tradicionales.

2. La gran abundancia de datos o su deficiente estructura puede hacer muy difícil extraer información útil, es por eso que el Data Mining es la extracción de forma automática de información relevante, útil y no evidente contenida en dichos datos. Existen tres razones por las que el Data Mining es una realidad en nuestros días:

- Avances tecnológicos en almacenamiento masivo de datos

- Existencia de nuevos algoritmos para extraer información en forma eficiente.

- Y la última razón y más importante de todas es la existencia de herramientas automáticas que no hacen necesario el ser un experto en estadística, redes neuronales, clustering u otros algoritmos matemáticos para convertirse en un Minero de Datos.

3. Cualquier organización o empresa en posesión de bases de datos de calidad y tamaño suficiente puede emplear Data Mining para generar nuevas oportunidades de negocio.

4. Data Mining posee capacidad para proporcionar:

165 - Predicción automática de tendencias. Como por ejemplo: predicción de ventas en el futuro.

- Descubrimiento automático de comportamientos desconocidos anteriormente. Las herramientas de Data Mining permiten ver los datos desde una perspectiva distinta y por ello permite descubrir nuevas relaciones entre ellos.

5. Permite a los usuarios dar prioridad a ciertas decisiones y acciones mostrando factores o elementos que tienen mayor relevancia.

6. Proporciona poderes de decisión a los usuarios del negocio que mejor entienden el problema y el entorno, y son capaces de aplicar su propia creatividad y su propio criterio ayudándose del Data Mining para tomar decisiones más acertadas y obtener mejores resultados.

7. En un contexto de objetivos en el negocio, permite el Data Mining a organizaciones o empresas sin tener en cuenta la industria o el tamaño, obtener soluciones que impactan en los resultados finales.

166 5.16 Puntos Aclaratorios del Proyecto

1. Cierta cantidad de Información almacenada en la Base de Datos es de valor ficticia, dado el caso que la institución gubernamental en donde se realizó el proyecto de tesis no tiene datos históricos, relevantes y de asociación; los cuales son necesarios para la obtención de resultados óptimos en la ejecución del proyecto de Data Mining.

2. El campo Potencial de la Tabla Empresa, se propone con atributos de 0 y 1 definiendo a 0 como la empresa que no puede llegar a tener potencial y 1 como la empresa que si puede llegar a tener potencial. Dicho campo es como tipo de referencia para poder verificar los resultados obtenidos junto con los otros datos y así obtener un análisis favorable a la solución del proyecto.

3. Los campos (UserCrea, FechaCrea, UserModif, FechaModif), que se han colocado en cada tabla de la base de datos, se han denominado como campos de auditoría, en donde, se crean estos en cada tabla para un fácil manejo de cada registro dentro de la base.

4. La Base de Datos que se propone (BD_Data Minig) no es portable, por lo cual no existe un archivo ejecutable que realice una instalación o algo similar, este proyecto se ejecuta desde la plataforma del Visual Studio junto con el motor del servidor del SQL Server.

5. Definición de Potencial de Desarrollo de una Empresa.

En términos generales, el potencial de desarrollo, se refiere a la capacidad de una empresa para crecer, formarse y fortalecerse dentro del mercado.

167 Al construir el modelo de predicción de potencial de desarrollo, es preciso conocer las razones de que una empresa no llegue a obtener un potencial de desarrollo dentro de un determinado periodo de tiempo. Es preciso, por lo tanto llegar a una definición de que se entiende por una empresa no llegue a alcanzar potencial de desarrollo. Para llegar a esta definición basta simplemente identificar aquellas condiciones en las cuales una empresa puede clasificarse como “Sin Potencial de Desarrollo”.

Dado que el potencial de desarrollo es la capacidad de una empresa para crecer, una empresa “sin potencial de desarrollo” será aquella que sin lugar a dudas no cumpla con alguna de las condiciones siguientes:

1- No haya asistido a todas las capacitaciones. 2- No haya asistido a las asesorías.

3- No haya finalizado exitosamente los programas de intervención. 4- Sus ventas no alcancen un porcentaje satisfactorio.

168 5.17 Conclusiones

 El desarrollo de las Bases de Datos, así como el diseño y creación de Sistemas de Información han generado de información que solo puede ser justificada si se utiliza como una fuente para mejorar el proceso en el que es generada.

 Se define el Data Mining como un proceso de descubrimiento de información en donde, se explora los datos almacenados en una base procesando así, información no trivial para los usuarios; sirviendo esta como herramienta adicional informática a un sistema gerencial.

 El éxito de un Proyecto de Data Mining consiste en varios parámetros, entre los cuales se mencionan la correcta definición de objetivos tanto del negocio como del mismo Data Mining, la correcta selección de variables y una acertada interpretación de resultados.

 La ejecución de un proyecto de Data Mining consta de 5 etapas, entre las cuales están: Comprensión del negocio, Comprensión de los datos, Preparación de los datos, Modelado y Evaluación.

 La propuesta del trabajo de tesis, se delimita como una guía detallada de ejecución de un proyecto de Data Mining de nivel básico, utilizando como gestor de base de datos Microsoft SQL Server 2008 y como plataforma de desarrollo SQL Server Business Intelligence Development Studio.

169 5.18 Recomendaciones

 Utilizar un gestor de base de datos actualizado para el almacenamiento de la información. Este almacenamiento debe de ser de forma ordenada como datos verídicos, no repetidos y con un nivel gerencial acorde a la institución.

 Explorar los datos detenidamente a partir de los resultados obtenidos, después de la ejecución del proyecto de Data Mining; acertando una concordancia con las variables seleccionadas y los datos almacenados en la base.

 Antes de iniciar la ejecución de un proyecto tomar en cuenta que se deben crear objetivos tanto de negocio o empresa en la que se va a implantar como del mismo Data Mining, demostrando así, objetivos predictivos, de donde se podrá tener un análisis más acertado de lo que se pretende obtener con los resultados.

 En la creación de la estructura del Data Mining tomar en cuenta que la selección de variables se debe de hacer de forma cuidadosa y ordenada, ya que esta es la clave para la obtención de resultados óptimos.

 Las etapas que se detallan en el trabajo son basados en la metodología CRISP-DM, recomendando utilizar metodología ya que es nivel básico para el análisis previo para la ejecución de Data Mining,

 Tomar este trabajo de tesis como guía para obtener el conocimiento de teorías y prácticas de metodologías gerenciales que pueden implantarse en una empresa.

In document Introducción de la Propuesta (página 105-115)

Documento similar