PDF superior Construcció i explotació d'un magatzem de dades per a l'anàlisi d'infraestructures turístiques i pernoctacions

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'infraestructures turístiques i pernoctacions

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'infraestructures turístiques i pernoctacions

Aquest document correspon a la memòria del treball final de grau enfocat al desenvolupament d’un projecte de Datawarehouse per una empresa del sector turístic que vol fer un estudi a Catalunya per determinar la continuïtat de la seva xarxa d’establiments, coneixent millor els criteris decisoris dels seus clients i els motius de l’evolució negativa de pernoctacions dels darrers anys. El treball es centra en la creació i exploració d’un Datawarehouse, incloent la seva arquitectura bàsica – processos de tractament i entrada de dades, el seu emmagatzemament i extracció del coneixement.
Mostrar más

95 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre trànsit rodat de vehicles

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre trànsit rodat de vehicles

Aquest document defineix la construcció i explotació d’un magatzem de dades per a la Fundació d’Estudis per a la Conducció Responsable. Aquesta feina és el resultat del treball de fi de carrera dels estudis d’Enginyeria Tècnica d’Informàtica de Gestió de la Universitat Oberta de Catalunya. L’objectiu del projecte és homogeneïtzar la informació que rep la Fundació, des de diverses fonts i en diferents formats, consolidar-la en un únic magatzem de dades, i habilitar eines que facilitin la seva explotació i anàlisi. La consecució d’aquestes fites és determinant per què la direcció conegui l’evolució del trànsit rodat de vehicles a Catalunya, i minimitzi el riscos en cas de qualsevol presa de decisions.
Mostrar más

50 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

En els darrers anys les organitzacions han anat agafant consciència de la importància de la gestió de la seva informació. D’aquesta necessitat d’organitzar les pròpies dades d’una forma coherent i eficient per al seu anàlisi sorgeixen els magatzems de dades. El projecte “Construcció i explotació d’un magatzem de dades per a l’anàlisi estadístic dels resultats del Campionat de Fórmula 1” s’emmarca dins aquest context i te com a objectiu el disseny d’un magatzem de dades per a cobrir les necessitats del Institut Català d’Esports de Motor (ICEM) en la gestió de les seves dades referents a la Fórmula 1. En aquest projecte s’han executat les diferents fases necessàries per a la creació d’un nou magatzem. En primer lloc s’ha fet l’anàlisi de requeriments i de les dades disponibles. A continuació s’ha fet el disseny i la implementació física del magatzem de dades. Seguidament s’ha procedit amb l’extracció, transformació i càrrega de dades originals (ETL) i per finalitzar s’han creat els informes. Com a resultat s’han obtingut una sèrie d’informes per a ser consumits de manera immediata pels usuaris del ICEM. Aquests informes han de permetre l’anàlisi de les dades d’una forma senzilla i àgil. A més s’ha implementat un sistema d’actualització automàtic de les dades que per al manteniment de la informació del magatzem.
Mostrar más

57 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

Analitzant les dades dels productes, veiem que la clau que identifica al producte és el codi de barres, i que d’un any a un altre no canvien els preus, tan sols el tipus de IVA. Però hem de tenir en compte que un any pot haver un canvi de tarifes. De totes maneres, en la carrega temporal no farem aquestes operacions. Però si afegirem un camp clau per la taula de productes. En el següent punt s’explica amb més detall el perquè s’han afegit aquestes claus.

61 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

Un cop arribats a aquest punt, podem fer un breu recordatori a nivell personal de tots aquells passos que s'han tractat durant el TFC i de la feina realitzada durant el semestre. He après a fer un estudi preliminar de les dades del qual he partit per a fer el model conceptual, el disseny lògic i el disseny físic. Posteriorment, he estudiat els processos ETL amb els quals he carregat les dades pertinents a taules temporals que m'ha servit per a crear el magatzem de dades. Per últim, he treballat amb eines Business Intelligence que m'ha servit per a treure els informes finals, demanats en l'enunciat del TFC. Ha sigut una feina dura però molt motivadora, en la que he pogut aprendre sobre el sistema de gestió de base de dades Mysql, l'entorn Pentaho i, especialment, el llenguatge SQL.
Mostrar más

60 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

En conseqüència el fet més probable és que per a mantenir operatiu un magatzem de dades calgui una actualització constant del model ETL i una revisió curosa dels orígens de dades. La tecnologia a usar per explotar la base de dades final i per a executar les tasques OLAP m’ha representat un problema, doncs a la màquina virtual instal·lada l’eina de Pentaho no m’ha funcionat. Finalment vaig optar per seguir amb la solució Microsoft Access, segurament menys potent i menys adaptada a les tasques d’anàlisi i reporting requerides per al projecte, però és la tecnologia a la qual tenia accés real i ha resultat funcional; per això, en el capítol 3 es descriuen mètodes d’exportació i de càrrega de dades per a MySql Workbench encara que finalment he finalitzat el projecte amb la solució de MS Access. La càrrega de dades final s’ha fet a la base de dades magatzem.accdb i he fet els informes amb aquesta aplicació. En la màquina virtual queda creada la base de dades amb Mysql i també tots els arxius de l’àrea de recopilació de dades i la base magatzem.accdb amb els informes i les dades consolidades. Línies d’evolució futura
Mostrar más

33 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre trànsit rodat de vehicles

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre trànsit rodat de vehicles

- En el primer plantejament que es va fer d’aquest projecte, no s’havia considerat la possibilitat de construir un Operational Data Store , però després d’analitzar-lo amb més deteniment arribem a la conclusió de què és recomanable disposar d’un magatzem intermediari amb dades normalitzades no accessibles des del sistema transaccional, però sí per algunes aplicacions que requereixen d’informació normalitzada i consultable (ex: informes).

63 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre allotjaments turístics

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre allotjaments turístics

Sota la nova estructura de dades que s'ha modificat al curs del projecte s'ha fet una nova estimació del volum de dades que el sistema ha d'emmagatzemar, principalment per la taula dels fets ja que és l'única que s'actualitza i la que concentra la major part de la informació. El volum total de la taula del fet després de la càrrega és d'uns 153.000 registres. Respecte a la mida del registre a emmagatzemar a la taula del Fet es compten 4 bytes per cada camp, que per 9 camps (si s'inclou la clau de la pròpia taula) són 36 bytes per cada registre. Per tant, la mida inicial de la taula és de 153000 * 36 = 5.508.000 bytes = 5,25 Mbytes. Per cada any nou que es carregui a la taula del fet, ja que les magnituds de les diverses dimensions considerades no canviarien a menys que s'introduïssin noves tipologies d'establiments, seria de 22.180 registres nous per cada any, que ocuparien 22180 * 36 = 0,76 Mbytes. Es pot concloure que la nova estimació, tot i haver augmentat considerablement de mida, segueix sent assumible.
Mostrar más

51 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi del sistema de prestacions socials

Construcció i explotació d'un magatzem de dades per a l'anàlisi del sistema de prestacions socials

A la carpeta “Informes estatales” tenim l’informe “Proyección datos trabajadores estatal” que respon a la demanda del client quan demana una projecció d’indicadors treballadors respecte perceptors no actius, en aquest informe veiem les dades conjuntes de totes les comunitats autònomes, tenim els tres gràfics que aporten una visió des de tots els angles, i al gràfic de abaix es poden observar les línies de tendència que ens aporten una informació molt valuosa de cap a on van encaminades les dades.

50 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre allotjaments turístics

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre allotjaments turístics

El fct_equipament es solo una relación de claves foráneas y los datos que no son hechos nom,cp,telefon,longitud,latitud se han colocado en una tabla separada llamada deg_equipament Despu[r]

83 Lee mas

Construcció i explotació
d'un magatzem de dades per a l'anàlisi
d'informació immobiliària

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació immobiliària

En aquest projecte el que s’ha fet és incloure en el magatzem de dades la informació proporcionada per l’empresa immobiliària i que abastava de gener de 2006 a gener de 2008. No obstant això, per tal que l’explotació del magatzem de dades proporcioni realment informació útil i aprofitable de cara a la presa de decisions, és imprescindible actualitzar aquestes dades i proporcionar al client la formació necessària perquè pugui realitzar aquesta actualització de forma periòdica. Les actualitzacions són possible amb unes mínimes modificacions de l’script de càrrega de dades i d’algunes taules de la base de dades com ara la taula TEMPS on s’hauria d’afegir nous mesos i les taules de zones on, en cas de ser necessari, s’haurien d’afegir noves províncies, comunitats autònomes i fins i tot països, preveient que l’empresa expandeixi la seva oferta d’immobles a un àmbit geogràfic més ampli.
Mostrar más

59 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació immobiliària

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació immobiliària

El primer pas es carregar en una taula els 25 mesos que venen informats de l’origen, seguidament s’ha d’extraure tota la informació de la capçalera en relació a les zones i assignar aquest detall a cada immoble. Després aquestes dades es netegen per fer-les homogènies i finalment es pivota la informació de preus ja que en origen els mesos venen informats a nivell de columna.

59 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

; 9EA D GA98% 8A !%, 9 8%< ########################################################"H ; 9EA 7 ,% '%J9 <' 8 9K !% ! !% ############################################"$ ; 9EA L G,! %?%, '% #######################################################################"D ; 9EA 6 ! 9 ?% !<9 9 8 8 I %% !% %E 9 ##################################"7

49 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

Discoverer Administrator. Eina per definir el model de dades, els fets, les dimensions, relacions, etc. Te un interfase gràfic molt fàcil de fer servir i permet anar depurant el disseny del magatzem i fer-lo creixa en funció de noves necessitats. Permet també definir els usuaris que tindran accés a les dades i amb quin rol les podran explotar. Discoverer Desktop: Es el producte que permetrà als analistes i usuaris en general

33 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació immobiliària

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació immobiliària

Per trobar el pis-tipus espanyol i andorrà es pot fer de diferents maneres. La primera més visual seria fer els gràfics de cada variable descriptiva de l’immoble i aquell valor més comú o que es repeteixi més seria el que interessaria. En estadística aquest valor se’l coneix com la moda. Una altra forma de trobar-ho seria fent promig de totes aquestes variables, però a l’hora d’interpretar pot ser una mica confós dir que per exemple el pis tipus a Barcelona te 3,4 habitacions. Altres opcions també passarien per triar altres estadístics com per exemple, la mediana, la mitja ponderada, la desviació estàndard que també ens ajustarien altres pisos models. També es podia fer algun tipus d’anàlisi estadístic multivariant (anàlisis de correspondències múltiples, o clúster...)
Mostrar más

56 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació immobiliària

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació immobiliària

ZONA: Codi format per 6 blocs de 2 o 3 dígits per a definir amb exactitud la zona. Els primers dígits és província, també hi podem tenir definits, comarca, població, zona, barri. Aquest és un punt crític a analitzar, ja que específicament el client ens demana agrupació en 4 grups territorials, amb la qual cosa serà objecte d’estudi la seva possible concatenació. També com a dada, no tots els 6 blocs contenen informació, pot estar amb valor XX o XXX indicant que no hi ha informació. També s’haurà d’analitzar errors i que no hi hagi registres equivocats en zones que no toquen.
Mostrar más

43 Lee mas

Construcció i explotació d'un magatzem de dades corporatiu

Construcció i explotació d'un magatzem de dades corporatiu

El projecte suposa el disseny i construcció de diferents parts d’un procés: la construcció del magatzem corporatiu i els magatzems departamentals, el procés d’importació de dades de les bases de dades transaccionals de producció al magatzem departamental, el procés de tractament de dades i traspàs del magatzem corporatiu als diferents magatzems departamentals i finalment, la creació d’un entorn de consulta de les dades per part de l’usuari final que no requereixi coneixements específics sobre bases de dades.
Mostrar más

45 Lee mas

Construcció i explotació d'un magatzem de dades

Construcció i explotació d'un magatzem de dades

Per sota de la capa BASE que és la que estem modelant hi haurà dues capes més. La capa STAGE i la capa IMP que a nivell físic les modelarem amb Schema propi a la base de dades. Les dades del sistemes operatius s’importaran 1:1 a la capa IMP on tenim una imatge exacte de la interfície d’import del magatzem de dades. Per convenció no deixarem entrar cap dada al magatzem sinó és a través d’aquesta capa. En aquesta capa totes les taules modelades tenen els camps del tipus Varchar2 la grandària del qual s’adapta al camp que volem importar i es sobredimensiona de manera que puguem importar els registres fins a aquesta capa gairebé sempre. En aquesta capa tampoc tenim cap constraint implementat ni cap relació entre les taules.
Mostrar más

50 Lee mas

Construcció i explotació d'un magatzem de dades d'informació cinematogràfica

Construcció i explotació d'un magatzem de dades d'informació cinematogràfica

Els Sistemes de Magatzem de dades representen un tipus de bases de dades on estan integrades les dades de diferents fonts de dades d’una organització. El Magatzem de dades esta orientat a donar suport a la presa de decisions dins una organització per lo que esta orientat a un determinat àmbit depenent de la organització. Com es veurà en aquest Projecte Final de carrera el principal objectiu d’un Sistema de Magatzem de dades es treure el màxim rendiment de la informació emmagatzemada, aquest rendiment es realitza amb l’extracció de dades per un anàlisi que ajudi a prendre decisions dins l’ entorn de la organització.
Mostrar más

51 Lee mas

Construcció i explotació d'un magatzem de dades del sector turístic a Catalunya

Construcció i explotació d'un magatzem de dades del sector turístic a Catalunya

S’eliminarà la taula d’índex i es desdoblen les taules en dos parts, una per als establiments i una altra per a les places. Tot i que aquesta segregació no era necessària, es va valorar treballar amb grups més petits de dades per tal de detectar possibles errades. S’aplanen cadascuna del les dos parts agrupant els camps en una sola taula, eliminant les columnes de totals i afegint una columna al final de cada sèrie amb l’any corresponent. S’eliminen les capçaleres innecessàries, files de separació i les files de totals. Com sigui que el número de camps és diferent per a cada tipus d’establiment, tant la taula de places com la d’establiments es desdoblaran en tres noves taules temporals, una per a cada tipus, que ha de servir per a agrupar les dades en dos noves taules amb l’estructura:
Mostrar más

84 Lee mas

Show all 10000 documents...