PDF superior Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

Els magatzems de dades són una col·lecció de dades organitzades per a donar suport a processos de presa de decisions. Les seves característiques són les següents: estan orientats al tema (l’estructura es divideix per temes d’interès enlloc de fer-ho segons una funcionalitat), les dades han de passar per un procés d’integració i, a més, la informació és històrica i no volàtil (per garantir que podrem veure quan ocorre un succés i que no perdrem cap dada, ni que sigui errònia).
Mostrar más

60 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

En aquest punt volem passar tota la informació heterogènia que tenim a la nostre base de dades MySQL. Per això utilitzarem el programa Pentaho Data Integration. El programa permet recuperar la informació tan de fitxers Excel, Access o csv. Anomena transformacions a cada procés que generem per realitzar la homogeneïtzació de les dades, poden incloure tan l’extracció, com la transformació i/o la càrrega final. Aquestes transformacions són guardades com fitxers XML. Poden ser guardades tan en disc, com en un catàleg en Base de dades. Hem triat la primera opció per tal de poder realitzar totes les copies de seguretat parcials (veure pla de contingència) amb més senzillesa.
Mostrar más

61 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

Construcció i explotació d'un magatzem de dades per a l'anàlisi de vendes d'una cadena de supermercats

En conseqüència el fet més probable és que per a mantenir operatiu un magatzem de dades calgui una actualització constant del model ETL i una revisió curosa dels orígens de dades. La tecnologia a usar per explotar la base de dades final i per a executar les tasques OLAP m’ha representat un problema, doncs a la màquina virtual instal·lada l’eina de Pentaho no m’ha funcionat. Finalment vaig optar per seguir amb la solució Microsoft Access, segurament menys potent i menys adaptada a les tasques d’anàlisi i reporting requerides per al projecte, però és la tecnologia a la qual tenia accés real i ha resultat funcional; per això, en el capítol 3 es descriuen mètodes d’exportació i de càrrega de dades per a MySql Workbench encara que finalment he finalitzat el projecte amb la solució de MS Access. La càrrega de dades final s’ha fet a la base de dades magatzem.accdb i he fet els informes amb aquesta aplicació. En la màquina virtual queda creada la base de dades amb Mysql i també tots els arxius de l’àrea de recopilació de dades i la base magatzem.accdb amb els informes i les dades consolidades. Línies d’evolució futura
Mostrar más

33 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'infraestructures turístiques i pernoctacions

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'infraestructures turístiques i pernoctacions

Es podria seguir la mateixa estratègia que s’ha utilitzat en la taula Any, no utilitzar una clau primària substituta, ja que hi ha molt pocs valors. Ara bé, en aquest cas l’atribut identificatiu és una cadena de text, que pot ocupar molt més espai que en el cas d’any i per consegüent farà créixer encara més el fet Infraestructures, ja prou gran per si mateix. També cal ressaltar que l’atribut establiment és susceptible a modificacions posteriors, pel que és convenient poder-lo editar sense afectar la totalitat del sistema.
Mostrar más

95 Lee mas

Construcció i explotació d'un magatzem de dades d'informació cinematogràfica

Construcció i explotació d'un magatzem de dades d'informació cinematogràfica

La taula Edició, s’ha creat una taula per el nivell de Festival i una altra per el nivell de Edició. D'aquest manera les relacions que podem tenir entre pel·lícula – festival i premi-festival són mes senzilles de mantenir. Si sols es treballa amb una taula que contingui la informació del festival i l'edició,es tindria la informació referent al nom de la pel·lícula segons el festival i el nom del premi segons el festival n-vegades . Això comportaria un consum enorme d'espai a la BD, ja que cal tenir en compte que la informació que es guardaria serien texts(en aquest cas ho definiríem com varchar per 'alliberar' espai).
Mostrar más

62 Lee mas

Construcció i explotació d'un magatzem de dades d'informació cinematogràfica

Construcció i explotació d'un magatzem de dades d'informació cinematogràfica

ƒ Nominat,  nom  del  nominat.  En  el  cas  dels  actor,  actriu  i  director  haurem  d’unificar  els  noms.  Per  exemple,  s’ha  detectat  que  apareix  algun  comentari  juntament  amb  el  nom  de  l’actor  (“(refused  the  award)”).  A  més  poden  aparèixer  dos  noms  conjuntament  en  la  mateixa  nominació  (“Warren  Beatty,  Buck Henry”). 

48 Lee mas

Construcció i explotació d'un magatzem de dades de planificació hidrològica

Construcció i explotació d'un magatzem de dades de planificació hidrològica

Partint de l’anàlisi de requeriments de la clienta “La Confederació Hidrogràfica Nord- est” s’han dissenyat els informes que seleccionen les dades que necessita la clienta, per cada un d’aquest informes s’ha dissenyat més d’una fulla, ja sigui per oferir al usuari del Data Mart poder visualitzar les dades en Hm3 o en ML, o per què aquest tingui una visió diferent de les mateixes dades però resumides amb altres condicions o paràmetres. Per tant es dona per suposat malgrat no es mostrin tots els informes, què l’usuari del Data Mart pot visualitzar qualsevol informe amb una mesura o altra.
Mostrar más

68 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

En la primera de les estrelles, Resultats Cursa, el nombre d’instàncies del fet ha de coincidir amb el nombre de registres vàlids de la fulla de resultats del llibre d’Excel que ens han donat amb les especificacions del projecte. El volum de cel·les amb el que es tractarà està al voltant de les 15.000. En aquesta taula de fets tenim 3 mesures que són enters i dos booleans. Suposem que cada enter ocupa 32 bits i el booleà només 8 (en Oracle no existeix el tipus booleà, per tant, es farà servir un char(1)), en total fan 112 bits. També s’ha de considerar els identificadors de cada dimensió que hi haurà en cada cel·la. En aquest cas hi ha 7 dimensions, suposant que com a identificador es farà servir un RowId (o clau substituta) que ocupa 4 bytes la mida és de 224 bits. En total tenim 336 bits per 15000 cel·les que implica una grandària aproximada de 615 Kbytes. La mida final sembla més que raonable per al seu tractament amb el sistema que ha d’explotar les dades.
Mostrar más

57 Lee mas

Construcció i explotació d'un magatzem de dades d'informació cinematrogràfica

Construcció i explotació d'un magatzem de dades d'informació cinematrogràfica

La recomanació per l‟ACA es que es disposi de servidors escalables per tal de donar resposta a la possible ampliacions de funcionalitat del sistema i/o l‟augment d‟usuaris que es connectin concurrentment. Per reduir la càrrega dels servidors amb els càlculs, es recomana estudiar separar els servidors en un servidor de base dades, al que es connectaria directament l‟usuari administrador IT, que contingués la base de dades i un servidor d‟aplicacions amb l‟Oracle BI Discoverer, al que es connectarien l‟administrador funcional i els usuaris. Aquest servidor hauria de ser força escalable. L‟avantatge d‟aquesta arquitectura és l‟alliberació del temps de procés dels servidors i la negativa és que la xarxa pot patir una sobrecàrrega.
Mostrar más

54 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

; 9EA D GA98% 8A !%, 9 8%< ########################################################"H ; 9EA 7 ,% '%J9 <' 8 9K !% ! !% ############################################"$ ; 9EA L G,! %?%, '% #######################################################################"D ; 9EA 6 ! 9 ?% !<9 9 8 8 I %% !% %E 9 ##################################"7

49 Lee mas

Construcció i explotació d'un magatzem de dades de planificació hidrològica

Construcció i explotació d'un magatzem de dades de planificació hidrològica

• Objectiu número 1: crear un procés automatitzat d’importació de les dades facilitades pel CHNE, que es troben en format text, al sistema de gestió de bases de dades Oracle g10. Aquest procés d’importació únicament seleccionarà la informació d’interès per realitzar les possibles consultes, amb la finalitat de no sobrecarregar el sistema, així com evitar les dades inconsistents o errònies. Per la qual cosa, serà necessari una anàlisi previ de les dades i es realitzarà la conversió d’aquells valors que no siguin apropiats per al seu tractament. El procés de càrrega s’encarregarà de la inserció de les dades procedents de la transformació, en les taules del motor de la base de dades. • Objectiu número 2: dissenyar i posar en marxa un magatzem de dades que
Mostrar más

48 Lee mas

Construcció i explotació d'un magatzem de dades d'informació cinematogràfica

Construcció i explotació d'un magatzem de dades d'informació cinematogràfica

Els Sistemes de Magatzem de dades representen un tipus de bases de dades on estan integrades les dades de diferents fonts de dades d’una organització. El Magatzem de dades esta orientat a donar suport a la presa de decisions dins una organització per lo que esta orientat a un determinat àmbit depenent de la organització. Com es veurà en aquest Projecte Final de carrera el principal objectiu d’un Sistema de Magatzem de dades es treure el màxim rendiment de la informació emmagatzemada, aquest rendiment es realitza amb l’extracció de dades per un anàlisi que ajudi a prendre decisions dins l’ entorn de la organització.
Mostrar más

51 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

Construcció i explotació d'un magatzem de dades per a l'anàlisi estadístic dels resultats del Campionat de Fórmula 1

Discoverer Administrator. Eina per definir el model de dades, els fets, les dimensions, relacions, etc. Te un interfase gràfic molt fàcil de fer servir i permet anar depurant el disseny del magatzem i fer-lo creixa en funció de noves necessitats. Permet també definir els usuaris que tindran accés a les dades i amb quin rol les podran explotar. Discoverer Desktop: Es el producte que permetrà als analistes i usuaris en general

33 Lee mas

Construcció i explotació d'un magatzem de dades

Construcció i explotació d'un magatzem de dades

tipus de dades i la llargada i precisió de manera que la conversió dels valors Varchar2 importats a IMP cap a la capa STAGE sigui possible. Els registres que no compleixin els criteris de qualitat necessaris per estar a la capa STAGE els deixarem a la capa IMP i els marcarem amb un codi d’error elevat. Així en aquesta capa tindrem una vista dels sistemes operacionals sense errors greus. Finalment l’últim pas serà moure les dades de la capa STAGE a la capa BASE i per fer-ho també farem comprovacions contra les taules de referència de manera que un valor que no tingui referència el marcarem seguint la convenció amb diferents valors (-1 si és un número, ‘-‘ si és un string, ’11.11.1111’ si és un dia etc. Amb això permetem que valors desconeguts facin el seu camí fins al final del magatzem. Això és una decisió política que permet que intenta obtenir com més registres millor a la capa BASE. Això ho fem així perquè una venda per exemple que s’hagi importat al magatzem amb un canal desconegut, no ens interessa deixar-la a STAGE ja que llavors no sortirà a les estadístiques i seria com si no s’hagués produït. Això ens provoca una distorsió molt més gran que no pas el fet de tenir una venta amb un canal
Mostrar más

50 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre trànsit rodat de vehicles

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre trànsit rodat de vehicles

Entendre el funcionament i ús de la base de dades relacional Oracle 11g, incloent-hi PL/SQL (nivell bàsic). L’aprenentatge portat a terme ens ha de permetre comparar amb altres motors de bases de dades relacionals existents al mercat, dels quals ja es tenia alguna experiència prèvia per tal de tenir un millor criteri en cas de dependre de nosaltres la tria d’aquest producte.

63 Lee mas

Construcció i explotació d'un magatzem de dades del sector turístic a Catalunya

Construcció i explotació d'un magatzem de dades del sector turístic a Catalunya

S’eliminarà la taula d’índex i es desdoblen les taules en dos parts, una per als establiments i una altra per a les places. Tot i que aquesta segregació no era necessària, es va valorar treballar amb grups més petits de dades per tal de detectar possibles errades. S’aplanen cadascuna del les dos parts agrupant els camps en una sola taula, eliminant les columnes de totals i afegint una columna al final de cada sèrie amb l’any corresponent. S’eliminen les capçaleres innecessàries, files de separació i les files de totals. Com sigui que el número de camps és diferent per a cada tipus d’establiment, tant la taula de places com la d’establiments es desdoblaran en tres noves taules temporals, una per a cada tipus, que ha de servir per a agrupar les dades en dos noves taules amb l’estructura:
Mostrar más

84 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre trànsit rodat de vehicles

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació sobre trànsit rodat de vehicles

Un magatzem de dades, o més conegut pel terme en anglès, Data Warehouse, es pot veure com una mena de diamant que s’obté després del laboriós procés d’extraure’l de la roca i tallar-lo en brut. Extrapolant el símil al context que ens ocupa, l’aportació del treball serà el d’extraure les dades, filtrar-les com ho faria un embut, i dipositar-les en un repositori d’informació per què s’analitzin amb més facilitat.

50 Lee mas

Construcció i explotació d'un magatzem de dades corporatiu per a l'organisme de Salut Pública de la Diputació de Girona

Construcció i explotació d'un magatzem de dades corporatiu per a l'organisme de Salut Pública de la Diputació de Girona

Agraeixo especialment en David Ferrando -Cap de l'àrea d'Informació per a la Gestió i la Qualitat de Dipsalut- per confiar en mi malgrat saber que no havia implementat mai un magatzem de dades amb anterioritat, en Francesc Berjano -consultor extern estretament lligat a l'àrea- per recomanar-me les eines de codi obert de Pentaho i despertar en mi la curiositat pel món del business intelligence, i en Miquel Obrador -el millor company de feina que em podia tocar-. Tots tres m'han anat enviant missatges encoratjadors i han seguit l'avenç del treball, de vegades llegint-ne els esborranys en diumenges i festius. Vull agrair també a tota la resta de companys de les diferents àrees de l'ens, que han respost a consciència les meves preguntes referents a dades i usos de les mateixes.
Mostrar más

60 Lee mas

Construcció i explotació d'un magatzem de dades de planificació hidrològica

Construcció i explotació d'un magatzem de dades de planificació hidrològica

Abans de mostrar cada uns del informes es demana a l‟usuari que seleccioni la unitat de mesura en la qual vol que es mostrin les mesures del informe. Per a aquesta finalitat s‟ha definit un paràmetre a cada informe que sol·licita aquesta dada, indicant a l‟usuari que ha de seleccionar „HM3‟ o „ML‟ com a unitats de mesura disponibles. En cas d‟indicar qualsevol altre mesura diferent de les possibles l‟informe es mostrarà en HM3 que es la unitat bàsica en la que en troben les dades a la BD.

49 Lee mas

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació immobiliària

Construcció i explotació d'un magatzem de dades per a l'anàlisi d'informació immobiliària

L’altre entorn rep el nom de DW (el nou magatzem de dades corporatiu) i contindrà les taules que s’explotaran amb l’eina SAP Business Objects per realitzar l’anàlisi dels informes. En aquest entorn ja tindrem tota la informació amb una estructura homogènia adequada al negoci del nostre client.

59 Lee mas

Show all 10000 documents...