• No se han encontrado resultados

Fusi´ on de Base de Datos

In document Nolazco y Esparta (2012) - Guia_Stata_11 (página 72-79)

Es com´un la combinaci´on de varias bases de datos. Se va a mostrar dos opera- ciones b´asicas: a˜nadir variables y a˜nadir observaciones. Los comandos asociados a estas operaciones son merge, append y joinby.

62 3.20. Fusi´on de Base de Datos

El comando merge se utiliza para a˜nadir variables, es decir, une dos bases de manera horizontal. Los ficheros de datos deben de tener una variable de identificaci´on y adem´as deben de estar ordenados por dicha variable. Este comando requiere de dos bases de datos, uno se va a denominar base master al cual se le van a˜nadir las variables y una base using la cual contiene las variable que se van a a˜nadir a la base master. Al realizar el merge se crea una variable merge de manera autom´atica que toma valores dependiendo si el registro de los datos est´a presente en una de las bases o en ambos. Cuando el valor de la variable merge es 1 quiere decir que el dato solo aparece en la base master, 2 cuando aparece en la base using y 3 cuando aparece en ambos.

. *Fusi`on de Base de Datos . //MERGE

. *Base Master . clear all

. input codigo a~no genero ingreso

codigo a~no genero ingreso 1. 1 2009 0 500 2. 1 2010 0 300 3. 1 2011 0 400 4. 2 2009 1 600 5. 2 2010 1 900 6. 2 2011 1 450 7. 3 2009 0 500 8. 3 2010 0 300 9. 3 2011 0 400 10. end . sort codigo a~no

. save base_master, replace file base_master.dta saved . *Base Using

. clear all

. input codigo a~no exper casado

codigo a~no exper casado 1. 1 2009 18 0 2. 1 2010 19 1 3. 1 2011 19.75 1 4. 2 2009 10 1 5. 2 2010 11 0 6. 2 2011 12 0 7. 3 2009 5 1 8. 3 2010 5.5 1 9. 3 2011 6.5 1 10. end . sort codigo a~no

. save base_using, replace file base_using.dta saved . *merge

. use base_master, clear . browse

. merge codigo a~no using base_using

(note: you are using old merge syntax; see [R] merge for new syntax) . browse

. tabulate _merge

_merge Freq. Percent Cum. 3 9 100.00 100.00 Total 9 100.00

. drop _merge

. save base_full, replace file base_full.dta saved

El comando append se utiliza para a˜nadir observaciones, es decir, une a dos bases de manera vertical. Aqu´ı tambi´en ser´a necesario una base master y una base using, adem´as la base originada tendr´a una forma long.

. //APPEND . *base using . clear

. input codigo a~no experiencia casado genero ingreso

codigo a~no experie~a casado genero ingreso 1. 1 2008 17.8 0 0 400 2. 2 2008 9 1 1 300 3. 3 2008 4.5 0 0 540 4. 4 2008 3 0 1 800 5. end . sort codigo a~no

. save base_append, replace file base_append.dta saved

. *base master

. use base_full, clear . sort codigo a~no . browse

. append using base_append . browse

. save base_full, replace file base_full.dta saved

El comando joinby forma todo los pares de combinaciones dentro de cada grupo a partir de dos bases de datos, una master y otra using. La base master

64 3.21. Ejercicio Propuesto

contiene variables para cada individuo clasificado por grupos y la base using contiene variables a nivel de grupos, entonces, el comando joinby colocar´a los valores de las variables seg´un al grupo que pertenece cada individuo.

. //JOINBY . *base using . clear . input a~no tc a~no tc 1. 2009 3.01 2. 2010 2.89 3. 2011 2.65 4. end . sort a~no

. save base_joinby, replace file base_joinby.dta saved

. *base master

. use base_full, clear . sort codigo a~no . browse

. joinby using base_joinby,unmatched(both) join on common variables: a~no

. browse

. tabulate _merge

_merge Freq. Percent Cum. only in master data 4 30.77 30.77 both in master and using data 9 69.23 100.00

Total 13 100.00 . drop _merge

. save base_full, replace file base_full.dta saved

3.21.

Ejercicio Propuesto

Se muestra la base de datos concerniente a la demanda de electricidad por de- partamentos para los periodos 2010-2011, en el un archivo de Excel con el nombre de “demanda electricidad“.

Venta: Es la demanda de electricidad medida en Mega Watt -hora (MW-h). Facturaci´on: Es la venta de electricidad medido en Miles de d´olares

Cliente: Son los clientes de energ´ıa el´ectrica beneficiados de este servicio.

A partir de este archivo se le pide lo siguiente:

1. Crear en el disco D: una carpeta de trabajo llamado Ejercicio1, luego guarde el archivo “demanda electricidad“en dicha carpeta.

2. En un archivo Do-File escriba una plantilla de inicio. Es decir, escriba como comentario sus datos zersonales (nombre y apellidos), limpie la base de datos, establezca una memoria de 50 megabytes, cambie la ruta de trabajo y cree una bit´acora con el nombre de Soluci´on1 y formato de texto.

3. Se pide que a partir del STATA TRANSFER convierta el archivo del Excel al archivo en “.dta“con el nombre “Dda Elect“.

4. Importar la base de datos al STATA.

5. Hacer una descripci´on general de la base de datos siguiendo los criterios que se desarrollaron en la clase (tratamiento de variables).

6. Se desea crear una nueva variable llamada precio, la cual se origine de la divisi´on entre la variable facturaci´on y ventas.Y establecer esta nueva variable en formato con solo dos decimales.

7. Se pide codificar la variable “departamento“de manera manual creando una variable llamada dep1, respetando un orden alfab´etico de los nombres de los departamentos. Adem´as, desarrollar una etiqueta a los valores para esta variable con el nombre label dep1.

8. ¿C´omo hubiese sido si codificase la variable “departamento“de manera directa creando una nueva variable llamada dep2 y una nueva etiqueta de valores llamada label dep2? .

9. A continuaci´on elimine la variable “dep1“y renombre la variable “dep1“por dep.

66 3.21. Ejercicio Propuesto

10. Genere nuevas variables que sean el logaritmo natural de la variable venta, facturaci´on, pbi, cliente y precio que se llamen ln vta, ln fact, ln pbi, ln cte y ln precio. Y a continuaci´on etiqueta las variables con las siguientes descripciones: Logaritmo de Ventas, Logaritmo de Facturacion, Logaritmo del PBI, Logaritmo de Clientes y Logaritmo de Precio.

11. Luego guarde la base de datos modificada con el nombre “Dda Elect modif.dta“. 12. Realizar un an´alisis descriptivo de las variables ln vta, ln fact, ln pbi, ln cte

y ln precio por a˜no y departamento.

13. Ahora se pide un cuadro de estad´ısticos (como la media, mediana, m´ınimo, m´aximo, desviaci´on est´andar, varianza, curtosis, asimetr´ıa) para las variables ln vta, ln fact, ln pbi, ln cte y ln precio por departamento y en forma global.

Ahora se requiere convertir la unidade de la variable facturaci´on a miles de soles. Para ello, recurra a la p´agina del BCRP y descarge la serie del Tipo de Cambio (TC) Bancario Nuevo Sol/D´olar-Venta (S/. por US$) mensual, para el mismo periodo de an´alisis (2010-2011). Luego realice los siguientes procedimientos:

1. Transforme la abse de datos del Tipo de Cambio de la manera adecuada para ser importada al STATA. Sugerencia: Genere una columna de variable numerica para los a˜nos y otra para los meses de forma independiente. 2. Calcule el Tipo de Cambio Promedio trimestral usando el comando collapse.

Sugerencia: Genere una variable que permita identificar a que trimestre per- tence cada mes, por ejemplo: el mes 1,2 y 3 ser´ıan igual a 1 por ser el primer trimestre; los meses 4,5 y 6 ser´ıan 2 por ser el segundo trimestre y as´ı suce- sivamente. Luego, crear una variable identificadora con la variable a˜no y trimestre.

3. Fusione la base de datos de la demanda de electricidad y del tipo de cambio, usando dos m´etodos diferentes.

Gr´aficos en STATA

4.1.

Introducci´on a STATA GRAPH

STATA presenta una amplia variedad de gr´aficos, la cual abarca figuras como: matrices de ploteos, histogramas, ´areas, l´ıneas, caja y bigote, etc. Comenzaremos demostrando siete tipos de gr´aficos:

histogram : Histogramas

graph twoway : Scatterplot, l´ıneas, y otros entre dos variables. graph matrix : Matrices de Scatterplots.

graph box : Gr´aficas de caja y bigotes. graph bar : Gr´aficas de barras

graph dot : Gr´aficas de puntos. graph pie : Gr´aficas de pastel o pie.

Para cada uno de estos gr´aficos existen muchas opciones 1.

1Para observa otras tipos de gr´aficos y comandos relacionados a estos, se recomienda tipear

en la venta de comandos help graph other.

68 4.2. Tipos de Gr´aficos

In document Nolazco y Esparta (2012) - Guia_Stata_11 (página 72-79)