C REANDO NUEVA TABLA DE DATOS 3.2.A BRIENDO UNA TABLA DE DATOS EXISTENTE

22  15  Descargar (0)

Texto completo

(1)

1 | P á g i n a

Guía de uso del software “InfoStat”

Contenido:

1.

INTRODUCCIÓN ... 2

2.

TRABAJANDO CON DATOS ... 2

3.

CREANDO O ABRIENDO TABLA DE DATOS ... 3

3.1.

C

REANDO NUEVA TABLA DE DATOS

... 3

3.2.

A

BRIENDO UNA TABLA DE DATOS EXISTENTE

... 6

Archivos IDB2 ... 6

Archivos Excel (.xls) ... 7

Archivos .csv (valores separados por comas) o .txt (texto) ... 8

4.

MEDIDAS RESUMEN ... 9

5.

GRÁFICOS ... 12

5.1.

D

IAGRAMA DE DISPERSIÓN

... 12

5.2.

G

RÁFICO DE CAJAS

(B

OX

-P

LOT

) ... 14

5.3.

Q-Q

P

LOT

... 16

5.4.

H

ISTOGRAMAS

... 19

(2)

2 | P á g i n a

1.

Introducción

Durante la asignatura utilizaremos como herramienta de trabajo para el análisis estadístico el software “InfoStat”. El mismo cubre tanto las necesidades elementales para la obtención de estadísticas descriptivas y gráficos para el análisis exploratorio, como métodos avanzados de modelación estadística y análisis multivariado.

A continuación, dejamos a disposición el enlace a la página web del software, desde allí pueden descargar y activar una versión estudiantil del mismo:

http://www.infostat.com.ar/

Este programa será sumamente útil en cualquier situación académica o laboral en el que se deba trabajar con datos para llegar a conclusiones o toma de decisiones. Alentamos el uso del mismo para que lo tengan presente como una herramienta en la vida profesional.

Como aclaración antes de comenzar, la presente guía no pretende ser un manual de usuario del software, sino solo un documento con las opciones que más utilizamos durante la asignatura, por lo que no se entrará en detalle sobre todas las opciones que mostraremos. Aconsejamos la lectura del manual de usuario y la investigación de opciones que ofrece el software para sacar un mayor provecho del mismo.

2.

Trabajando con datos

En distintas situaciones, ya sean académicas, laborales, personales, etcétera, debemos trabajar con datos para poder llegar a conclusiones o tomar decisiones, pero, ¿qué significa “trabajar con datos”?

Como se trabajó durante la primera parte de la asignatura, existen lo que llamamos “variables aleatorias”. En la práctica, al realizar experiencias, estas variables comienzan a tomar valores observables. Por ejemplo, si me interesa observar la variable “Peso de una persona”, voy a pesar a n personas y registrar el peso de cada una. Al finalizar la tarea, obtengo lo que llamamos una “tabla de datos”, que no es más que el registro del peso de cada persona evaluada. Si registramos 5 personas, nos quedaría algo como esto:

Peso de la persona (Kg) 70

85 96 62 84

(3)

3 | P á g i n a

Peso de la persona (Kg) Altura de la persona

(Metros)

70 1.60

85 1.62

96 1.70

62 1.58

84 1.65

Con estos ejemplos queremos demostrar que, al observar datos reales de una muestra, no solo podemos estar enfocados en una única variable, sino en distintas al mismo tiempo. La forma de organizar los datos, generalmente, será en formato de tabla, siendo cada columna una variable distinta.

3.

Creando o abriendo tabla de datos

Lo primero que debemos saber hacer con el software es ingresar datos, o trabajar con una tabla de datos ya creada.

3.1.

Creando nueva tabla de datos

En primer lugar, veamos cómo podemos ingresar datos manualmente en el software, para lo cual debemos aprender cómo crear una nueva tabla de datos.

(4)

4 | P á g i n a

Así, el software nos brinda un modelo genérico con dos columnas para poder comenzar a ingresar nuestros datos.

Si queremos ingresar datos en las filas, simplemente ingresamos los valores y presionamos ENTER.

(5)

5 | P á g i n a

 Podemos presionar el clic derecho nueva columna, como se muestra a continuación:

Otra opción es hacerlo desde la pestaña Datos Acciones sobre columnas Nueva columna,

(6)

6 | P á g i n a

3.2.

Abriendo una tabla de datos existente

Si ya contamos con una tabla de datos con la cual trabajar, podemos abrirla desde Archivo Abrir,

como mostramos a continuación:

Exploramos, encontramos el archivo que queremos abrir (generalmente serán archivos Excel, CSV, textoo

archivos con extensión IDB2) y lo seleccionamos. Así, nos abrirá la tabla de datos de dicho archivo.

A continuación, mostraremos particularidades sobre cada tipo de archivo a abrir.

(7)

7 | P á g i n a

El archivo señalado (“autos”, con el icono violeta) corresponde a un archivo con extensión .IDB2, el

formato de archivos de datos que utiliza Infostat. Al abrirlo, nos mostrará la tabla de datos correspondiente, como muestra la siguiente imagen:

Archivos Excel (.xls)

Al querer abrir un archivo de hoja de cálculo Excel (con extensión .xls), el software nos mostrará la

siguiente ventana, en la cual podremos seleccionar que hoja importar y si trataremos la primera fila como nombre de variables:

(8)

8 | P á g i n a

Archivos .csv (valores separados por comas) o .txt (texto)

En estos casos, el software nos mostrará una ventana distinta, en la cual podremos elegir que símbolo utiliza el archivo como separador de datos, eliminar filas vacías, etcétera:

Luego, el software nos mostrará la tabla de datos correspondiente.

(9)

9 | P á g i n a

4.

Medidas resumen

Uno de los procedimientos que haremos habitualmente ante cualquier conjunto de datos es la obtención

de medidas resumen, lo que se suele llamar “explorar los datos”. Hablando en términos de la

asignatura, con las medidas resumen estamos calculando los valores estimados de los distintos

parámetros poblacionales, por ejemplo:

• Promedio o media muestral: 𝑋̅

• Varianza estimada o muestral: 𝑆𝑛−12

• Desvío estimado o muestral: 𝑆𝑛−1

Para hacer esto, una vez tengamos los datos disponibles, debemos obtener las medidas resumen

desde Estadísticas Medidas resumen, como mostramos a continuación:

(10)

10 | P á g i n a

Supongamos que queremos obtener estimadores de los parámetros de la variable “Consumo”, al

seleccionarla y continuar, el software nos permitirá seleccionar las medidas que deseamos obtener:

Aclaración: Infostat, como muchos otros softwares, maneja cierta nomenclatura para los valores

(11)

11 | P á g i n a

Media: Lo que el software llama “media”, al observarse en una muestra, en verdad se trata

del“promedio” 𝑋̅.

D.E.: Se trata del desvío estimado o desvío muestral 𝑆𝑛−1.

Var(n-1): Se trata de la varianza estimada o varianza muestral 𝑆𝑛−12

Mínimo: Se trata del valor más pequeño observado en la muestra.

Máximo: Se trata del valor más grande observado en la muestra.

Se deja para la lectura del estudiante las restantes medidas resumen.

Por default, Infostat tendrá seleccionadas n, media, desvío (D.E.), mínimo y máximo. Podremos

seleccionar las que queramos obtener, por ejemplo, agregamos Mediana, cuartíl 1 y cuartíl 2:

(12)

12 | P á g i n a

5.

Gráficos

Además de las medidas resumen, otro de los procedimientos que utilizaremos a menudo en el ámbito académico y/o laboral será el de graficar los datos con los que estemos trabajando. Los gráficos constituyen un pilar fundamental en cualquier informe o reporte estadístico. Permiten visualizar fácilmente una situación determinada, valores particulares de una variable, como se relacionan dos variables, donde se encuentra la mayor cantidad de valores de una variable, etcétera.

A continuación, veremos cómo realizar una serie de gráficos que nos resultaran de suma utilidad.

Para cualquier gráfico, debemos acceder desde Gráficos <Gráfico que deseemos realizar>, como se muestra a continuación:

Aclaración: Se deja para lectura del estudiante la teoría respectiva a cada gráfico enunciado a

continuación.

5.1.

Diagrama de dispersión

Desde Gráficos seleccionamos Diagrama de dispersión. Esto hará aparecer una ventana para elegir

(13)

13 | P á g i n a

(14)

14 | P á g i n a

5.2.

Gráfico de cajas (Box-Plot)

De la misma manera que antes, desde Gráficos seleccionamos Gráfico de cajas (Box-Plot): Esto hará aparecer una ventana para elegir la variable/s a graficar.

En este caso podemos seleccionar las variables a graficar según una variable que sirva como criterio de clasificación. Veamos dos ejemplos:

(15)

15 | P á g i n a

(16)

16 | P á g i n a

En este caso se generan tres Box-Plot, los tres de la variable consumo, pero clasificada según la

variable cilindrada. Esto resulta muy útil a la hora de realizar comparaciones sobre el

comportamiento de una variable según determinada clasificación.

5.3.

Q-Q Plot

Desde Gráficos seleccionamos Q-Q Plot, esto hará aparecer la siguiente ventana donde podremos

elegir las variables a probar:

(17)

17 | P á g i n a

En esta ventana deberemos elegir la distribución contra la cual se desea probar la variable. En este ejemplo, probaremos contra la distribución Normal:

Así, el software nos muestra el gráfico Q-Q Plot según los parámetros establecidos.

(18)

18 | P á g i n a

(19)

19 | P á g i n a

Así, el software nos brinda una serie de gráficos distintos, indicando cada uno a qué partición pertenece. Esto nos será sumamente útil a la hora de comparar el comportamiento de una variable respecto de otras.

5.4.

Histogramas

Desde Gráficos seleccionamos Histogramas, esto hará aparecer la siguiente ventana para elegir las

(20)

20 | P á g i n a

En este ejemplo graficaremos la variable Consumo. Recordar que, para el caso de Histogramas, las

(21)

21 | P á g i n a

Así, el software nos brinda el histograma de la/s variable/s seleccionada/s. En caso de querer

cambiar la cantidad de clases debemos configurarla en la ventana de Herramientas gráficas.

(22)

22 | P á g i n a

6.

Cálculo de probabilidades y cuantiles

En el caso que queramos calcular una probabilidad o cuantil de una variable con distribución conocida, no es necesario que recurramos a una tabla de distribución ni nada parecido. El software cuenta con una “calculadora” de probabilidades y cuantiles de distintas distribuciones de probabilidad conocidas.

Debemos seleccionar la opción Estadísticas Probabilidades y cuantiles, lo cual nos mostrará la

siguiente ventana:

Como podemos ver, tenemos una gran lista de distribuciones conocidas que podemos utilizar. Si nuestra variable sigue una de estas distribuciones, podemos realizar fácilmente el cálculo de probabilidades y cuantiles de la variable.

Figure

Actualización...

Referencias

Actualización...

Related subjects :