• No se han encontrado resultados

Estadística. Estadística básica. Introducción a la estadística con R. Evaristo Diz Cruz. de la ediciones

N/A
N/A
Protected

Academic year: 2021

Share "Estadística. Estadística básica. Introducción a la estadística con R. Evaristo Diz Cruz. de la ediciones"

Copied!
17
0
0

Texto completo

(1)

Estadística

Libro de texto a niv

el técnico, medio

y universita

-rio orientado a la pr

áctica estadística c

on énfasis en

los conceptos básic

os de estadística descr iptiva y teoría de probabilidad . No se requieren conocimien -tos avanzados de ma

temáticas y/o cálculo

, pues está

pensado justamen

te para iniciar al lec

tor en el mun

-do de la estadística y sus aplicaciones

en diferentes

campos.

El libro consta de una par

te inicial introductor ia

con otra de mayor nivel enfa

tizando las principales distribuciones estadísticas

, sus características , así

como test estadístic

os para prueba de hipót esis.

Uti-liza un software abier

to, libre, gratuito y muy poder

o-so que es el Lenguaje R. En est

e sentido lo novedoso de la obra es la utilización de R en la solución de pr

o-blemas estadístic

os varios. Se da una breve introduc

ción al uso de R y se utili

-za el paquete en la solución de un buen númer o de

ejercicios básicos que v

an desde la estadística des

-criptiva hasta la R

egresión Multivarian

te aplicada.

Igualmente se menciona el sist

ema donde se puede bajar el programa g

ratis Open-ware.

Afiance sus

conocimientos en

estadística descriptiva

e inferencial

Conozca la

herramienta de

software R para un

mejor desempeño

Ejemplos prácticos

Ejercicios resueltos

Estadística básica

ediciones

de la

Estadística básica

Evaristo

Diz

Cruz

Evaristo

Diz

Cruz

Doctor en Estadística Actuarial en la Escuela de Ciencias Estadísticas y Actuariales de la Universidad Central de Venezuela (UCV), Especialización en Ciencias Actuariales en la Universidad Pontificia Católica de Chile ,Master en Estadística Matemática y Especialista en Estadística Computacional, con una concentración en Teoría de Riesgo, de la Universidad Simón Bolívar (USB), Master en Sistemas de Información, Master en Administración de Empresas y Lic. en Física y

Matemáticas de la Universidad Católica Andrés Bello (UCAB),Lic en Ciencias Actuariales y Financieras (H. España). Cursos de Entrenamiento Actuarial en Buck Consulting Actuaries en New York y Paul Westbrook & Associate en New Jersey, patrocinados por PDVSA durante dos (2) años. Miembro Titular del Colegio de Actuarios Español. Certificado en Riesgo(CRM) por IIPeR USA. Daytraining Electrónico Avanzado de la American Academy Wall Street LLC. Tasador profesional Universidad del Zulia.

Asesor y consultor en entidades públicas y privadas. Actualmente es Presidente de la firma E. Diz Actuarial Services and Consulting. Profesor de pregrado, postgrado y doctorado en las Universidades Metropolitana, Católica Andrés Bello, y Central de Venezuela. Autor del libro

Teoría de riesgo, y diversos artículos científicos para revistas científicas.

Introducción a la estadística con R

®

Evaristo

Diz

(2)

Estadística

Estadística básica

Evaristo

Diz

Cruz

(3)

Área: Estadística

Primera edición: Bogotá, Colombia, enero de 2016 ISBN. 978-958-762-464-9

© Evaristo Diz Cruz

© Ediciones de la U - Transversal 42 # 4 B-83 - Tel. (+57-1) 4065861 - 4942601 www.edicionesdelau.com - E-mail: [email protected]

Bogotá, Colombia

Ediciones de la U es una empresa editorial que, con una visión moderna y estratégica de

las tecnologías, desarrolla, promueve, distribuye y comercializa contenidos, herramientas de formación, libros técnicos y profesionales, e-books, e-learning o aprendizaje en línea, realizados por autores con amplia experiencia en las diferentes áreas profesionales e investigativas, para brindar a nuestros usuarios soluciones útiles y prácticas que contribuyan al dominio de sus campos de trabajo y a su mejor desempeño en un mundo global, cambiante y cada vez más competitivo.

Diagramación: Emilse Londoño

Coordinación editorial: Adriana Gutiérrez M. Carátula: Ediciones de la U

Impresión: Xpress Estudio Gráfi co y Digital S.A. Av. Américas #39-53, Pbx. (571) 6020808

Impreso y hecho en Colombia Printed and made in Colombia

No está permitida la reproducción total o parcial de este libro, ni su tratamiento informático, ni la transmisión de ninguna forma o por cualquier medio, ya sea electrónico, mecánico, por fotocopia, por registro y otros medios, sin el permiso previo y por escrito de los titulares del Copyright.

Diz Cruz, Evaristo

Estadística básica, introducción a la estadística con R®/ Evaristo Diz Cruz --

Bogotá : Ediciones de la U, 2016 176 p. ; 24 cm.

ISBN 978-958-762-464-9

1. Estadística 2. Probabilidad 3. Distribuciones de probabilidad 4. Muestreo 5. Prueba de Hipótesis 6. Distribución binomial Bin I. Tít.

(4)

Apreciad@ lector:

Es gratifi cante poner en sus manos esta obra, por

esta razón le invitamos a que se registre en nuestra

web:

www.edicionesdelau.com

y obten-

ga benefi cios adicionales como:

Complementos digitales de esta obra

Actualizaciones de esta publicación

Interactuar con los autores a través del blog

Descuentos especiales en próximas compras

Información de nuevas publicaciones de su interés

Noticias y eventos

Para nosotros es muy importante conocer sus comentarios. No dude

en hacernos llegar sus apreciaciones por medio de nuestra web.

Desarrollamos y generamos alianzas

para la disposición de contenidos en

plataformas web que contribuyan de

manera efi caz al acceso y apropiación

del conocimiento. Contamos con

nues-tro portal especializado en e-learning:

(5)

Contenido

Prefacio ... 13 Presentación ... 15 Capítulo 1 Introducción ... 17 1.1 Definición Estadística ... 17

1.2 Estadística en los Negocios ... 18

1.3 Tipo de Datos ... 18

1.4 Fuentes de Datos ... 18

Capítulo 2 Estadística Descriptiva ... 19

2.1 Distribuciones de Frecuencias (Gráficos) ... 19

2.2 Modelos de Tendencia Central ... 20

2.3 Medidas de Variación ... 21 2.4 Comparación de Medidas ... 23 Capítulo 3 Introducción a la Probabilidad ... 25 3.1 Probabilidad ... 25 3.2 Axiomas de Probabilidad ... 26

3.3 Métodos de Calcular Probabilidades ... 27

3.4 Decisión Bayesiana ... 29

3.5 Probabilidad en Forma Tabular ... 30

(6)

Estadísticabásica - Evaristo diz cruz

8

Capítulo 4

Distribuciones de Probabilidad ... 33

4.1 Variables Aleatorias ... 33

4.2 Distribución de Probabilidad Discreta... 34

4.3 Distribución de Probabilidad Contínua ... 36

Capítulo 5 Muestras y Distribuciones en el Muestreo ... 41

5.1 Tipos de Muestras ... 41

5.2 Relación entre Población y Muestra ... 42

5.3 Error Muestral ... 42

5.4 Distribuciones de la Media en el Muestreo ... 43

5.5 Distribución de la Proporción en el Muestreo ... 44

5.6 Teorema del Límite Central... 44

Capítulo 6 Estimación por Intervalos ... 47

6.1 Teorema del Límite Central... 47

6.2 Estimación por Intervalos de una Proporción ... 49

6.3 Determinación del Tamaño Muestral... 50

Capítulo 7 Prueba de Hipótesis ... 53

7.1 Prueba de Hipótesis ... 53

7.2 Pasos en el Prueba de Hipótesis ... 53

7.3 Prueba de Hipótesis de la Media ... 54

7.4 Prueba de Hipótesis de Proporciones ... 56

7.5 Errores Tipo I y II (Errores a y b) ... 57

Capítulo 8 La Distribución Binomial Bin (n, p) ... 60

8.1 Test - Binomiales ... 60

8.2 Aproximación de la Normal a la Binomial ... 60

8.3 La Distribución Poisson X – POIS(l) ... 61

8.4 La Distribución Exponencial X – EXP(l) ... 63

8.5 Distribución Normal ... 63

8.6 Distribución de F cuando X – N (0,1) ... 64

8.7 Estimadores de µ si X – N(µ, s2) ... 64

8.8 Intervalos de Confianza para s2 y s desviación ... 65

(7)

contEnido

8.10 Distribuciones Conectadas con la Normal ... 65

8.11 La Distribución T-Student ... 66

8.12 La Distribución F de Fisher ... 66

Capítulo 9 Análisis de Varianza (Anova) ... 67

9.1 Introducción ... 67

9.2 Comparación de Media de Tres Muestras ... 68

9.3 Prueba de CHI-Cuadrado... 70

9.4 Supuesto de Normalidad ... 71

9.5 Residuales Estandarizados ... 71

9.6 Tablas de Contingencia ... 75

9.7 Residuos Estandarizados ... 77

9.8 Test X 2 para tablas 2 x 2 ... 78

9.9 Test de Fisher para tablas 2 x 2 ... 79

9.10 Ejemplo (Test exacto de Fisher) ... 79

9.11 Test de Distribución Libre ... 80

9.12 Test de Wilcoxon para un Conjunto de Observaciones ... 80

9.13 Ejemplo ... 81

9.14 Aproximación Normal al Test Wilcoxon para un Conjunto de Datos ... 81

9.15 Test de Wilcoxon con dos Conjunto de Observaciones ... 82

9.16 Aproximación Normal al Test de Wilcoxon con dos Conjuntos de Observaciones ... 82

9.17 Regresión Lineal ... 83

9.18 Estimación de los Parámetros b0 y b1 ... 83

9.19 La Distribución de los Estimadores... 84

9.20 Predicciones yi y residuales ei ... 84

9.21 Estimación de la Varianza s2 ... 84

9.22 Intervalos de Confianza para b0 y b1 ... 85

9.23 Coeficiente de Determinación R2 ... 85

9.24 Intervalos de Predicción ... 85

Tabla de Distribución Normal ... 87

Tabla X 2 CHI-Cuadrado F x x2

( )

= 0.5 ... 93

Tabla t Student F xt

( )

= 0.6 ... 97

Tabla de la Distribución de Fisher F(x) = 0.90 ... 99

Tabla de la Distribución de Fisher F(x) = 0.95 ... 101

Tabla de la Distribución de Fisher F(x) = 0.99 ... 103

Test de Wilcoxon para un Conjunto de Observaciones ... 105

Test de Wilcoxon para dos Conjuntos de Datos X = 5% ... 106

Sumario de Fórmulas ... 107

Resumen de Distribuciones de Probabilidad Discreta ... 108

(8)

Estadísticabásica - Evaristo diz cruz

10

10

Estadísticabasica - Evaristo diz cruz

Conceptos Básicos de la Teoría de la Probabilidad ... 109

Variables Aleatorias ... 115

Valores Esperados y Varianza ... 117

La ley de los Grandes Números ... 119

Estadística Descriptiva ... 124

Pruebas de Hipótesis Estadísticas ... 125

Distribución Binomal ... 126

Distribución Poisson ... 127

Distribución Geométrica ... 130

Distribución Hipergeométrica ... 132

Distribución Multinomial... 133

Distribución Binomial Negativa ... 134

Distribución Exponencial ... 135

Distribución Normal ... 135

Distribuciones Conectadas a la Distribución Normal ... 136

La prueba de Chi-cuadrado ... 141

Tablas de Contingencia ... 144

Curvas de Distribución Standard Normal ... 152

Curvas de Distribución Student ... 153

Resumen de Comandos en R para un curso de Estadística Básica ... 154

(9)

Índice gráfico

Gráfico 1. ... 23 Gráfico 2. ... 24 Gráfico 3. ... 26 Gráfico 4. ... 27 Gráfico 5. ... 29 Gráfico 6. ... 31 Gráfico 7. ... 33 Gráfico 8. ... 35 Gráfico 9. ... 36 Gráfico 10. ... 37 Gráfico 11. ... 37 Gráfico 12. ... 38 Gráfico 13. ... 38 Gráfico 14. ... 38 Gráfico 15. ... 39 Gráfico 16. ... 42 Gráfico 17. ... 43 Gráfico 18. ... 44 Gráfico 19. ... 45 Gráfico 21. ... 50 Gráfico 22. ... 51 Gráfico 23. ... 55 Gráfico 24. ... 56 Gráfico 25. ... 57 Gráfico 26. ... 61 Gráfico 27. ... 110

(10)

Estadísticabásica - Evaristo diz cruz

12

Estadísticabasica - Evaristo diz cruz

12

Índice tablas

Tabla 1. ... 19 Tabla 2. ... 30 Tabla 3. ... 58 Tabla 3. ... 60 Tabla 4. ... 62 Tabla 5. ... 64 Tabla 6. ... 120 Tabla 7. ... 121 Tabla 8. ... 122 Tabla 9. ... 128 Tabla 10. ... 129 Tabla 11. ... 129 Tabla 12. ... 130 Tabla 13. ... 134 Tabla 14. ... 141 Tabla 15. ... 141 Tabla 16. ... 142 Tabla 17. ... 142 Tabla 18. ... 143 Tabla 19. ... 143 Tabla 20. ... 144 Tabla 21. ... 144 Tabla 22. ... 145 Tabla 23. ... 146 Tabla 24. ... 147 Tabla 25. ... 147 Tabla 26. ... 148 Tabla 27. ... 149 Tabla 28. ... 150

(11)

Prefacio

Evaristo Diz, nos trae y sorprende nuevamente con un texto que recoge, como nos tiene acostumbrado, los conocimientos fundamentales en el campo de la estadística.

El libro se orienta a proporcionar al lector del conocimiento básico de la esta-dística descriptiva, probabilidades, así como la estaesta-dística inferencial, enfoca-do en aquellas definiciones y temas claves a ser utilizaenfoca-do con mayor frecuen-cia. Su estructura facilita la comprensión de estos temas, por lo cual creo que sólo poseyendo algunos conocimientos básicos de matemáticas, aritmética y álgebra elemental, lo hace accesible a todo interesado en ésta importante área para su aplicación en diferentes campos.

La capacidad del autor de presentar sucintamente los conceptos claves, sus ex-presiones matemáticas etc. se refuerzan con el desarrollo de ejemplos y ejer-cicios, para facilitar la comprensión absoluta de cada tema tratado, constitu-yendo esto un elemento valiosísimo de aporte para aquellos que se aproximan por primera vez a estos contenidos y que de una manera rápida y sencilla, sin necesidad de leer un tratado de Estadística-matemática, accedan a estos co-nocimientos, o si los poseen ayuda a refrescarlos de una manera muy práctica. Destaco el alcance y enfoque que hace Evaristo en el capítulo de las distribu-ciones de probabilidades donde en mi ejercicio docente, se observan a veces desconocimiento o falta de claridad de las mismas por parte de los estudian-tes o profesionales.

(12)

Estadísticabásica - Evaristo diz cruz

14

En su último capítulo el autor nos agrega, basado en la herramienta de Soft-ware R, programa de código abierto y gratuito, una serie de comandos para aplicación de conceptos estadísticos simples la cual se convierte en una op-ción adicional para el aprendizaje fundamentado en alguno de los conceptos teóricos contenidos en el libro.

Esta obra es, en mi opinión, con su manera instructiva y legible capaz de pro-porcionar los conocimientos técnicos necesarios para resolver una gran par-te de los problemas que se presentan más frecuenpar-temenpar-te en las áreas de ciencias económicas, sociales, naturales, permitiéndole al lector abrir caminos para profundizar en la medida que la complejidad e interés se lo imponga.

Caracas, 2015 Ing. Guillermo Muñoz Rojas, Msc, CRM Prof. Post-Grado Universidad Católica Andrés Bello. Caracas-Venezuela

(13)

Presentación

Este libro es una contribución más a los excelentes libros en Estadística que ya existen en el mercado; pero con una orientación muy directa y clara al conoci-miento de los conceptos básicos y su aplicación inmediata.

El libro está estructurado en tres partes; una primera parte muy básica o intro-ductoria que va desde el primer capítulo hasta el séptimo.

Una segunda parte constituida por los capítulos ocho y nueve donde se trata de una manera más formal el tema de inferencia estadística cubriendo Estima-ción y Pruebas de Hipótesis; y una tercera que son problemas resueltos en de-talle (90 problemas) incluyendo el uso de lenguaje de programación en R para la solución de problemas más complejos, tanto del punto de vista del cálculo como de representación gráfica de resultados estadísticos fundamentales. En esencia el libro de texto pretende o al menos eso fue lo que se trató de hacer, dar una introducción lo más pedagógica posible a la Estadística Básica y su aplicación.

Agradezco al Ingeniero Guillermo Muñoz, profesor y colega por la revisión y prólogo de este texto.

Este es un libro que cubre un material para ser dictado en un semestre en cual-quier carrera universitaria, tales como Administración, Economía, Industriolo-gía, Comunicaciones, etc.

(14)

17

1.1 DEFINICIÓN DE ESTADÍSTICA

El concepto moderno de estadística está relacionado con la necesidad de re-coger, analizar, interpretar y presentar los datos. La estadística es una ciencia con nombre propio que se deriva de las matemáticas para lograr los objetivos antes señalados.

a) Descriptiva

La estadística descriptiva hace referencia a un grupo de métodos que per-mite describir como su propio nombre lo indica, un conjunto de datos de manera reducida y ordenada.

b) Inferencial

La estadística Inferencial es la que permite llegar a conclusiones de un conjunto de datos más grande, observando una pequeña porción de ellos conocido como muestra. Más adelante veremos con mayor profundidad los detalles de los conceptos: población, muestra, entre otros, para poder abordar con éxito conclusiones creíbles.

(15)

Estadísticabásica - Evaristo diz cruz

1.2 ESTADÍSTICA EN LOS NEGOCIOS

La gerencia moderna en todas las áreas utiliza cada vez más la estadística como ciencia para la toma de decisiones sumergidas en atmósferas de gran volumen de datos e incertidumbre. La estadística es la que permite dilucidar qué tipo de datos son claves y críticos para la toma de decisiones y cuáles serían las conclusiones y consecuencias.

1.3 TIPO DE DATOS

Existen dos tipos de datos sobre los cuales se puede aplicar los conceptos es-tadísticos

a) Cualitativos

Cuando las variables vienen dadas por atributos propios que las definen, como por ejemplo sexo, raza, tipo de nómina, ciudadanía, etc.

b) Cuantitativos

Aquellos de carácter numérico que permiten entre ellos aplicar el álgebra a todos los niveles para reducir, clasificar, predecir, a través de las opera-ciones matemáticas tradicionales desde las más elementales como suma o resta, hasta integraciones en varias dimensiones.

1.4 FUENTES DE DATOS

La fuente de datos puede ser múltiple, si nos ubicamos en una organización pudiéramos hablar al menos de dos fuentes.

Internas

Colección de datos de una organización generadas internamente. Ejemplo: ventas, inventarios, nóminas, etc.

Externas

Fuentes externas a la organización que a su vez pueden ser de dos tipos

• Fuentes Primarias

Datos publicados de primera mano por organizaciones públicas o priva-das generalmente es data ordenada y reducida.

• Fuentes Secundarias

Cualquier otro tipo de datos tratados de cualquier fuente primaria; incluye los datos del primero como insumo para obtener información aguas abajo.

(16)

19

2.1 DISTRIBUCIONES DE FRECUENCIAS (GRÁFICOS)

Una distribución de frecuencia es un método de condensación de data. Gene-ralmente se adopta el método tabular.

a) Datos Cualitativos

Cuando las distribuciones de frecuencia hacen referencia a descubrir datos categóricos, generalmente se determinan cuantos datos caen en que categoría.

Ejemplo 1

Tabla 1.

TiPO (SEXO) nÚMERO DE ESTUDiAnTES %

Masculino 100 2/3 Femenino 50 1/3

Total 150 100

(17)

Estadísticabásica - Evaristo diz cruz

2.2 MODELOS DE TENDENCIA CENTRAL

Una medida de tendencia central es un promedio o media. Su propósito es reducir el volumen de la data en un solo número.

a) Media Aritmética

Es el promedio resultante de sumar todos los valores observados de la va-riable y dividirlos entre el número de observaciones.

La fórmula es: µ =

Σ

X N Donde: µ = Media Poblacional S = Sumatorio X = Variable N = Número de Observaciones X X N =

S

Donde: X = Media Muestral X = Variable N = Número de Observaciones b) Ponderada

La media ponderada es exactamente igual a aritmética pero contada con las frecuencias o pesos que se repiten en las observaciones.

La fórmula es: X wx w w=

S

S

Donde:

Referencias

Documento similar

Galton (1.822-1.911) y Pearson (1.857-1936) se pueden considerar como los padres de la estadística moderna, pues a ellos se debe el paso de la estadística deductiva a la

 Tejidos de origen humano o sus derivados que sean inviables o hayan sido transformados en inviables con una función accesoria..  Células de origen humano o sus derivados que

d) que haya «identidad de órgano» (con identidad de Sala y Sección); e) que haya alteridad, es decir, que las sentencias aportadas sean de persona distinta a la recurrente, e) que

Las manifestaciones musicales y su organización institucional a lo largo de los siglos XVI al XVIII son aspectos poco conocidos de la cultura alicantina. Analizar el alcance y

A ello cabría afladir las intensas precipitaciones, generalizadas en todo el antiguo reino valenciano, del año 1756 que provocaron notables inundaciones y, como guinda final,

Proporcione esta nota de seguridad y las copias de la versión para pacientes junto con el documento Preguntas frecuentes sobre contraindicaciones y

Contraindicaciones: El uso de la mascarilla está contraindicado para los pacientes y los miembros de sus familias, profesionales sanitarios y compañeros de

Tabla 13. Rúbrica de evaluación de actividades grupales.. Para la evaluación de actividades individuales y grupales se evaluará por separado, pero cuando se tenga todas las notas