Estadística
Libro de texto a niv
el técnico, medio
y universita
-rio orientado a la pr
áctica estadística c
on énfasis en
los conceptos básic
os de estadística descr iptiva y teoría de probabilidad . No se requieren conocimien -tos avanzados de ma
temáticas y/o cálculo
, pues está
pensado justamen
te para iniciar al lec
tor en el mun
-do de la estadística y sus aplicaciones
en diferentes
campos.
El libro consta de una par
te inicial introductor ia
con otra de mayor nivel enfa
tizando las principales distribuciones estadísticas
, sus características , así
como test estadístic
os para prueba de hipót esis.
Uti-liza un software abier
to, libre, gratuito y muy poder
o-so que es el Lenguaje R. En est
e sentido lo novedoso de la obra es la utilización de R en la solución de pr
o-blemas estadístic
os varios. Se da una breve introduc
ción al uso de R y se utili
-za el paquete en la solución de un buen númer o de
ejercicios básicos que v
an desde la estadística des
-criptiva hasta la R
egresión Multivarian
te aplicada.
Igualmente se menciona el sist
ema donde se puede bajar el programa g
ratis Open-ware.
Afiance sus
conocimientos en
estadística descriptiva
e inferencial
Conozca la
herramienta de
software R para un
mejor desempeño
Ejemplos prácticos
Ejercicios resueltos
Estadística básica
ediciones
de laEstadística básica
Evaristo
Diz
Cruz
Evaristo
Diz
Cruz
Doctor en Estadística Actuarial en la Escuela de Ciencias Estadísticas y Actuariales de la Universidad Central de Venezuela (UCV), Especialización en Ciencias Actuariales en la Universidad Pontificia Católica de Chile ,Master en Estadística Matemática y Especialista en Estadística Computacional, con una concentración en Teoría de Riesgo, de la Universidad Simón Bolívar (USB), Master en Sistemas de Información, Master en Administración de Empresas y Lic. en Física y
Matemáticas de la Universidad Católica Andrés Bello (UCAB),Lic en Ciencias Actuariales y Financieras (H. España). Cursos de Entrenamiento Actuarial en Buck Consulting Actuaries en New York y Paul Westbrook & Associate en New Jersey, patrocinados por PDVSA durante dos (2) años. Miembro Titular del Colegio de Actuarios Español. Certificado en Riesgo(CRM) por IIPeR USA. Daytraining Electrónico Avanzado de la American Academy Wall Street LLC. Tasador profesional Universidad del Zulia.
Asesor y consultor en entidades públicas y privadas. Actualmente es Presidente de la firma E. Diz Actuarial Services and Consulting. Profesor de pregrado, postgrado y doctorado en las Universidades Metropolitana, Católica Andrés Bello, y Central de Venezuela. Autor del libro
Teoría de riesgo, y diversos artículos científicos para revistas científicas.
Introducción a la estadística con R
®
Evaristo
Diz
Estadística
Estadística básica
Evaristo
Diz
Cruz
Área: Estadística
Primera edición: Bogotá, Colombia, enero de 2016 ISBN. 978-958-762-464-9
© Evaristo Diz Cruz
© Ediciones de la U - Transversal 42 # 4 B-83 - Tel. (+57-1) 4065861 - 4942601 www.edicionesdelau.com - E-mail: [email protected]
Bogotá, Colombia
Ediciones de la U es una empresa editorial que, con una visión moderna y estratégica de
las tecnologías, desarrolla, promueve, distribuye y comercializa contenidos, herramientas de formación, libros técnicos y profesionales, e-books, e-learning o aprendizaje en línea, realizados por autores con amplia experiencia en las diferentes áreas profesionales e investigativas, para brindar a nuestros usuarios soluciones útiles y prácticas que contribuyan al dominio de sus campos de trabajo y a su mejor desempeño en un mundo global, cambiante y cada vez más competitivo.
Diagramación: Emilse Londoño
Coordinación editorial: Adriana Gutiérrez M. Carátula: Ediciones de la U
Impresión: Xpress Estudio Gráfi co y Digital S.A. Av. Américas #39-53, Pbx. (571) 6020808
Impreso y hecho en Colombia Printed and made in Colombia
No está permitida la reproducción total o parcial de este libro, ni su tratamiento informático, ni la transmisión de ninguna forma o por cualquier medio, ya sea electrónico, mecánico, por fotocopia, por registro y otros medios, sin el permiso previo y por escrito de los titulares del Copyright.
Diz Cruz, Evaristo
Estadística básica, introducción a la estadística con R®/ Evaristo Diz Cruz --
Bogotá : Ediciones de la U, 2016 176 p. ; 24 cm.
ISBN 978-958-762-464-9
1. Estadística 2. Probabilidad 3. Distribuciones de probabilidad 4. Muestreo 5. Prueba de Hipótesis 6. Distribución binomial Bin I. Tít.
Apreciad@ lector:
Es gratifi cante poner en sus manos esta obra, por
esta razón le invitamos a que se registre en nuestra
web:
www.edicionesdelau.com
y obten-
ga benefi cios adicionales como:
Complementos digitales de esta obra
Actualizaciones de esta publicación
Interactuar con los autores a través del blog
Descuentos especiales en próximas compras
Información de nuevas publicaciones de su interés
Noticias y eventos
Para nosotros es muy importante conocer sus comentarios. No dude
en hacernos llegar sus apreciaciones por medio de nuestra web.
Desarrollamos y generamos alianzas
para la disposición de contenidos en
plataformas web que contribuyan de
manera efi caz al acceso y apropiación
del conocimiento. Contamos con
nues-tro portal especializado en e-learning:
Contenido
Prefacio ... 13 Presentación ... 15 Capítulo 1 Introducción ... 17 1.1 Definición Estadística ... 171.2 Estadística en los Negocios ... 18
1.3 Tipo de Datos ... 18
1.4 Fuentes de Datos ... 18
Capítulo 2 Estadística Descriptiva ... 19
2.1 Distribuciones de Frecuencias (Gráficos) ... 19
2.2 Modelos de Tendencia Central ... 20
2.3 Medidas de Variación ... 21 2.4 Comparación de Medidas ... 23 Capítulo 3 Introducción a la Probabilidad ... 25 3.1 Probabilidad ... 25 3.2 Axiomas de Probabilidad ... 26
3.3 Métodos de Calcular Probabilidades ... 27
3.4 Decisión Bayesiana ... 29
3.5 Probabilidad en Forma Tabular ... 30
Estadísticabásica - Evaristo diz cruz
8
Capítulo 4
Distribuciones de Probabilidad ... 33
4.1 Variables Aleatorias ... 33
4.2 Distribución de Probabilidad Discreta... 34
4.3 Distribución de Probabilidad Contínua ... 36
Capítulo 5 Muestras y Distribuciones en el Muestreo ... 41
5.1 Tipos de Muestras ... 41
5.2 Relación entre Población y Muestra ... 42
5.3 Error Muestral ... 42
5.4 Distribuciones de la Media en el Muestreo ... 43
5.5 Distribución de la Proporción en el Muestreo ... 44
5.6 Teorema del Límite Central... 44
Capítulo 6 Estimación por Intervalos ... 47
6.1 Teorema del Límite Central... 47
6.2 Estimación por Intervalos de una Proporción ... 49
6.3 Determinación del Tamaño Muestral... 50
Capítulo 7 Prueba de Hipótesis ... 53
7.1 Prueba de Hipótesis ... 53
7.2 Pasos en el Prueba de Hipótesis ... 53
7.3 Prueba de Hipótesis de la Media ... 54
7.4 Prueba de Hipótesis de Proporciones ... 56
7.5 Errores Tipo I y II (Errores a y b) ... 57
Capítulo 8 La Distribución Binomial Bin (n, p) ... 60
8.1 Test - Binomiales ... 60
8.2 Aproximación de la Normal a la Binomial ... 60
8.3 La Distribución Poisson X – POIS(l) ... 61
8.4 La Distribución Exponencial X – EXP(l) ... 63
8.5 Distribución Normal ... 63
8.6 Distribución de F cuando X – N (0,1) ... 64
8.7 Estimadores de µ si X – N(µ, s2) ... 64
8.8 Intervalos de Confianza para s2 y s desviación ... 65
contEnido
8.10 Distribuciones Conectadas con la Normal ... 65
8.11 La Distribución T-Student ... 66
8.12 La Distribución F de Fisher ... 66
Capítulo 9 Análisis de Varianza (Anova) ... 67
9.1 Introducción ... 67
9.2 Comparación de Media de Tres Muestras ... 68
9.3 Prueba de CHI-Cuadrado... 70
9.4 Supuesto de Normalidad ... 71
9.5 Residuales Estandarizados ... 71
9.6 Tablas de Contingencia ... 75
9.7 Residuos Estandarizados ... 77
9.8 Test X 2 para tablas 2 x 2 ... 78
9.9 Test de Fisher para tablas 2 x 2 ... 79
9.10 Ejemplo (Test exacto de Fisher) ... 79
9.11 Test de Distribución Libre ... 80
9.12 Test de Wilcoxon para un Conjunto de Observaciones ... 80
9.13 Ejemplo ... 81
9.14 Aproximación Normal al Test Wilcoxon para un Conjunto de Datos ... 81
9.15 Test de Wilcoxon con dos Conjunto de Observaciones ... 82
9.16 Aproximación Normal al Test de Wilcoxon con dos Conjuntos de Observaciones ... 82
9.17 Regresión Lineal ... 83
9.18 Estimación de los Parámetros b0 y b1 ... 83
9.19 La Distribución de los Estimadores... 84
9.20 Predicciones yi y residuales ei ... 84
9.21 Estimación de la Varianza s2 ... 84
9.22 Intervalos de Confianza para b0 y b1 ... 85
9.23 Coeficiente de Determinación R2 ... 85
9.24 Intervalos de Predicción ... 85
Tabla de Distribución Normal ... 87
Tabla X 2 CHI-Cuadrado F x x2
( )
= 0.5 ... 93Tabla t Student F xt
( )
= 0.6 ... 97Tabla de la Distribución de Fisher F(x) = 0.90 ... 99
Tabla de la Distribución de Fisher F(x) = 0.95 ... 101
Tabla de la Distribución de Fisher F(x) = 0.99 ... 103
Test de Wilcoxon para un Conjunto de Observaciones ... 105
Test de Wilcoxon para dos Conjuntos de Datos X = 5% ... 106
Sumario de Fórmulas ... 107
Resumen de Distribuciones de Probabilidad Discreta ... 108
Estadísticabásica - Evaristo diz cruz
10
10
Estadísticabasica - Evaristo diz cruz
Conceptos Básicos de la Teoría de la Probabilidad ... 109
Variables Aleatorias ... 115
Valores Esperados y Varianza ... 117
La ley de los Grandes Números ... 119
Estadística Descriptiva ... 124
Pruebas de Hipótesis Estadísticas ... 125
Distribución Binomal ... 126
Distribución Poisson ... 127
Distribución Geométrica ... 130
Distribución Hipergeométrica ... 132
Distribución Multinomial... 133
Distribución Binomial Negativa ... 134
Distribución Exponencial ... 135
Distribución Normal ... 135
Distribuciones Conectadas a la Distribución Normal ... 136
La prueba de Chi-cuadrado ... 141
Tablas de Contingencia ... 144
Curvas de Distribución Standard Normal ... 152
Curvas de Distribución Student ... 153
Resumen de Comandos en R para un curso de Estadística Básica ... 154
Índice gráfico
Gráfico 1. ... 23 Gráfico 2. ... 24 Gráfico 3. ... 26 Gráfico 4. ... 27 Gráfico 5. ... 29 Gráfico 6. ... 31 Gráfico 7. ... 33 Gráfico 8. ... 35 Gráfico 9. ... 36 Gráfico 10. ... 37 Gráfico 11. ... 37 Gráfico 12. ... 38 Gráfico 13. ... 38 Gráfico 14. ... 38 Gráfico 15. ... 39 Gráfico 16. ... 42 Gráfico 17. ... 43 Gráfico 18. ... 44 Gráfico 19. ... 45 Gráfico 21. ... 50 Gráfico 22. ... 51 Gráfico 23. ... 55 Gráfico 24. ... 56 Gráfico 25. ... 57 Gráfico 26. ... 61 Gráfico 27. ... 110Estadísticabásica - Evaristo diz cruz
12
Estadísticabasica - Evaristo diz cruz
12
Índice tablas
Tabla 1. ... 19 Tabla 2. ... 30 Tabla 3. ... 58 Tabla 3. ... 60 Tabla 4. ... 62 Tabla 5. ... 64 Tabla 6. ... 120 Tabla 7. ... 121 Tabla 8. ... 122 Tabla 9. ... 128 Tabla 10. ... 129 Tabla 11. ... 129 Tabla 12. ... 130 Tabla 13. ... 134 Tabla 14. ... 141 Tabla 15. ... 141 Tabla 16. ... 142 Tabla 17. ... 142 Tabla 18. ... 143 Tabla 19. ... 143 Tabla 20. ... 144 Tabla 21. ... 144 Tabla 22. ... 145 Tabla 23. ... 146 Tabla 24. ... 147 Tabla 25. ... 147 Tabla 26. ... 148 Tabla 27. ... 149 Tabla 28. ... 150Prefacio
Evaristo Diz, nos trae y sorprende nuevamente con un texto que recoge, como nos tiene acostumbrado, los conocimientos fundamentales en el campo de la estadística.
El libro se orienta a proporcionar al lector del conocimiento básico de la esta-dística descriptiva, probabilidades, así como la estaesta-dística inferencial, enfoca-do en aquellas definiciones y temas claves a ser utilizaenfoca-do con mayor frecuen-cia. Su estructura facilita la comprensión de estos temas, por lo cual creo que sólo poseyendo algunos conocimientos básicos de matemáticas, aritmética y álgebra elemental, lo hace accesible a todo interesado en ésta importante área para su aplicación en diferentes campos.
La capacidad del autor de presentar sucintamente los conceptos claves, sus ex-presiones matemáticas etc. se refuerzan con el desarrollo de ejemplos y ejer-cicios, para facilitar la comprensión absoluta de cada tema tratado, constitu-yendo esto un elemento valiosísimo de aporte para aquellos que se aproximan por primera vez a estos contenidos y que de una manera rápida y sencilla, sin necesidad de leer un tratado de Estadística-matemática, accedan a estos co-nocimientos, o si los poseen ayuda a refrescarlos de una manera muy práctica. Destaco el alcance y enfoque que hace Evaristo en el capítulo de las distribu-ciones de probabilidades donde en mi ejercicio docente, se observan a veces desconocimiento o falta de claridad de las mismas por parte de los estudian-tes o profesionales.
Estadísticabásica - Evaristo diz cruz
14
En su último capítulo el autor nos agrega, basado en la herramienta de Soft-ware R, programa de código abierto y gratuito, una serie de comandos para aplicación de conceptos estadísticos simples la cual se convierte en una op-ción adicional para el aprendizaje fundamentado en alguno de los conceptos teóricos contenidos en el libro.
Esta obra es, en mi opinión, con su manera instructiva y legible capaz de pro-porcionar los conocimientos técnicos necesarios para resolver una gran par-te de los problemas que se presentan más frecuenpar-temenpar-te en las áreas de ciencias económicas, sociales, naturales, permitiéndole al lector abrir caminos para profundizar en la medida que la complejidad e interés se lo imponga.
Caracas, 2015 Ing. Guillermo Muñoz Rojas, Msc, CRM Prof. Post-Grado Universidad Católica Andrés Bello. Caracas-Venezuela
Presentación
Este libro es una contribución más a los excelentes libros en Estadística que ya existen en el mercado; pero con una orientación muy directa y clara al conoci-miento de los conceptos básicos y su aplicación inmediata.
El libro está estructurado en tres partes; una primera parte muy básica o intro-ductoria que va desde el primer capítulo hasta el séptimo.
Una segunda parte constituida por los capítulos ocho y nueve donde se trata de una manera más formal el tema de inferencia estadística cubriendo Estima-ción y Pruebas de Hipótesis; y una tercera que son problemas resueltos en de-talle (90 problemas) incluyendo el uso de lenguaje de programación en R para la solución de problemas más complejos, tanto del punto de vista del cálculo como de representación gráfica de resultados estadísticos fundamentales. En esencia el libro de texto pretende o al menos eso fue lo que se trató de hacer, dar una introducción lo más pedagógica posible a la Estadística Básica y su aplicación.
Agradezco al Ingeniero Guillermo Muñoz, profesor y colega por la revisión y prólogo de este texto.
Este es un libro que cubre un material para ser dictado en un semestre en cual-quier carrera universitaria, tales como Administración, Economía, Industriolo-gía, Comunicaciones, etc.
17
1.1 DEFINICIÓN DE ESTADÍSTICA
El concepto moderno de estadística está relacionado con la necesidad de re-coger, analizar, interpretar y presentar los datos. La estadística es una ciencia con nombre propio que se deriva de las matemáticas para lograr los objetivos antes señalados.
a) Descriptiva
La estadística descriptiva hace referencia a un grupo de métodos que per-mite describir como su propio nombre lo indica, un conjunto de datos de manera reducida y ordenada.
b) Inferencial
La estadística Inferencial es la que permite llegar a conclusiones de un conjunto de datos más grande, observando una pequeña porción de ellos conocido como muestra. Más adelante veremos con mayor profundidad los detalles de los conceptos: población, muestra, entre otros, para poder abordar con éxito conclusiones creíbles.
Estadísticabásica - Evaristo diz cruz
1.2 ESTADÍSTICA EN LOS NEGOCIOS
La gerencia moderna en todas las áreas utiliza cada vez más la estadística como ciencia para la toma de decisiones sumergidas en atmósferas de gran volumen de datos e incertidumbre. La estadística es la que permite dilucidar qué tipo de datos son claves y críticos para la toma de decisiones y cuáles serían las conclusiones y consecuencias.
1.3 TIPO DE DATOS
Existen dos tipos de datos sobre los cuales se puede aplicar los conceptos es-tadísticos
a) Cualitativos
Cuando las variables vienen dadas por atributos propios que las definen, como por ejemplo sexo, raza, tipo de nómina, ciudadanía, etc.
b) Cuantitativos
Aquellos de carácter numérico que permiten entre ellos aplicar el álgebra a todos los niveles para reducir, clasificar, predecir, a través de las opera-ciones matemáticas tradicionales desde las más elementales como suma o resta, hasta integraciones en varias dimensiones.
1.4 FUENTES DE DATOS
La fuente de datos puede ser múltiple, si nos ubicamos en una organización pudiéramos hablar al menos de dos fuentes.
Internas
Colección de datos de una organización generadas internamente. Ejemplo: ventas, inventarios, nóminas, etc.
Externas
Fuentes externas a la organización que a su vez pueden ser de dos tipos
• Fuentes Primarias
Datos publicados de primera mano por organizaciones públicas o priva-das generalmente es data ordenada y reducida.
• Fuentes Secundarias
Cualquier otro tipo de datos tratados de cualquier fuente primaria; incluye los datos del primero como insumo para obtener información aguas abajo.
19
2.1 DISTRIBUCIONES DE FRECUENCIAS (GRÁFICOS)
Una distribución de frecuencia es un método de condensación de data. Gene-ralmente se adopta el método tabular.
a) Datos Cualitativos
Cuando las distribuciones de frecuencia hacen referencia a descubrir datos categóricos, generalmente se determinan cuantos datos caen en que categoría.
Ejemplo 1
Tabla 1.
TiPO (SEXO) nÚMERO DE ESTUDiAnTES %
Masculino 100 2/3 Femenino 50 1/3
Total 150 100
Estadísticabásica - Evaristo diz cruz
2.2 MODELOS DE TENDENCIA CENTRAL
Una medida de tendencia central es un promedio o media. Su propósito es reducir el volumen de la data en un solo número.
a) Media Aritmética
Es el promedio resultante de sumar todos los valores observados de la va-riable y dividirlos entre el número de observaciones.
La fórmula es: µ =
Σ
X N Donde: µ = Media Poblacional S = Sumatorio X = Variable N = Número de Observaciones X X N =S
Donde: X = Media Muestral X = Variable N = Número de Observaciones b) PonderadaLa media ponderada es exactamente igual a aritmética pero contada con las frecuencias o pesos que se repiten en las observaciones.
La fórmula es: X wx w w=