Estadistica para Administracion y Economia_6ta Ed_PaulNewbold_William_Berry.pdf

(1)

(2)

(3)

(4)

(5)

Estadística para Administración

y Economía

SEXTA EDICIÓN

Paul Newbold

University of Nottingham

William L. Carlson

St. Olaf College

Betty M. Thorne

Stetson University

Traducción

Esther Rabasco Espáriz

Revisión Técnica

Luis Toharia

Universidad de Alcalá de Henares

(6)

Estadística para Administración y Economía

PEARSON EDUCACIÓN, S.A., Madrid, 2008 ISBN: 978-84-8322-403-8

Materia: 519.5 Métodos estadísticos

Formato 195 # 250 mm Páginas: 1088

Queda prohibida, salvo excepción prevista en la Ley, cualquier forma de reproducción, distribución, comunicación pública y transformación de esta obra sin contar con autorización de los titulares de propiedad intelectual. La infracción de los derechos mencionados puede ser constitutiva de delito contra la propiedad intelectual (arts. 270 y sgts. Código Penal).

Authorized translation from the English language edition, entitled STATISTICS FOR BUSINESS AND ECONOMICS, 6th Edition by NEWBOLD, PAUL; CARLSON, WILLIAM; THORNE, BETTY, published by Pearson Education, Inc, publishing as Prentice Hall, Copyright 5 2007.

system, without permission from Pearson Education, Inc.

52008 por PEARSON EDUCACIÓN, S.A. Ribera del Loira, 28

28042 Madrid (España)

Paul Newbold, William L. Carlson y Betty M. Thorne

Estadística para Administración y Economía

ISBN: 978-84-8322-403-8 Depósito legal:

PEARSON PRENTICE HALL es un sello editorial autorizado de PEARSON EDUCACIÓN, S.A. Equipo editorial:

Editor: Alberto Cañizal

Técnico editorial: Elena Bazaco Equipo de producción:

Director: José Antonio Clares Técnico: José Antonio Hernán

Diseño de cubierta: Equipo de diseño de PEARSON EDUCACIÓN, S.A. Composición: COPIBOOK, S.L.

Impreso por:

IMPRESO EN ESPAÑA - PRINTED IN SPAIN

(7)

Rellana, Anna, Eva Rose y Emily

William L. Carlson

Dedico este libro a mi marido Jim y a nuestra familia

Jennie, Ann, Renee, Jon, Chris, Jon, Marius, Mihaela,

Cezara y Anda

Betty M. Thorne

(8)

(9)

Bill Carlson es profesor emérito de economía en St. Olaf College,

donde lleva 31 años enseñando, ha sido varias veces director de de-partamento y ha desempeñado diversas funciones administrativas, entre las que se encuentra la de Director del Centro de Cálculo. También ha ocupado diversos cargos en la administración pública de Estados Unidos y en la Universidad de Minnesota, además de pro-nunciar conferencias en numerosas universidades. Fue elegido miembro honorario de Phi Beta Kappa. También trabajó 10 años en el sector privado y en empresas de consultoría antes de iniciar su ca-rrera en St. Olaf. Se licenció en ingeniería en la Michigan Technolo-gical University (BS), realizó un Máster (MS) en el Illinois Institute of Technology y se doctoró (Ph.D.) en Administración Cuantitativa de Empresas en la Rackham Graduate School de la Universidad de Michigan. Entre sus investigaciones, se encuentran numerosos estu-dios sobre la administración de empresas, la seguridad vial y la ense-ñanza de la estadística. Ha publicado anteriormente dos libros de texto de estadística. Ha sido profesor encargado de numerosos gru-pos de estudiantes que han realizado estancias de estudio en diversos países de todo el mundo. Entre los cargos que ocupa actualmente se encuentran el de Director Ejecutivo del Cannon Valley Elder Colle-gium. Disfruta con sus nietos y con la ebanistería, y le encanta viajar, leer y que le encarguen trabajos en la parte septentrional del estado de Wisconsin.

Betty M. Thorne, autora, investigadora y profesora galardonada con

premios a la docencia, es profesora de Ciencias de la Decisión y Di-rectora de Estudios de Grado en la School of Business Administra-tion de Stetson University en DeLand (Florida). Galardonada con el McEniry Award for Excellence in Teaching de la Stetson University, el máximo premio que se concede a un profesor de la Stetson Uni-versity, también ha recibido el Outstanding Teacher of the Year Award y el Professor of the Year Award de la School of Business Administration en Stetson. Enseña asimismo en el programa de vera-no de Stetson University en Innsbruck (Austria); el College of Law

(10)

de Stetson University; el programa de MBA Ejecutivo de Stetson University, y el Executive Passport Program de Stetson University. En 2004 y 2005, fue nombrada mejor profesora del programa JD/MBA del College of Law de Stetson. Se licenció en Geneva College e hizo el Máster y el Doctorado en la Universidad de Indiana. Es miembro del comité de planificación y Secretaria/Tesorera de las jornadas tituladas Making Statistics More Effective in Schools and

Business, en las que se reúne anualmente con estadísticos para debatir sobre cuestiones de

in-vestigación y enseñanza. También es miembro del Decision Sciences Institute, de la American Society for Quality y de la American Statistical Association. Participa en un estudio quinquenal titulado North American Fareston versus Tamoxifen Adjuvant (NAFTA) Trial sobre el cáncer de mama (http://www.naftatrial.com).

Ella y su marido, Jim, tienen cuatro hijos. Viajan mucho, asisten a clases de teología, parti-cipan en organizaciones internacionales dedicadas a ayudar a niños desfavorecidos y hacen tra-bajo apostólico en Rumanía.

(11)

Capítulo 1. ¿Por qué estudiar estadística? ... 1

Capítulo 2. Descripción gráfica de los datos ... 9

Capítulo 3. Descripción numérica de los datos ... 49

Capítulo 4. Probabilidad ... 83

Capítulo 5. Variables aleatorias discretas y distribuciones de probabilidad ... 145

Capítulo 6. Variables aleatorias continuas y distribuciones de probabilidad ... 201

Capítulo 7. Muestreo y distribuciones en el muestreo ... 249

Capítulo 8. Estimación: una población ... 295

Capítulo 9. Estimación: otros temas ... 325

Capítulo 10. Contraste de hipótesis ... 353

Capítulo 11. Contraste de hipótesis II ... 393

Capítulo 12. Regresión simple ... 431

Capítulo 13. Regresión múltiple ... 487

Capítulo 14. Otros temas del análisis de regresión ... 575

Capítulo 15. Estadística no paramétrica ... 627

Capítulo 16. Contrastes de la bondad del ajuste y tablas de contingencia ... 655

Capítulo 17. Análisis de la varianza ... 681

Capítulo 18. Introducción a la calidad ... 729

Capítulo 19. Análisis de series temporales y predicción ... 763

Capítulo 20. Otros temas relacionados con el muestreo ... 811

(12)

(13)

PRÓLOGO ... xix

CAPÍTULO 1. ¿Por qué estudiar estadística? ... 1

1.1. La toma de decisiones en un entorno incierto ... 2

1.2. El muestreo ... 3

1.3. Estadística descriptiva e inferencial ... 4

Descripción de los datos ... 5

Realización de inferencias ... 6

CAPÍTULO 2. Descripción gráfica de los datos ... 9

2.1. Clasificación de las variables ... 10

Categóricas o numéricas ... 10

Niveles de medición ... 10

2.2. Gráficos para describir variables categóricas ... 13

Tablas ... 13

Gráficos de barras y gráficos de tarta ... 14

Diagramas de Pareto ... 16

2.3. Gráficos para describir datos de series temporales ... 20

2.4. Gráficos para describir variables numéricas ... 24

Distribuciones de frecuencias ... 24

Histogramas y ojivas ... 27

Diagramas de tallo y hojas ... 30

2.5. Tablas y gráficos para describir relaciones entre variables ... 32

Diagramas de puntos dispersos ... 33

Tablas cruzadas ... 34

2.6. Errores en la presentación de datos ... 39

Histogramas engañosos ... 40

Gráficos de series temporales engañosos ... 42

CAPÍTULO 3. Descripción numérica de los datos ... 49

3.1. Medidas de la tendencia central ... 50

Media, mediana, moda ... 50

Forma de la distribución ... 52

3.2. Medidas de la variabilidad ... 55

(14)

Varianza y desviación típica ... 57

Teorema de Chebychev y regla empírica ... 59

Coeficiente de variación ... 61

3.3. Media ponderada y medidas de datos agrupados ... 64

3.4. Medidas de las relaciones entre variables ... 69

3.5. Obtención de relaciones lineales ... 75

CAPÍTULO 4. Probabilidad ... 83

4.1. Experimento aleatorio, resultados, sucesos ... 84

4.2. La probabilidad y sus postulados ... 92

Probabilidad clásica ... 92 Frecuencia relativa ... 95 Probabilidad subjetiva ... 96 4.3. Reglas de la probabilidad ... 102 Probabilidad condicionada ... 104 Independencia estadística ... 108 4.4. Probabilidades bivariantes ... 116 Ventaja (odds) ... 120 Cociente de «sobreparticipación» ... 121 4.5. El teorema de Bayes ... 128

CAPÍTULO 5. Variables aleatorias discretas y distribuciones de probabilidad ... 145

5.1. Variables aleatorias ... 146

5.2. Distribuciones de probabilidad de variables aleatorias discretas ... 148

5.3. Propiedades de las variables aleatorias discretas ... 151

Valor esperado de una variable aleatoria discreta ... 151

Varianza de una variable aleatoria discreta ... 153

Media y varianza de funciones lineales de una variable aleatoria ... 156

5.4. Distribución binomial ... 161

5.5. Distribución hipergeométrica ... 170

5.6. La distribución de Poisson ... 173

Aproximación de Poisson de la distribución binominal ... 176

Comparación de la distribución de Poisson y la distribución binomial ... 177

5.7. Distribución conjunta de variables aleatorias discretas ... 179

Aplicaciones informáticas ... 183

Covarianza ... 183

Correlación ... 184

Funciones lineales de variables aleatorias ... 186

Análisis de carteras ... 189

CAPÍTULO 6. Variables aleatorias continuas y distribuciones de probabilidad ... 201

6.1. Variables aleatorias continuas ... 202

La distribución uniforme ... 205

6.2. Esperanzas de variables aleatorias continuas ... 208

6.3. La distribución normal ... 211

Gráficos de probabilidades normales ... 220

6.4. La distribución normal como aproximación de la distribución binomial ... 225

(15)

6.5. La distribución exponencial ... 231

6.6. Distribución conjunta de variables aleatorias continuas ... 234

Combinaciones lineales de variables aleatorias ... 238

CAPÍTULO 7. Muestreo y distribuciones en el muestreo ... 249

7.1. Muestreo de una población ... 250

7.2. Distribuciones de las medias muestrales en el muestreo ... 254

Teorema del límite central ... 260

Intervalos de aceptación ... 265

7.3. Distribuciones de proporciones muestrales en el muestreo ... 272

7.4. Distribuciones de las varianzas muestrales en el muestreo ... 277

CAPÍTULO 8. Estimación: una población ... 295

8.1. Propiedades de los estimadores puntuales ... 296

Estimador insesgado ... 297

Estimador consistente ... 298

Estimador eficiente ... 298

8.2. Intervalos de confianza de la media: varianza poblacional conocida .... 302

Intervalos basados en la distribución normal ... 304

Reducción del margen de error ... 307

8.3. Intervalos de confianza de la media: varianza poblacional desconocida .... 309

Distribución t de Student ... 310

Intervalos basados en la distribución t de Student ... 312

8.4. Intervalos de confianza de proporciones de la población (grandes muestras) ... 315

CAPÍTULO 9. Estimación: otros temas ... 325

9.1. Intervalos de confianza de la diferencia entre las medias de dos poblaciones normales ... 326

Muestras dependientes ... 326

Muestras independientes, varianzas poblacionales conocidas ... 328

9.2. Intervalos de confianza de la diferencia entre las medias de dos poblacionales normales cuando las varianzas poblacionales son conocidas ... 331

Muestras independientes, varianzas poblacionales que se supone que son iguales ... 331

Muestras independientes, varianzas poblacionales que no se supone que sean iguales ... 334

9.3. Intervalos de confianza de la diferencia entre dos proporciones poblacionales (grandes muestras) ... 337

9.4. Intervalos de confianza de la varianza de una distribución normal ... 340

9.5. Elección del tamaño de la muestra ... 344

Media de una población que sigue una distribución normal, varianza poblacional conocida ... 344

Proporción poblacional ... 346

CAPÍTULO 10. Contraste de hipótesis ... 353

10.1. Conceptos del contraste de hipótesis ... 354

10.2. Contrastes de la media de una distribución normal: varianza poblacional conocida ... 360

(16)

p-valor ... 362

Hipótesis alternativa bilateral ... 369

10.3. Contrastes de la media de una distribución normal: varianza poblacional desconocida ... 372

10.4. Contrastes de la proporción poblacional (grandes muestras) ... 376

10.5. Valoración de la potencia de un contraste ... 380

Contrastes de la media de una distribución normal: variable poblacional conocida ... 380

Potencia de los contrastes de proporciones poblacionales (grandes muestras)... 383

CAPÍTULO 11. Contraste de hipótesis II ... 393

11.1. Contrastes de la diferencia entre dos medias poblacionales ... 394

Dos medias, datos pareados ... 395

Dos medias, muestras independientes, varianzas poblacionales conocidas ... 398

Dos medias, poblaciones independientes, varianzas desconocidas que se supone que son iguales ... 401

Dos medias, muestras independientes, varianzas poblacionales desconocidas que se supone que no son iguales ... 404

11.2. Contrastes de la diferencia entre dos proporciones poblacionales (grandes muestras) ... 408

11.3. Contrastes de la varianza de una distribución normal ... 412

11.4. Contrastes de la igualdad de las varianzas entre dos poblaciones distribuidas normalmente ... 416

11.5. Algunas observaciones sobre el contraste de hipótesis ... 420

CAPÍTULO 12. Regresión simple ... 431

12.1. Análisis de correlación ... 432

Contraste de hipótesis de la correlación ... 433

12.2. Modelo de regresión lineal ... 437

12.3. Estimadores de coeficientes por el método de mínimos cuadrados ... 442

Cálculo por ordenador del coeficiente de regresión ... 445

12.4. El poder explicativo de una ecuación de regresión lineal ... 448

El coeficiente de determinación R2 _... ₄₅₀

12.5. Inferencia estadística: contrastes de hipótesis e intervalos de confianza ... 456

Contraste de hipótesis del coeficiente de la pendiente poblacional utilizando la distribución F ... 463

12.6. Predicción ... 466

12.7. Análisis gráfico ... 472

CAPÍTULO 13. Regresión múltiple ... 487

13.1. El modelo de regresión múltiple ... 488

Especificación del modelo ... 488

Desarrollo del modelo ... 491

Gráficos tridimensionales ... 494

13.2. Estimación de coeficientes ... 496

Método de mínimos cuadrados ... 497

(17)

13.4. Intervalos de confianza y contrastes de hipótesis de coeficientes de

regresión individuales ... 511

Intervalos de confianza ... 513

Contrastes de hipótesis ... 515

13.5. Contrastes de los coeficientes de regresión ... 525

Contrastes de todos los coeficientes ... 525

Contraste de un conjunto de coeficientes de regresión ... 528

Comparación de los contrastes F y t ... 529

13.6. Predicción ... 533

13.7. Transformaciones de modelos de regresión no lineales ... 535

Transformaciones de modelos cuadráticos ... 536

Transformaciones logarítmicas ... 539

13.8. Utilización de variables ficticias en modelos de regresión ... 545

Diferencias entre las pendientes ... 548

13.9. Método de aplicación del análisis de regresión múltiple ... 553

Regresión múltiple ... 555

Efecto de la eliminación de una variable estadísticamente significativa ... 558

Análisis de los residuos ... 559

CAPÍTULO 14. Otros temas del análisis de regresión ... 575

14.1. Metodología para la construcción de modelos ... 576

Estimación de los coeficientes ... 577

Verificación del modelo ... 578

Interpretación del modelo e inferencia ... 579

14.2. Variables ficticias y diseño experimental ... 579

Modelos de diseño experimental ... 583

14.3. Valores retardados de las variables dependientes como regresores ... 591

14.4. Sesgo de especificación ... 596

14.5. Multicolinealidad ... 599

14.6. Heterocedasticidad ... 602

14.7. Errores autocorrelacionados ... 608

Estimación de las regresiones con errores autocorrelacionados ... 612

Errores autocorrelacionados en los modelos con variables dependientes retardadas ... 616

CAPÍTULO 15. Estadística no paramétrica ... 627

15.1. Contraste de signos e intervalo de confianza ... 628

Contraste de signos de muestras pareadas o enlazadas ... 628

Aproximación normal ... 631

Contraste de signos de una mediana poblacional ... 633

Intervalo de confianza de la mediana ... 634

15.2. Contraste de Wilcoxon basado en la ordenación de las diferencias .... 636

Minitab (contraste de Wilcoxon) ... 637

Aproximación normal ... 638

15.3. Contraste U de Mann-Whitney ... 641

15.4. Contraste de la suma de puestos de Wilcoxon ... 645

(18)

CAPÍTULO 16. Contrastes de la bondad del ajuste y tablas de contingencia ... 655

16.1. Contrastes de la bondad del ajuste: probabilidades especificadas ... 656

16.2. Contrastes de la bondad del ajuste: parámetros poblacionales desconocidos ... 661

Un contraste de normalidad ... 663

16.3. Tablas de contingencia ... 666

Aplicaciones informáticas ... 669

CAPÍTULO 17. Análisis de la varianza ... 681

17.1. Comparación de las medias de varias poblaciones ... 682

17.2. Análisis de la varianza de un factor ... 684

Modelo poblacional en el caso del análisis de la varianza de un factor ... 691

17.3. El contraste de Kruskal-Wallis ... 695

17.4. Análisis de la varianza bifactorial: una observación por celda, bloques aleatorizados ... 698

17.5. Análisis de la varianza bifactorial: más de una observación por celda ... 709

CAPÍTULO 18. Introducción a la calidad ... 729

18.1. La importancia de la calidad ... 730

Los líderes de la calidad ... 730

Variación ... 732

18.2. Gráficos de control de medias y desviaciones típicas ... 735

Una estimación de la desviación típica del proceso ... 736

Gráficos de control de medias ... 738

Gráficos de control de desviaciones típicas ... 740

Interpretación de los gráficos de control ... 741

18.3. Capacidad de un proceso ... 745

18.4. Gráfico de control de proporciones ... 749

18.5. Gráficos de control del número de ocurrencias ... 754

CAPÍTULO 19. Análisis de series temporales y predicción ... 763

19.1. Números índice ... 764

Índice de precios de un único artículo ... 766

Índice de precios agregado no ponderado ... 767

Índice de precios agregado ponderado ... 768

Índice de cantidades agregado ponderado ... 769

Cambio del periodo base ... 770

19.2. Un contraste no paramétrico de aleatoriedad ... 773

19.3. Componentes de una serie temporal ... 777

19.4. Medias móviles ... 780

Extracción del componente estacional por medio de medias móviles ... 783

19.5. Suavización exponencial ... 789

Modelo de predicción por medio de la suavización exponencial con el método Holt-Winters ... 792

Predicción de series temporales estacionales ... 796

19.6. Modelos autorregresivos ... 801

(19)

CAPÍTULO 20. Otros temas relacionados con el muestreo ... 811

20.1. Pasos básicos de un estudio realizado por muestreo ... 812

20.2. Errores de muestreo y errores ajenos al muestreo ... 817

20.3. Muestreo aleatorio simple ... 819

Análisis de los resultados de un muestreo aleatorio simple ... 820

20.4. Muestreo estratificado ... 825

Análisis de los resultados de un muestreo aleatorio estratificado ... 827

Afijación del esfuerzo muestral a los distintos estratos ... 833

20.5. Elección del tamaño de la muestra ... 837

Tamaño de la muestra para el muestreo aleatorio simple: estimación de la media o el total poblacional ... 838

Tamaño de la muestra para el muestreo aleatorio simple: estimación de la proporción poblacional ... 839

Tamaño de la muestra para un muestreo aleatorio estratificado con un grado de precisión especificado ... 840

20.6. Otros métodos de muestreo ... 843

Muestreo por conglomerados ... 843

Muestreo bietápico ... 847

Métodos de muestreo no probabilísticos ... 850

CAPÍTULO 21. Teoría estadística de la decisión ... 855

21.1. La toma de decisiones en condiciones de incertidumbre ... 856

21.2. Soluciones que no implican la especificación de probabilidades: criterio maximin, criterio de la pérdida de oportunidades minimax .... 859

Criterio maximin ... 860

Criterio de la pérdida de oportunidades minimax ... 862

21.3. Valor monetario esperado; TreePlan ... 864

Árboles de decisión ... 866

La utilización de TreePlan para resolver un árbol de decisión ... 868

Análisis de sensibilidad ... 872

21.4. Información muestral: análisis y valor bayesianos ... 876

Utilización del teorema de Bayes ... 876

El valor de la información muestral ... 881

El valor de la información muestral visto por medio de árboles de decisión.... 884

21.5. Introducción del riesgo: análisis de la utilidad ... 890

El concepto de utilidad ... 891

Criterio de la utilidad esperada para tomar decisiones ... 895

TABLAS DEL APÉNDICE 1. Función de distribución acumulada de la distribución normal estándar ... 899

2. Función de probabilidad de la distribución binomial ... 901

3. Probabilidades binomiales acumuladas ... 906

4. Valores de e.j_... ₉₁₀

5. Probabilidades de Poisson individuales ... 911

6. Probabilidades de Poisson acumuladas ... 919

7. Puntos de corte de la función de distribución ji-cuadrado ... 927

8. Puntos de corte de la distribución t de Student ... 928

(20)

10. Puntos de corte de la distribución del estadístico de contraste de

Wilcoxon ... 932 11. Puntos de corte de la distribución del coeficiente de correlación de

orden de Spearman ... 933 12. Puntos de corte de la distribución del estadístico de contraste de

Durbin-Watson ... 934 13. Constantes de los gráficos de control ... 936 14. Función de distribución acumulada del estadístico del contraste de

rachas ... 937

RESPUESTAS A ALGUNOS EJERCICIOS PARES ... 939

(21)

A

UDIENCIA A LA QUE VA DIRIGIDO

Estadística para los negocios y la economía (6.a _{edición) se ha escrito para satisfacer la}

necesidad de un libro de texto que ofrezca una buena introducción a la estadística para los negocios que permita comprender los conceptos y haga hincapié en la resolución de pro-blemas poniendo ejemplos realistas del mundo de la empresa y de la economía.

Programas de máster o de licenciatura que enseñen estadística para los negocios. Programas de doctorado y de licenciatura de economía.

Programas de MBA ejecutivo.

Cursos de doctorado de estadística empresarial.

C

ONTENIDO

Hemos escrito este libro con el fin de ofrecer una buena introducción a los métodos esta-dísticos aplicados para que sus lectores puedan realizar un sólido análisis estadístico en muchas situaciones empresariales y económicas. Hemos hecho hincapié en la comprensión de los supuestos que son necesarios para realizar un análisis profesional. Con los ordenado-res modernos, es fácil calcular a partir de los datos las salidas necesarias para muchos mé-todos estadísticos. Es tentador, pues, aplicar meramente sencillas «reglas» utilizando estas salidas, enfoque que se adopta en numerosos libros de texto. El nuestro es combinar los conocimientos con muchos ejemplos y ejercicios y mostrar que la comprensión de los mé-todos y de sus supuestos es útil para entender los problemas empresariales y económicos.

N

UEVO EN ESTA EDICIÓN

Hemos actualizado y ampliado la sexta edición de este libro para satisfacer mejor las nece-sidades de los usuarios y ofrecer más flexibilidad. En esta edición, hemos introducido im-portantes cambios y novedades. Éstos son:

Un nuevo diseño para la presentación de la estadística descriptiva.

En cada apartado, hemos añadido ejercicios básicos antes de los ejercicios aplicados. Hemos introducido nuevos ejercicios aplicados que colocan a los estudiantes en si-tuaciones empresariales reales poniendo el énfasis en las aplicaciones informáticas.

(22)

Hemos dividido el análisis de los intervalos de confianza y del contraste de hipótesis en un capítulo dedicado a una población y otro dedicado a dos poblaciones en res-puesta a las sugerencias de los usuarios y de los revisores.

Presentaciones revisadas y más claras de los métodos de regresión simple y múltiple. Presentamos el análisis de cartera utilizando valores correlacionados con un extenso número de ejercicios aplicados.

Hemos adoptado nuevos enfoques para presentar los datos utilizando imágenes grá-ficas.

A

LOS ESTUDIANTES

El CD-ROM que acompaña a este libro contiene todos los ficheros de datos utilizados en el libro que son necesarios para hacer los problemas y los ejercicios, así como el programa TreePlan y su documentación. El PowerPoint y otros ficheros relevantes pueden encontrar-se en la página web del libro (www.prenhall.com/newbold).

A

LOS PROFESORES

Los ficheros de las soluciones de los capítulos y las presentaciones en PowerPoint de este libro se encuentran en formato digital descargable. Visite el Instructor Resource Center en el catálogo de Prentice Hall (www.prenhall.com). Para registrarse con el fin de utilizar los recursos del Instructor Resource Center se necesita un código de acceso como educador de Pearson.

Cada vez mejor

Una vez que se registre, no tendrá que rellenar más formularios o recordar múltiples nom-bres de usuario y contraseñas para acceder a nuevos títulos y/o ediciones. Como profesor registrado, puede acceder directamente a los ficheros de recursos y recibir inmediatamente el acceso y las instrucciones para instalar en el servidor de su universidad el contenido del gestor del curso.

¿Necesita ayuda?

Contamos con un entregado equipo de apoyo técnico para ayudar a los profesores a re-solver cuestiones relacionadas con el material auxiliar que acompaña a este libro. Visite http://247.prenhall.com/ para las respuestas a las preguntas formuladas frecuentemente y los números de teléfono gratuitos de ayuda.

A

GRADECIMIENTOS

Nos gustaría dar las gracias a las siguientes personas que han revisado el libro y han hecho perspicaces sugerencias para esta edición:

Mr. C. Patrick Kohrman-Penn State University, Berks Campus James Thorson-Southern Connecticut State University

Mamnoon Jamil-Rutgers University, Camden Zhimin Huang-Adelphi University

(23)

Renee Fontenot-University of Texas, Permian Basin Allen Lynch-Mercer University

Bulent Uyar-University of Northern Iowa David Hudgins-University of Oklahoma Allan Lacayo-Diablo Valley College

J. Morgan Jones-University of North Carolina Eugene Allevato-Woodbury University Patricia Odell-Bryant University

Jay DeVore-California Polytechnic State University Valerie Bencivenga-University of Texas

Myles J. Callan-University of Virginia Andrew Narwold-University of San Diego Anthony Smith-Carnegie Mellon University Peter Baxendale-University of Southern California Steen Anderson-Aarhus School of Business, Denmark Eric Bentzen-Copenhagen Business School, Denmark Hans Geilnkirchen-Erasmus University, Netherlands Peter Reiss-Stanford University

David Hudgins-University of Oklahoma Robert Lemke-Lake Forest College Michael Gordinier-Washington University Fred Wenstop-Norwegian School of Management Sheri Aggarwal-University of Virginia

Jorgen Lauridsen-University of Southern Denmark Robert Gillette-University of Kentucky

Peter Boatwright-Carnegie Mellon Mark Kamstra-Simon Fraser

Albert Madansky-University of Chicago Jeff Russell-University of Chicago Nick Polsen-University of Chicago Aaron Smith-University of Virginia Yu-Chi Cheng-University of Notre Dame Professor Mohanty-California State, Los Angeles Ken Alexander-University of Southern California Mendy Fygenson-University of Southern California Matthew White-Stanford University

Stefanos Zenios-Stanford University

Lawrence Brown-Pennsylvania State University Abba Krieger-Pennsylvania State University Harvey Singer-George Mason

William Hausman-William and Mary University of Iowa Jim Swanson-Central Missouri University

C. Barry Pfitzner-Randolf-Macon College

También estamos agradecidos a Annie Puciloski que ha revisado la precisión de esta edición y especialmente a Sandra Krausman, GGS Production Services, por su ayuda y pericia.

Por lo que se refiere al St. Olaf College, debemos dar las gracias a Priscilla Hall, ayu-dante administrativo de St. Olaf, por la labor realizada en algunas partes del libro y su

(24)

dirección del trabajo de varios estudiantes que han colaborado en el libro, entre los que se encuentran Michael Loop, Holly Malcomson, Erin McMurtry, Nelly Schwinghammer, Catharina Zuber. Este libro no habría sido posible sin su colaboración.

Por lo que se refiere a Stetson University, también damos las gracias a Jim Scheiner, Paul Dascher, Marie Gilotti, Sean A. Thomas, John Tichenor y Emma Astrom y especial-mente a Jennie Bishop (Computer Programmer Analyst II, State of Florida, Volusia

Coun-ty Health Department).

Agradecemos, además, especialmente a nuestras familias su apoyo durante las numero-sas horas dedicadas a este libro. Bill Carlson da las gracias especialmente a su mujer Char-lotte y a sus hijos adultos Andrea, Douglas y Larry. Betty Thorne da las gracias especial-mente a su marido Jim y a sus hijos adultos Jennie Bishop, Ann Thorne, Renee Payne y Jon Thorne; así como a Marius, Mihaela, Cezara y Anda Sabou.

Los autores agradecen las sólidas bases y tradición creadas por el autor original, Paul Newsbold. Paul comprendió la importancia del análisis estadístico riguroso y de sus funda-mentos. Se dio cuenta de que hay algunas complejas ideas que es necesario desarrollar y se esforzó en ofrecer explicaciones claras de difíciles ideas. Además, estas ideas sólo son úti-les cuando se utilizan para resolver problemas realistas. En ediciones anteriores, se in-cluyeron, pues, muchos ejemplos y muchos ejercicios aplicados. Nos hemos esforzado en mantener y ampliar esta tradición para hacer un libro que satisfaga las necesidades de los futuros líderes empresariales en la era de la información.

Si el lector tiene alguna sugerencia o corrección, puede ponerse en contacto con los autores a través del correo electrónico en [email protected]; [email protected].

(25)

1.2. El muestreo

1.3. Estadı´stica descriptiva e inferencial Descripción de los datos

Realización de inferencias

Introducción

En nuestra era de la información, el mundo abunda en datos. En los artículos de los periódicos y en los reportajes de la televisión, se hacen afirmaciones como «El Dow Jo-nes ha caído 6 puntos hoy» o «El índice de precios de consumo subió un 0,8 por ciento el mes pasado» o «la última encuesta indica que la tasa de aprobación del presidente es hoy de un 63 por ciento» o «El 98 por ciento de los pacientes de un estudio clínico no experimentó ningún efecto secundario significativo con un nuevo medicamento contra el cáncer de mama». Cada vez es más frecuente que para hacer una valoración inteligente de los acontecimientos actuales, necesitemos asimilar e interpretar una cantidad consi-derable de datos. La Administración, las empresas y los investigadores científicos gas-tan miles de millones de dólares en la recogida de datos. La Administración ha contribui-do a ello, tanto recogiencontribui-do datos ella misma como obligancontribui-do a las empresas a dar información. El sector privado también ha tenido que ver en ello. Las aireadas encuestas Gallup de las actitudes de los votantes y los índices de audiencia de Nielsen de los pro-gramas de televisión de la semana no son más que la punta de un enorme iceberg de estudios de mercado. La cantidad de datos recogidos ha aumentado a un ritmo extraor-dinario en los últimos años.

Debemos explicar todos los datos. La era de la informática nos ha permitido tanto procesar, resumir y analizar rápidamente los datos como producir y almacenar más da-tos. Los computadores ponen al alcance de la mano muchos datos, como las cotizacio-nes bursátiles. Debemos analizarlos e interpretarlos correctamente.

(26)

1.1. La toma de decisiones en un entorno incierto

Las decisiones a menudo se basan en información incompleta. Por ejemplo, se supone que los estudiantes universitarios de primer año, cuando son admitidos en la universidad, selec-cionan una carrera. Sin embargo, muchos de estos estudiantes pueden no tener una meta profesional clara. Por poner otro ejemplo, los enfermos de cáncer pueden ser invitados a participar en un estudio clínico para probar un nuevo medicamento experimental (véase re-ferencia bibliográfica 1) cuando aún no se dispone de información sobre los efectos secun-darios, las tasas de supervivencia y las tasas de recurrencia de esta nueva medicación. Asi-mismo, las decisiones empresariales normalmente se toman en un entorno en el que los responsables de tomarlas no pueden estar seguros de la futura conducta de los factores que acabarán afectando al resultado de las distintas opciones consideradas.

Cuando un fabricante presenta una oferta para hacerse con un contrato, no está total-mente seguro de cuáles serán los costes totales ni de qué ofertas presentarán los competi-dores. A pesar de esta incertidumbre, debe hacer una oferta. Un inversor no sabe con segu-ridad si los mercados financieros estarán boyantes, estables o deprimidos. No obstante, debe elegir las acciones, los bonos y los instrumentos del mercado de dinero de manera que su cartera esté equilibrada sin saber cómo evolucionará el mercado en el futuro.

Consideremos las siguientes afirmaciones:

«El precio de las acciones de IBM será más alto dentro de seis meses que ahora». «Si el déficit presupuestario público es tan elevado como se prevé, los tipos de interés se mantendrán altos el resto del año».

«La renta anual de un titulado universitario será mayor que la renta anual de una per-sona que no tenga estudios universitarios».

Cada una de estas afirmaciones contiene un lenguaje que sugiere la existencia de una cantidad espuria de certeza. En el momento en el que se hicieron las afirmaciones, era im-posible estar seguro de que eran ciertas. Aunque un analista crea que lo que ocurrirá en los próximos meses será tal que se prevé que el precio de las acciones de IBM subirá durante ese periodo, no estará seguro de eso. Por lo tanto, las afirmaciones deben modificarse co-mo indican los siguientes ejemplos:

«El precio de las acciones de IBM probablemente será más alto dentro de seis meses que ahora».

«Si el déficit presupuestario público es tan elevado como se prevé, es probable que los tipos de interés se mantengan altos durante el resto del año».

«La renta anual de un titulado universitario probablemente será mayor que la renta anual de una persona sin estudios universitarios».

Es muy importante pensar bien cómo se dicen las cosas. No es correcto sustituir las afirmaciones injustificadamente precisas por afirmaciones innecesariamente vagas. Al fin y al cabo, ¿qué significa «probablemente» o «es probable que»? Debe ponerse especial cui-dado en expresar las ideas que se pretende expresar, sobre todo cuando se trata de probabi-lidades o cuando hay incertidumbre.

EJERCICIOS Ejercicios básicos

1.1. Modifique las afirmaciones siguientes para que re-flejen una posible incertidumbre:

a) El mejor instrumento para mejorar la cuota de mercado de este producto es una campaña pu-blicitaria destinada al grupo de edad 18-24 años.

(27)

b) Si se presenta una oferta de esta cuantía, será más baja que las del competidor y el contrato estará asegurado.

c) El coste de la gasolina será más alto en Esta-dos UniEsta-dos dentro de 2 meses.

1.2. Ponga un ejemplo de una decisión de comerciali-zación que debe tomarse en condiciones de incer-tidumbre.

1.3. Ponga un ejemplo de una decisión financiera que debe tomarse en condiciones de incertidumbre.

1.2. El muestreo

Antes de introducir un nuevo producto en el mercado, su fabricante quiere saber cuál será el nivel probable de demanda y es posible que realice una encuesta de mercado. Lo que le interesa, en realidad, son todos los compradores potenciales (la población). Sin embargo, las poblaciones a menudo son tan grandes que es difícil analizarlas; sería imposible o prohibitivo recoger toda la información de una población. Incluso en las circunstancias en las que parece que se dispone de suficientes recursos, las limitaciones de tiempo obligan a examinar un subconjunto (muestra).

Población y muestra

Una población es el conjunto completo de todos los objetos que interesan a un investigador. El tamaño de la población, N, puede ser muy grande o incluso infinito. Una muestra es un subconjunto observado de valores poblacionales que tiene un tamaño muestral que viene dado por n.

Ejemplos de poblaciones son:

Todos los votantes inscritos en un país. Todos los estudiantes de una universidad. Todas las familias que viven en una ciudad.

Todas las acciones que cotizan en una bolsa de valores.

Todas las reclamaciones que recibe en un año dado una compañía de seguros médicos. Todas las cuentas pendientes de cobro de una empresa.

Nuestro objetivo final es hacer afirmaciones basadas en datos muestrales que tengan al-guna validez sobre la población en general. Necesitamos, pues, una muestra que sea repre-sentativa de la población. ¿Cómo podemos lograrlo? Uno de los principios importantes que debemos seguir en el proceso de selección de la muestra es la aleatoriedad.

Muestreo aleatorio

El muestro aleatorio simple es un método que se emplea para seleccionar una muestra de n objetos de una población en el que cada miembro de la población se elige estrictamente al azar, cada miembro de la población se elige con la misma probabilidad y todas las muestras posibles de un tamaño dado, n, tienen la misma probabilidad de ser seleccionadas. Este méto-do es tan frecuente que generalmente se suprime el adjetivo simple y la muestra resultante se denomina muestra aleatoria.

El muestreo se utiliza mucho en todas las áreas de los negocios, así como en otras dis-ciplinas. Para averiguar si un proceso de producción está funcionando correctamente, se se-lecciona una muestra de bienes producidos. Las auditorías de las cuentas pendientes de co-bro generalmente se basan en una muestra. Durante los años de elecciones presidenciales, se hacen estimaciones de las preferencias de los votantes a partir de muestras de votantes;

(28)

también puede hacerse una encuesta a la salida de los colegios electorales para predecir qué candidato obtendrá más votos. Sin embargo, tomar una muestra es meramente un me-dio para llegar a un fin. Necesitamos estudiar estadística, no para hacer afirmaciones

so-bre la muestra sino, más bien, para extraer conclusiones soso-bre la población en general. La

estadística es el estudio de cómo se toman decisiones sobre una población cuando la infor-mación procede de una muestra. Siempre quedará alguna incertidumbre.

Supongamos que queremos saber cuál es la edad media de los votantes de un país. Es evidente que el tamaño de la población es tan grande que sólo podríamos tomar una mues-tra aleatoria, por ejemplo, 500 votantes, y calcular su edad media. Como esta media se ba-sa en datos muestrales, se llama estadístico. Si pudiéramos calcular la edad media de toda la población, la media resultante se llamaría parámetro. En este libro veremos cómo se to-man decisiones sobre un parámetro, basándose en un estadístico. Debemos darnos cuenta de que siempre habrá una cierta incertidumbre, ya que no se conoce el valor exacto del parámetro.

Parámetro y estadístico

Un parámetro es una característica específica de una población. Un estadístico es una carac-terística específica de una muestra.

1.4. Ponga un ejemplo de un parámetro en cada una de las siguientes poblaciones:

a) Las rentas de todas las familias que viven en una ciudad.

b) Los rendimientos anuales de todas las acciones que cotizan en una bolsa de valores.

c) Los costes de todas las reclamaciones que reci-be en un año dado una compañía de seguros médicos.

d) Los valores de todas las cuentas pendientes de cobro de una empresa.

1.5. Su universidad ha encuestado a sus estudiantes pa-ra averiguar el tiempo semanal medio que dedican a navegar por Internet.

a) ¿Cuál es la población? b) ¿Cuál es la muestra? c) ¿Cuál es el estadístico?

d) ¿Es el valor de 6,1 horas un parámetro o un es-tadístico?

1.6. Una compañía aérea sostiene que menos de un 1 por ciento de los vuelos programados que despe-gan del aeropuerto de Nueva York sale tarde. Se ha observado que el 1,5 por ciento de una muestra aleatoria de 200 vuelos salió más tarde de la hora prevista.

a) ¿Cuál es la población? b) ¿Cuál es la muestra? c) ¿Cuál es el estadístico?

d) ¿Es 1,5 por ciento un parámetro o un estadís-tico?

1.3. Estadı´stica descriptiva e inferencial

Para pensar en términos estadísticos hay que seguir una serie de pasos que van desde la definición del problema hasta la toma de decisiones. Una vez identificado y definido el problema, se recogen datos producidos mediante diversos procesos de acuerdo con un dise-ño y se analizan utilizando uno o más métodos estadísticos. De este análisis se obtiene in-formación. La información se convierte, a su vez, en conocimiento, utilizando los resulta-dos de las experiencias específicas, la teoría y la literatura y aplicando métoresulta-dos estadísticos adicionales. Para convertir los datos en un conocimiento que lleva a tomar mejores decisio-nes se utiliza tanto la estadística descriptiva como la inferencial.

(29)

Estadística descriptiva e inferencial

La estadística descriptiva está formada por los métodos gráficos y numéricos que se utilizan para resumir y procesar los datos y transformarlos en información. La estadística inferencial constituye la base para hacer predicciones, previsiones y estimaciones que se utilizan para transformar la información en conocimiento.

Descripción de los datos

En el ejemplo 1.1 vemos una tabla de la producción diaria de una fábrica de cereales.

E

JEMPLO

1.1.

Producción de cereales (estadística descriptiva)

Un jefe de producción de Cereales de Trigo formó un equipo de empleados para estu-diar el proceso de producción de cereales. Durante la primera fase del estudio, se pesó una selección aleatoria de cajas y se midió la densidad del producto. A continuación, el jefe quería estudiar datos relacionados con las pautas de producción diaria. Se hallaron los niveles de producción (en miles) de un periodo de 10 días. Represente estos resulta-dos gráficamente y comente sus observaciones:

Día 1 2 3 4 5 6 7 8 9 10

Cajas (miles) 84 81 85 82 85 84 109 110 60 63

Solución

En la Figura 1.1, el jefe de producción puede identificar los días de baja producción, así como los días de mayor producción.

Producción diaria de cereales

0 20 40 60 80 100 120 0 2 4 6 8 10 12 Día Cajas (miles)

Figura 1.1. Producción diaria de cereales de trigo.

No parecía que hubiera mucha diferencia en el número de cajas producidas en los seis primeros días. Había variaciones de un día a otro, pero los seis puntos tenían valo-res numéricos muy parecidos. Sin embargo, en los días 7 y 8 el nivel de producción pa-recía que era más alto. En cambio, en los días 9 y 10 papa-recía que era más bajo. Basán-dose en estas observaciones, el equipo intentó identificar las causas por las que la productividad era más alta y más baja. Por ejemplo, tal vez en los días 9 y 10 estuvieran ausentes trabajadores clave o hubiera cambiado el método de producción o hubieran cambiado las materias primas. También se podrían identificar las causas por las que aumentó la productividad en los días 7 y 8.

(30)

Realización de inferencias

La estadística inferencial es un proceso, no un mero resultado numérico. Este proceso pue-de consistir en una estimación, un contraste pue-de hipótesis, un análisis pue-de relaciones o una predicción. En primer lugar, podemos querer estimar un parámetro. Supongamos que Flo-rin’s Flower Mart quiere desarrollar una nueva estrategia de comercialización. Podría ser útil la información sobre los hábitos de gasto de los clientes de la floristería. Florin puede querer:

Estimar la edad media de los clientes de la tienda.

Estimar la diferencia entre la cantidad media que los clientes cargan a una Visa y la cantidad media que cargan a American Express.

Estimar la proporción de clientes que están insatisfechos con el sistema de reparto de la tienda.

En segundo lugar, podemos querer contrastar una hipótesis sobre un parámetro. Por ejemplo, Florin puede querer:

Contrastar si los clientes tienen este año una preferencia por el color de las rosas dis-tinta a la del año pasado.

Contrastar si menos del 25 por ciento de los clientes de la tienda son turistas. Contrastar si las ventas son mayores los fines de semana que el resto de los días de la semana.

Contrastar si la cantidad media que gastaron los clientes en su última compra superó los 40 $.

Las respuestas a estos tipos de preguntas pueden ayudar a Florin a lanzar una campaña publicitaria que le permita reducir los costes, incrementar los beneficios y aumentar la sa-tisfacción de los clientes.

En tercer lugar, podemos querer analizar las relaciones entre dos o más variables. El director financiero de General Motors quiere tomar decisiones estratégicas que afectan a toda la compañía. En esos casos, puede utilizar series de datos macroeconómicos de los que puede disponerse en fuentes como el Bureau of Economic Analysis del Departamento de Comercio de Estados Unidos para analizar las relaciones entre variables como el pro-ducto interior bruto, el tipo de interés, la renta per cápita, la inversión total y la oferta mo-netaria, que indican la situación general de la economía nacional. El director financiero puede hacerse las siguientes preguntas:

¿Influye la tasa de crecimiento de la oferta monetaria en la tasa de inflación? Si General Motors sube un 5 por ciento el precio de los automóviles de tamaño inter-medio, ¿cómo afectará la subida a las ventas de estos automóviles?

¿Afecta la legislación sobre el salario mínimo al nivel de desempleo?

¿Cómo se comienza a responder a la pregunta sobre el efecto que puede producir una subida de los precios en la demanda de automóviles? La teoría económica básica nos dice que, manteniéndose todo lo demás constante, una subida del precio va acompañada de una reducción de la cantidad demandada. Sin embargo, esa teoría es puramente cualitativa. No nos dice cuánto disminuye la cantidad demandada. Para avanzar más, hay que recoger in-formación sobre cómo ha respondido la demanda a las variaciones del precio en el pasado y evaluarla. Estudiando estadística inferencial, aprenderemos a recoger información y a analizar relaciones.

En cuarto lugar, podemos necesitar predecir, es decir, hacer predicciones fiables. Las decisiones de inversión deben hacerse mucho antes de que pueda llevarse un nuevo

(31)

producto al mercado y, evidentemente, es deseable tener predicciones de la situación en la que se encontrará probablemente el mercado dentro de unos años. Cuando los productos están consolidados, las predicciones sobre las ventas a corto plazo son importantes para decidir los niveles de existencias y los programas de producción. Las predicciones de los futuros tipos de interés son importantes para una empresa que tiene que decidir si emite o no nueva deuda. Para formular una política económica coherente, el gobierno necesita dicciones de los resultados probables de variables como el producto interior bruto. Las pre-dicciones de los futuros valores dependen de las regularidades descubiertas en la conducta anterior de estas variables. Por lo tanto, se recogen datos sobre la conducta anterior de la variable que va a predecirse y sobre la conducta de otras variables relacionadas con ella. Utilizaremos la estadística inferencial para analizar esta información y sugerir entonces las tendencias futuras probables.

1.7. Suponga que es dueño de una tienda de alimenta-ción.

a) Ponga un ejemplo de una pregunta que podría responderse utilizando la estadística descriptiva. b) Ponga un ejemplo de una pregunta en la que

sería útil estimar un parámetro.

c) Ponga un ejemplo de una pregunta sobre una posible relación entre dos variables que tienen interés para su tienda de alimentación.

d) Ponga un ejemplo de una cuestión en la que hay que hacer una predicción.

1.8. Averigu¨e si debe utilizarse la estadística descripti-va o la inferencial para obtener la siguiente infor-mación:

a) Un gráfico que muestra el número de botellas defectuosas producidas durante el turno de día a lo largo de una semana.

b) Una estimación del porcentaje de empleados que llegan tarde a trabajar.

c) Una indicación de la relación entre los años de experiencia de los empleados y la escala sa-larial.

RESUMEN Las decisiones deben tomarse en condiciones de

incer-tidumbre. Todas las áreas de negocios, así como otras disciplinas, utilizan la estadística para tomar esas deci-siones. Los contables pueden necesitar seleccionar muestras para realizar auditorías. Los inversores finan-cieros utilizan la estadística para comprender las fluc-tuaciones del mercado y elegir entre varias inversiones de cartera. Los directivos que quieren saber si los clien-tes están satisfechos con los productos o los servicios de su compañía pueden utilizar encuestas para averi-guarlo. Los ejecutivos de marketing pueden querer

in-formación sobre las preferencias de los clientes, sus há-bitos de compra o las características demográficas de los compradores por Internet. En cada una de estas si-tuaciones, debemos definir meticulosamente el proble-ma, averiguar qué datos se necesitan, recogerlos, resu-mirlos y hacer inferencias y tomar decisiones basadas en los datos obtenidos. La teoría estadística es esencial desde la definición inicial del problema hasta la deci-sión final y puede llevar a reducir los costes, a obtener más beneficios, a mejorar los procesos y a aumentar la satisfacción de los clientes.

TÉRMINOS CLAVE estadística descriptiva, 5 estadística inferencial, 5 estadístico, 4 muestra, 3 muestra aleatoria, 3

muestreo aleatorio simple, 3

parámetro, 4 población, 3

(32)

EJERCICIO Y APLICACIÓN DEL CAPÍTULO 1.9. Se hizo a una muestra aleatoria de 100

estu-diantes universitarios una serie de preguntas para obtener datos demográficos sobre su nacionalidad, la especialización cursada, el sexo, la edad, el cur-so en el que están y su nota media hasta ese mo-mento. También se les hizo otras preguntas sobre su grado de satisfacción con el aparcamiento del campus universitario, las residencias del campus y los comedores del campus. Las respuestas a estas preguntas sobre su satisfacción se midieron en una escala de 1 a 5, donde 5 era el nivel de satisfac-ción más alto. Por último, se les preguntó si,

cuan-do se graduaran, tenían intención de seguir estu-dios de postgrado en un plazo de 5 años (0: no; 1: sí). Estos datos se encuentran en el fichero de da-tos Findstad and Lie Study.

a) Ponga un ejemplo de cómo se aplica la estadís-tica descriptiva a estos datos.

b) Ponga un ejemplo de una pregunta que conlle-ve una estimación a la que podría responderse por medio de la estadística inferencial. c) Ponga un ejemplo de una relación posible entre

dos variables.

Bibliografı´a

1. The North American Fareston versus Tamoxifen Adjuvant Trial for Breast Cancer. www.naftatrial.com.

(33)

Categóricas o numéricas Niveles de medición

2.2. Gráficos para describir variables categóricas Tablas

Gráficos de barras y gráficos de tarta Diagramas de Pareto

2.3. Gráficos para describir datos de series temporales 2.4. Gráficos para describir variables numéricas

Distribuciones de frecuencias Histogramas y ojivas

Diagramas de tallo y hojas

2.5. Tablas y gráficos para describir relaciones entre variables Diagramas de puntos dispersos

Tablas cruzadas

2.6. Errores en la presentación de datos Histogramas engañosos

Gráficos de series temporales engañosos

Introducción

Una vez que definimos con cuidado un problema, necesitamos recoger datos. A menudo el número de observaciones recogidas es tan grande que los resultados efectivos del estudio no están claros. Nuestro objetivo en este capítulo es resumir los datos de mane-ra que tengamos una imagen clamane-ra y precisa. Queremos reducir lo más posible una ma-sa de datos, evitando al mismo tiempo la posibilidad de ocultar características importan-tes por reducirlos excesivamente. Por desgracia, no existe una única «manera correcta» de describir los datos. La línea de ataque adecuada normalmente es específica de cada problema y depende de dos factores: el tipo de datos y el fin del estudio.

Se ha dicho que una imagen vale más que mil palabras. Asimismo, un gráfico vale más que mil cifras. En este capítulo, introducimos tablas y gráficos que nos ayudan a comprender mejor los datos y que constituyen una ayuda visual para tomar mejores decisiones. Los informes mejoran con la inclusión de tablas y gráficos adecuados, como distribuciones de frecuencia, gráficos de barras, gráficos de tarta, diagramas de Pareto, gráficos de series temporales, histogramas, diagramas de tallo y hojas u ojivas. La vi-sualización de los datos es importante. Siempre debemos preguntarnos qué sugiere el gráfico sobre los datos, qué es lo que vemos.

La comunicación a menudo es la clave del éxito y la comunicación de datos no es una excepción. El análisis y la interpretación correctos de los datos son esenciales para comunicar los resultados de una manera que tenga sentido. Los gráficos y los diagra-mas pueden mejorar nuestra comunicación de los datos a los clientes, los proveedores, los consejos de administración u otros grupos. En capítulos posteriores presentaremos métodos numéricos para describir los datos.

(34)

2.1. Clasificación de las variables

Las variables pueden clasificarse de varias formas. Uno de los métodos de clasificación se refiere al tipo y la cantidad de información que contienen los datos. Los datos son categóri-cos o numéricategóri-cos. Otro método consiste en clasificar los datos por niveles de medición, dan-do variables cualitativas o cuantitativas.

Categóricas o numéricas

Las variables categóricas producen respuestas que pertenecen a grupos o categorías. Por ejemplo, las respuestas a preguntas sí/no son categóricas. Las respuestas a «¿Tiene usted teléfono móvil?» y «¿Ha estado alguna vez en Oslo?» se limitan a un sí o un no. Una com-pañía de seguros médicos puede clasificar las reclamaciones incorrectas según el tipo de errores, como los errores de procedimiento y diagnóstico, los errores de información al pa-ciente y los errores contractuales. Otros ejemplos de variables categóricas son las preguntas sobre el sexo, el estado civil y la carrera universitaria. A veces, las variables categóricas permiten elegir entre varias opciones, que pueden ir desde «totalmente en desacuerdo» has-ta «tohas-talmente de acuerdo». Consideremos, por ejemplo, una evaluación del profesorado en la que los estudiantes tienen que responder a afirmaciones como «El profesor de este curso es un buen profesor» (1: totalmente en desacuerdo; 2: un poco en desacuerdo; 3: ni de acuerdo ni en desacuerdo; 4: un poco de acuerdo; 5: totalmente de acuerdo).

Las variables numéricas pueden ser variables discretas o variables continuas. Una

va-riable numérica discreta puede tener (pero no necesariamente) un número finito de

valo-res. Sin embargo, el tipo más frecuente de variable numérica discreta con el que nos en-contraremos produce una respuesta que proviene de un proceso de recuento. Ejemplos de variables numéricas discretas son el número de estudiantes matriculados en una clase, el número de créditos universitarios obtenidos por un estudiante al final de un cuatrimestre, el número de acciones de Microsoft que contiene la cartera de un inversor y el número de reclamaciones de indemnizaciones presentado tras un huracán.

Una variable numérica continua puede tomar cualquier valor de un intervalo dado de números reales y normalmente proviene de un proceso de medición (no de recuento). Ejemplos de variables numéricas continuas son la altura, el peso, el tiempo, la distancia y la temperatura. Una persona puede decir que mide 1,89 metros, pero en realidad puede te-ner una estatura de 1,81, 1,79 o algún otro número similar, dependiendo de la precisión del instrumento utilizado para medir la estatura. Otros ejemplos de variables numéricas conti-nuas son el peso de las cajas de cereales, el tiempo que se hace una persona en una carrera y la distancia entre dos ciudades. En todos los casos, el valor podría desviarse dentro de un cierto margen, dependiendo de la precisión del instrumento de medición utilizado. En las conversaciones diarias tendemos a truncar las variables y a tratarlas como si fueran varia-bles discretas sin pensarlo ni siquiera dos veces. Sin embargo, la diferencia es muy impor-tante en estadística, ya que es uno de los factores de los que depende que un método esta-dístico sea mejor que otro en un determinado caso.

Niveles de medición

También podemos dividir los datos en cualitativos y cuantitativos. Con datos cualitativos, la «diferencia» entre los números no tiene ningún significado mensurable. Por ejemplo, si a un jugador de baloncesto se le asigna el número «20» y a otro el número «10», no

(35)

pode-mos extraer la conclusión de que el primero es el doble de bueno que el segundo. Sin em-bargo, con datos cuantitativos la diferencia entre los números tiene un significado mensura-ble. Cuando un estudiante obtiene una puntuación de 90 en un examen y otro obtiene una puntuación de 45, la diferencia es mensurable y tiene un significado.

Veremos que los datos cualitativos pueden ser niveles de medición nominales y ordina-les. Los datos cuantitativos pueden ser niveles de medición basados en intervalos y en ra-zones.

Los niveles de medición nominales y ordinales se refieren a los datos que se obtienen con preguntas categóricas. Las respuestas a preguntas sobre el sexo, el país de origen, la afiliación política y la propiedad de un teléfono móvil son nominales. Se considera que los datos nominales son el tipo de datos más bajo o más débil, ya que la identificación numéri-ca se elige estrictamente por comodidad.

Los valores de las variables nominales son palabras que describen las categorías o cla-ses de respuestas. Los valores de la variable sexo son hombre y mujer; los valores de «¿Ha estado alguna vez en Oslo?» son «sí» y «no». Asignamos arbitrariamente un código o un número a cada respuesta. Sin embargo, este número no se emplea más que para clasificar. Por ejemplo, podríamos codificar las respuestas sobre el sexo o las respuestas sí/no de la forma siguiente:

1 % Hombres 1 % Sí 2 % Mujeres 2 % No

Los datos ordinales indican el orden que ocupan los objetos y, al igual que en el caso de los datos nominales, los valores son palabras que describen las respuestas. He aquí algu-nos ejemplos de datos ordinales y de códigos posibles:

1. Valoración de la calidad del producto (1: malo; 2: medio; 3: bueno).

2. Valoración de la satisfacción con el servicio de comedor de la universidad (1: muy

insatisfecho; 2: moderadamente insatisfecho; 3: ninguna opinión; 4: moderada-mente satisfecho; 5: muy satisfecho).

3. Preferencia de los consumidores entre tres tipos de bebidas refrescantes (1: el que

más se prefiere; 2: segunda opción; 3: tercera opción).

En estos ejemplos, las respuestas son ordinales, es decir, siguen un orden, pero la «diferen-cia» entre ellas no tiene ningún significado mensurable. Es decir, la diferencia entre la pri-mera opción y la segunda puede no ser igual que la diferencia entre la segunda y la tercera. Los niveles de medición basados en intervalos y en razones se refieren a los datos en una escala ordenada, en la que la diferencia entre las mediciones tiene un significado. Una escala de intervalos indica el orden y la distancia con respecto a un cero arbitrario medidos en intervalos unitarios. Es decir, se ofrecen datos en relación con un nivel de referencia determinado arbitrariamente. La temperatura es un ejemplo clásico de este nivel de medi-ción; los niveles de referencia determinados arbitrariamente se basan, en general, en los grados Fahrenheit o Celsius. Supongamos que hace 80 grados Fahrenheit en Orlando (Flo-rida) y sólo 20 en St. Paul (Minnesota). Podemos extraer la conclusión de que la diferencia de temperatura es de 60 grados, pero no podemos saber si hace el cuádruple de calor en Orlando que en St. Paul. Supongamos que cuando se estableció la temperatura Fahrenheit, el punto de congelación se fijó en 500 grados. En ese caso, en nuestro ejemplo de la tem-peratura de Orlando y St. Paul, ésta habría sido de 548 grados en Orlando y de 488 en St. Paul (la diferencia sigue siendo de 60 grados). El año es otro ejemplo de un nivel de medi-ción basado en intervalos; en este caso los niveles de referencia se basan en el calendario gregoriano o en el islámico.

(36)

Los datos basados en una escala de razones sí indican tanto el orden como la distancia con respecto a un cero natural y los cocientes entre dos medidas tienen un significado. Una persona que pesa 80 kilos pesa el doble que una que pesa 40; una persona que tiene 40 años es el doble de vieja que una que tiene 20.

Después de recoger datos, primero tenemos que clasificar las respuestas en categóricas o numéricas o según la escala de medición. A continuación, asignamos un número arbitra-rio a cada respuesta. Algunos gráficos se utilizan generalmente para las variables categóri-cas y otros son adecuados para las variables numéricategóri-cas.

Obsérvese que los ficheros de datos normalmente contienen «valores perdidos». Por ejemplo, los encuestados pueden decidir no responder en un cuestionario a ciertas pregun-tas sobre el sexo, la edad, la renta o algún otro tema delicado. Los valores perdidos requie-ren un código especial en la fase de introducción de los datos. Si no se resuelve correcta-mente la cuestión de los valores perdidos, es posible que el resultado sea erróneo. Los paquetes estadísticos resuelven la cuestión de los valores perdidos de diferentes formas.

2.1. Indique si cada una de las siguientes variables es categórica o numérica. Si es categórica, indique el nivel de medición. Si es numérica, ¿es discreta o continua?

a. Número de mensajes de correo electrónico en-viados diariamente por un planificador finan-ciero.

b) Coste efectivo de los libros de texto de un es-tudiante para un cuatrimestre.

c) Su factura mensual de electricidad.

d) Las categorías de profesores universitarios (pro-fesor, profesor asociado, profesor ayudante, profesor colaborador).

2.2. La oficina de relaciones públicas de un equipo de baloncesto profesional quiere información sobre los aficionados que acuden a los partidos después de la temporada. En los partidos que se celebran después de la temporada, se entrega a la entrada un cuestionario a cada aficionado. ¿Es la respuesta a cada una de las siguientes preguntas categórica o numérica? Si es categórica, indique el nivel de medición. Si es numérica, ¿es discreta o continua? a) ¿Tiene usted una entrada de temporada? b) ¿Vive en el condado de Orange?

c) ¿Cuánto le costó realmente la entrada para este partido de después de temporada?

2.3. En una facultad universitaria se ha repartido un cuestionario entre los estudiantes para averiguar su grado de satisfacción con diversas actividades y servicios. Por ejemplo, por lo que se refiere al «método de matriculación para las clases del pró-ximo cuatrimestre», se pide a los estudiantes que pongan una cruz en una de las casillas siguientes:

$ muy satisfecho

$ moderadamente satisfecho $ neutral

$ moderadamente insatisfecho $ muy insatisfecho

¿Es la respuesta de un estudiante a esta pregunta numérica o categórica? Si es numérica, ¿es discre-ta o continua? Si es categórica, indique el nivel de medición.

2.4. En una encuesta reciente se pidió al profesorado de una universidad que respondiera a una serie de preguntas. Indique el tipo de datos de cada pre-gunta.

a) Indique su nivel de satisfacción con la carga docente (muy satisfecho; moderadamente satis-fecho; neutral; moderadamente insatissatis-fecho; muy insatisfecho).

b) ¿Cuántos artículos ha publicado en revistas con evaluación anónima durante el último año? c) ¿Ha asistido a la última reunión del consejo de

departamento?

d) ¿Cree usted que el proceso de evaluación de la docencia debe revisarse?

2.5. Se ha formulado una serie de preguntas a una muestra de clientes de una tienda de helados. Identifique el tipo de datos que se pide en cada pregunta.

a) ¿Cuál es su sabor favorito?

b) ¿Cuántas veces al mes toma helado?

c) ¿Tiene hijos de menos de 10 años que vivan en casa?

d) ¿Ha probado el último sabor de helado? 2.6. La comunidad de propietarios de viviendas ha

(37)

una urbanización. Identifique el tipo de datos que se pide en cada pregunta.

a) ¿Jugó al golf el mes pasado en el nuevo campo de golf de la urbanización?

b) ¿Cuántas veces ha comido en el restaurante de la urbanización en los tres últimos meses? c) ¿Tiene usted una caravana?

d) Valore el nuevo sistema de seguridad de la urbanización (muy bueno, bueno, malo, muy malo).

Ejercicios aplicados

2.7. En una universidad se realizó una encuesta a los estudiantes para obtener información sobre varias cuestiones relacionadas con la biblioteca. Los datos se encuentran en el fichero de datos Library.

a) Ponga un ejemplo de una variable categórica con respuestas ordinales.

b) Ponga un ejemplo de una variable categórica con respuestas nominales.

c) Ponga un ejemplo de una variable numérica con respuestas discretas.

2.8. Un grupo de estudiantes de administración de empresas realizó una encuesta en su campus uni-versitario para averiguar la demanda estudiantil de un producto, un suplemento proteínico para los ba-tidos («Smoothies» en inglés). Encuestó a una muestra aleatoria de 113 estudiantes y obtuvo datos que podrían ser útiles para desarrollar su estrategia de marketing. Las respuestas a esta encuesta se en-cuentran en el fichero de datos Smoothies. a) Ponga un ejemplo de una variable categórica

con respuestas ordinales.

b) Ponga un ejemplo de una variable categórica con respuestas nominales.

2.2. Gráficos para describir variables categóricas

Las variables categóricas pueden describirse utilizando tablas de distribución de frecuen-cias y gráficos como gráficos de barras, gráficos de tarta y diagramas de Pareto. Estos gráficos son utilizados habitualmente por los directivos y los analistas de mercado para describir los datos procedentes de encuestas y de cuestionarios.

Distribución de frecuencias

Una distribución de frecuencias es una tabla utilizada para organizar datos. La columna de la izquierda (llamada clases o grupos) contiene todas las respuestas posibles sobre una varia-ble estudiada. La columna de la derecha es una lista de las frecuencias o número de observa-ciones correspondientes a cada clase.

Tablas

Las clases que utilizamos para construir tablas de distribución de frecuencias de una varia-ble categórica son sencillamente las respuestas posivaria-bles a la variavaria-ble categórica.

E

JEMPLO

2.1.

Las principales empresas de Florida central en 2003 (gráficos de barras y de tarta)

¿Qué empresas ocuparon los primeros puestos en Florida central en 2003?

Solución

El Orlando Sentinel enumera anualmente las principales empresas de Florida central (véase la referencia bibliográfica 7). La Tabla 2.1 es una distribución de frecuencias de las cinco empresas que tenían el mayor número de asalariados en esta zona.