• No se han encontrado resultados

9 Muestreo y Distribuciones c

N/A
N/A
Protected

Academic year: 2021

Share "9 Muestreo y Distribuciones c"

Copied!
41
0
0

Texto completo

(1)

MUESTREO Y

DISTRIBUCIONES

MUESTRALES

En la actualidad la estadística esta considerada como la teoría de la información, no solo como función descriptiva, sino con el objeto básico de hacer estimaciones acerca de los valores estadísticos de la población o en la comprobación de hipótesis de las características investigadas.

De esto podemos indicar que la estadística cubre dos aspectos de gran importancia: En la Estadística

Descriptiva a través de la recolección, clasificación,

presentación, ya sea en forma de cuadros o gráficos, la aplicación de medidas como promedios, desviaciones, etc., y la interpretación y análisis de datos a fin de obtener conclusiones para tomar decisiones. Se realiza un proceso deductivo de lo general a lo particular.

El segundo aspecto es la Estadístistica Inferencial o Método Inductivo, el cual mediante investigaciones por muestreo, logra obtener resultados considerados como estimadores de los parámetros poblaciones.

Por lo que entonces se podría afirmar categóricamente que la tarea más importante de la estadística es la

(2)

realización de inferencias acerca de una población objetivo con base en los resultados obtenidos a través de una muestra.

1. Una Población es el conjunto de todos los elementos de interés en un estudio. Por ejemplo, la población de las tallas de los varones adultos residentes en la provincia de Lima en un momento determinado o la población de sucesos muerte o supervivencia) en todos los pacientes que sufren una enfermedad específica durante cierto período.

2. Una Muestra es un subconjunto de la población, por lo general de número proporcionalmente pequeño, seleccionado de forma que sea representativo, hasta cierto límite, de la población. E l ejemplo más conocido de una encuesta por muestreo es tal vez el sondeo de opinión pública, en el que se entrevista a una pequeña proporción de la población para un objetivo concreto . En muchas encuestas por muestreo se estudian aspectos de Contabilidad y Finanzas.

Del elemento se estudian sus características. Estas se clasifican en CUALITATIVAS O ATRIBUTOS, expresados por palabras y se cuantifican mediante el conteo o recuento; las CUANTITATIVAS O VARIABLES expresadas en forma numérica que pueden ser medibles o contadas.

(3)

MARCO MUESTRAL.- Es un listado actualizado y revisado

de todos los elementos que constituyen la población que va ha ser objeto de investigación. También puede ser un mapa o croquis con las unidades de selección plenamente identificadas.

La población se clasifica en FINITA O INFINITA Cuando se investigan las características de todas las unidades que constituyen la población o Universo nos referimos a una investigación total, exhaustiva o Censo.

Factores tales como: Costo, Tiempo, Recursos Humanos,

Poblaciones muy grandes o infinitas, destrucción de la unidad sometida a control, características con gran heterogeneidad, impiden la realización del censo. Se sustituye, entonces, por una investigación parcial llamada investigación muestral.

MUESTREO ALEATORIO.- Realizado bajo ciertas

condiciones y sometido a ciertos requisitos, se constituye en un procedimiento práctico, económico y rápido para generalizar conclusiones obtenidas a través de una muestra, aplicables a toda la población de la que forma parte, dentro de ciertos límites de confiabilidad, establecidas de antemano.

Dentro del Muestreo Aleatorio se tienen los siguientes métodos:

 Muestreo Aleatorio simple o Muestreo Aleatorio Irrestricto

(4)

 Muestreo por Conglomerados

 Muestreo por Áreas o Muestreo Geográfico

 Muestreo por Fases

 Muestreo Sistemático

DEFINICIÓN

Una muestra probabilística es una muestra extraída de una población, de tal manera que todo elemento de la población tenga una probabilidad conocida de ser incluida en la muestra.

DEFINICIÓN

Si se extrae una muestra de tamaño n de una población de tamaño N, de tal manera que toda muestra posible de tamaño n tenga la misma probabilidad de ser seleccionada, la muestra recibe el nombre de muestra aleatoria simple.

La mecánica de extraer una muestra que satisfaga la definición de una

muestra aleatoria simple se le llama muestreo aleatorio simple.

Una manera de seleccionar una muestra aleatoria simple es usar una tabla de números aleatorios.

TABLA Nº O2

VALOR EN DÓLARES DE 120 CUENTAS POR COBRAR

NÚMERO VALOR NÚMERO VALOR NÚMERO VALOR NÚMERO VALOR O1 91 31 107 61 87 91 91 02 94 32 94 62 104 92 104 03 115 33 101 63 109 93 109 04 85 34 95 64 93 94 92 05 89 35 80 65 95 95 85 06 107 36 104 66 107 96 108 07 94 37 94 67 88 97 99

(5)

08 105 38 102 68 107 98 103 09 94 39 89 69 113 99 81 10 103 40 98 70 95 100 96 11 104 41 106 71 102 101 105 12 105 42 85 72 94 102 91 13 88 43 93 73 99 103 115 14 107 44 103 74 87 104 108 15 90 45 119 75 102 105 102 16 95 46 90 76 105 106 101 17 104 47 82 77 80 107 94 18 93 48 90 78 90 108 93 19 109 49 113 79 108 109 102 20 87 50 104 80 105 110 119 21 92 51 97 81 90 111 96 22 117 52 101 82 115 112 104 23 98 53 90 83 82 113 85 24 89 54 88 84 90 114 108 25 105 55 108 85 102 115 103 26 101 56 95 86 91 116 90 27 81 57 100 87 103 117 105 28 108 58 103 88 107 118 99 29 94 59 108 89 107 119 88 30 104 60 85 90 97 120 103

También existe el MUESTREO NO ALEATORIO,

(6)

o estimaciones no son de ninguna manera confiables, dado que la selección de las unidades que conforman la muestra se realiza en

Forma caprichosa o por conveniencia, primando el juicio personal del investigador.

Dentro del Muestreo no Aleatorio se tienen los siguientes métodos:

 Muestreo a Juicio, intencional u opinático

 Muestreo por Conveniencia

 Muestreo Voluntario

 Muestreo por Cuotas.

DISTRIBUCIONES MUESTRALES

Corresponde a una distribución de todas las muestras que pueden ser escogidas conforme a un esquema de muestreo especificado; en general se refiere a un esquema de muestreo que implique selección al azar y a una función de un número fijo de variables aleatorias independientes.

ESTIMACIÓN PUNTUAL

Un estimado puntual es un sólo valor numérico basado en datos de una muestra aleatoria que se utiliza para estimar el valor de un parámetro poblacional.

La Media µy la Desviación estándar σ de una población son parámetros, en cambio la media X y la

(7)

desviación estándar S de una muestra son valores estadísticos.

CUADRO Nº 01: ESTIMADORES PUNTUALES UTILIZADOS

CON FRECUENCIA.

PARÁMETRO DE LA POBLACIÓN ESTIMADOR

Media Aritmética : µ Diferencia de Medias : µ1−µ2 Proporción : P Diferencia de Proporciones : P1−P2 Varianza : σ2 Desviación Estándar : σ Tamaño : N X 2 1 X X − p 2 1 ρ ρ − 2 S S n x

µ = Media de todas las medias muestrales

x

σ = Desviación estándar de todas las medias

muestrales

Μ = Número de Muestras Posibles

( )

!nΜn!

n

M

Μ

==





Cuando la Muestra se hace sin reposición.

n

Μ =

Μ = Cuando se hace la selección con reposición.

POBLACIÓN

M X 2 M S

n

3 X 2 3 S

n

2 X 2 2 S

n

1 X 2 1 S

n

(8)
(9)

DISTRIBUCIÓN MUESTRAL DE X

Es la distribución de probabilidad de todos los valores posibles de la media de la muestra X.

FIGURA N° 01

PROCESO ESTADÍSTICO PARA EMPLEAR UNA MEDIA DE MUESTRA PARA HACER INFERENCIAS ACERCA DE UNA MEDIA POBLACIONAL

TEOREMA: Dada una población, si extraemos todas las

muestras posibles de un mismo tamaño, entonces la media de la distribución de todas las medidas muestreadas posibles será igual a la media Poblacional y la varianza de todas las medias muéstrales es igual a la varianza de la población dividida por el tamaño Muestral.

( )

X μ E

x

μ = = Usar esta ecuación siempre que:

Se selecciona, en la población, una muestra aleatoria simple de n individuos.

El resumen de los datos muestrales proporciona un valor de la media de muestra

.

POBLACIÓN

CON MEDIA

µ

Se usa el valor de para hacer inferencias acerca del valor

(10)

n σ σ n 2 σ σ X 2

X = ⇒ = 1) La población sea infinita, o bien 2) La población sea finita y también n/N

≤ 0.05

Haciendo uso del factor de Corrección para poblaciones finitas en la fórmula, se tiene: 1 N n N n σ σ X − − = = cuando >0.05 N n

Si no se conoce la desviación estándar de la población, puede estimarse el error estándar de la medias utilizando la desviación estándar muestral, como estimador de la desviación estándar de la población.

n S S n 2 S S X 2 X = ⇒ = F.C.P.F: 1 N n N n S S X − − =

EJEMPLO: Un auditor en el hospital Carrión toma una

muestra aleatoria de tamaño n = 16 de un conjunto de N = 100 cuentas por cobrar. No se conoce la desviación estándar de los montos de las cuentas por cobrar para el total de las 100 cuentas. Sin embargo, la desviación estándar de la muestra es S = $ 57 dólares.

(11)

Determinar el valor del error estándar para la distribución Muestral de la media.

Datos: N = 100 n = 16 S=$ 57 ? = X S 0,16 100 16 N n = =

n no es menor que 0,05 N es decir:

16 > 0,05 (100) esto implica que para calcular SX se tiene que utilizar el factor

de corrección para poblaciones finitas.

99 84 4 57 1 100 16 100 16 57 1 N n N n S SX = − = − =

(

0,9211

)

13,13 dólares 25 , 14 8484 , 0 25 , 14 = ⇒ = = X X S S

El error estándar de la media ofrece la base principal para la inferencia estadística con respecto a la media de una población desconocida. Un teorema de la estadística que conduce a la utilidad del error estándar de la media es: El Teorema del Límite Central.

TEOREMA DEL LIMITE CENTRAL.- Al seleccionar muestras aleatorias simples de tamaño n de una población, la distribución muestral de la media de la muestra x se

puede aproximar a la forma de una DISTRIBUCIÓN

NORMAL DE PROBABILIDADES, cuando el tamaño de la

muestra es grande, n≥30, entonces:

n σ μ X n 2 σ μ X σ μ X Z X X == − − =

EJEMPLO 1: Un auditor toma una muestra aleatoria de

(12)

por cobrar, el valor promedio de las cuentas por cobrar de la población es μ=$2600 con una desviación estándar poblacional de σ =$450,

¿Cuál es la probabilidad de que la media muestral sea inferior a $ 2500 dólares?

SOLUCIÓN:

( )

x μ $2600 E = = σ=$450 75 6 450 36 450 n σ σX= = = =

Como n < 0,05 N; no se necesita el factor de corrección 1.33 75 2600 2500 n σ/ μ x z = − = − =− (Z 1,33) P 75 σ 2600, μ / 2500 x P X = = ≤− = <    

(

Z 1,33

)

P ≤− = 0,5000 - 0,4082 = 0,0918

EJEMPLO 2: En una población grande de seres humanos,

los ingresos económicos sigue una distribución aproximadamente normal con una media de 185.6 dólares y una desviación estándar de

0 -1,33 2600 2500 Z X ( )X μ E = ( )x f 0,4082 0,05

(13)

12.7 dólares. ¿Cuál es la probabilidad de que una muestra aleatoria de tamaño 10 de esta población tenga un promedio de ingresos mayor que 190 dólares?

SOLUCIÓN: µ = $ 185.8 σ = $ 12.7 09 . 1 0161 . 4 4 . 4 0161 . 4 6 . 185 190 / = = − = ∂ − = Z n u x Z ) 0161 . 4 6 . 185 190 ( ) 190 (x> =P Z > − p ) 09 . 1 ( 5 . 0 ) 09 . 1 ( ) 0161 . 4 4 . 4 ( A Z P Z P − = > = > = = 0.5 - 0.36214 = 0.13786

INTERVALOS DE CONFIANZA PARA LA

MEDIA

0 1.09 185.6 190 μ Z 0.36214 0,05

(14)

1) X-ZσX ≤μ≤X+ZσX ó n σ Z X μ n σ -X Z ≤ ≤ + 2) X-ZSX ≤μ≤X+ZSX ó n S Z X μ n S -X Z ≤ ≤ +

Los intervalos de confianza más utilizados son de 90%, 95% y 99%

EJEMPLO: En una semana determinada, se elige al azar una Muestra de 300 pacientes de un número muy grande de ellos que asisten al hospital Daniel Alcides Carrión . Los pacientes realizan un pago por admisión y se encuentran que el promedio de pago es de X=S/. 1800 con una desviación

estándar muestral de S = S/. 140.

Hallar el pago promedio por admisión para todos los pacientes con una estimación por intervalo que permita tener una confianza del 95% de que en ese intervalo incluya el valor de la media Poblacional.

SOLUCIÓN 300 n = S/.1800 x = S = S/. 140 con 95% Z = 1,96       + ≤ ≤       − 300 140 1,96 1800 μ 300 140 1,96 800 1 (8,0829) μ 1800 1,96(8,0829) 1,96 800 1 − ≤ ≤ + 1815,84 S/. μ 784,16 1 S/. ≤≤

(15)

DETERMINACIÓN DEL TAMAÑO DE

LA MUESTRA

Hasta ahora se ha venido trabajando con el tamaño (n) conocido, pero para determinarlo, es necesario identificar los siguientes componentes o elementos técnicos:

a) LA VARIANZA ( 2

x

σ ). Corresponde al grado de variabilidad que presentan las unidades de la población. Mientras mas grande sea 2

x

σ , Mayor será el tamaño de la muestra. El valor de 2

x

σ . supuestamente, es conocido, de lo contrario se debe estimar a través de una investigación preliminar. En el caso de

PQ

σ

2p

=

, sucede algo similar, pero se tiene la

costumbre de tomar P = 0,50 con la cual se obtiene el máximo valor posible de "n".

b) NIVEL DE CONFIANZA. Tiene relación directa con el

tamaño de la muestra. Por lo tanto se dirá que a mayor nivel de confianza mayor será el tamaño de la muestra, los valores de Z se obtienen mediante el uso de tablas. El nivel de confianza es fijada por el investigador, de acuerdo a su experiencia.

c) PRECISIÓN DE LA INVESTIGACIÓN.- Corresponde al

(16)

conocimiento que tenga acerca del parámetro que piensa estimar. Se le conoce como ERROR DE MUESTREO (E) siendo:

(17)

n z E= σ 1 − − σ = N n N . n z E

d) RECURSOS HUMANOS – FINANCIEROS Y TIEMPO.-

No entran dentro de la determinación técnica del tamaño de la muestra. Pero es de suma importancia en el tamaño de las investigaciones.

I.

PARA POBLACIONES INFINITAS

La fórmula para calcular el tamaño óptimo en el muestreo aleatorio simple, en una población infinita se obtiene así:

n

x

z

σ

µ

=

E =x−µ ERROR n zσ = de donde: E z n = σ

PARA VARIABLES PARA ATRIBUTOS

2 2 2 2 E z E z n  = σ      σ = 2 2 E pq z n =

EJEMPLO 1.- La administradora de un hospital desea estimar

la proporción de bebés nacidos en su hospital. Si se desea un intervalo de confianza del 95% para que la verdadera proporción de error no exceda del 2%. Si

(18)

la población es muy grande. ¿Qué tamaño tendrá la muestra que va a tomarse. Si la administradora estima que la proporción de error es del 5%?

SOLUCIÓN: ( ) ( ) ( ) = ⇒ = = 456.19 0.02 (0.95) 0.05 1.96 E PQ Z n 2 2 2 2 456 = n

EJEMPLO 2.- De una remesa de la cual se tomó una

muestra de 200 artículos, se encontró que 20 de ellos eran defectuosos. Con una confianza del 95%, calcular el error de la muestra. SOLUCIÓN:

(

)(

)

200 90 . 0 10 . 0 96 . 1 σ ; ; 2 2 2 2 = = = = n PQ E n PQ z E E PQ z n 90 0 10 0 200 20 . Q . ⇒ = = = ρ E=4.16%

II.

PARA POBLACIONES FINITAS

a)

Muestreo por Variables

      − = ⇒ − = ⇒ − − = − − − = N n N n z E N n N n z E N n N n x Z N n N n x Z 2 2 2 ; 1 σ σ υ µ υ µ

(19)

22 22 2 σ +σ

=

NEZ NZ

n

también : N Z E n 2 2 2 σ +       σ = y la mas utilizada es:

N n n n 0 0 1+ = Donde: 2 0 2 2 2       σ = = σ E z n zE b)

Muestreo por Atributos

(N )E Z PQ NPQ Z n 2 2 2 1 + − = ó N PQ Z E PQ n +       = 2

N n n n 0 0 1+ = Siendo 22 0 ZEPQ n =

(20)

EJEMPLOS:

1. Se desea realizar una investigación en el Ministerio de Transportes sobre el número de unidades que se encuentran en, mal estado en 4000 cajas y la proporción de cajas que contienen unidades en mal estado. Se realiza una encuesta preliminar de 80 cajas con el siguiente resultado, presentado en una tabla de frecuencia:

Número de Unidades defectuosas: 0 1 2 3 4 5 10 12

Número de Unidades examinadas: 37 16 8 8 4 2

2 3

Determinar el tamaño de muestra con las dos condiciones: Para ello el investigador debe establecer un error de 6% para el promedio, del 12% para la proporción y una confianza del 95% para ambos casos.

SOLUCION: A)

1

725

1

73

80

138

96

1

4000

.

.

n

f

x

x

.

Z

=

=

i i

=

=

=

Ν

(

)

7

85

(

0

06

)(

1

73

)

0

10

80

725

1

80

866

2 2 2 2

.

.

E

.

.

.

n

x

n

f

x

S

=

=

=

=

=

(

) (

)(

)

(

.

) (

.

) (

.

)

cajas . . n 1720 85 7 96 1 10 0 4000 85 7 4000 96 1 2 2 2 = + =

(21)

B)

0

5375

0

54

80

43

80

37

80

.

.

=

=

=

ρ

(

) (

)(

)(

)

(

.

) (

.

) (

.

)(

.

)

cajas . . . n 66 46 0 54 0 96 1 12 0 3999 46 0 54 0 4000 96 1 2 2 2 = + =

El tamaño óptimo es de 1720, ya que se toma el mayor valor

2. Se planea realizar una encuesta para determinar qué proporción de

familias en el Distrito de la Victoria carece de servicios médicos. Se cree que la proporción no puede ser menor que 0.25. Se desea un intervalo de confianza del 95% con una precisión relativa del 5% .

De qué tamaño se debe seleccionar la muestra de familias?

(

) (

)(

)

(

0

02

)

1800

75

1801

75

0

25

0

96

1

2 2 2 2

=

=

=

.

.

.

.

.

E

PQ

Z

n

Por lo tanto, debe seleccionarse 1801 familias

DISTRIBUCIÓN MUESTRAL DE

UNA PROPORCIÓN

En muchos casos dentro el campo de la salud se usa la proporción Muestral p para hacer inferencias estadísticas sobre la proporción Poblacional

P

.

(22)

DISTRIBUCIÓN MUESTRAL DE

p

La distribución muestral de p es la distribución de probabilidades de todos los valores posibles de la proporción muestral p.

Para determinar lo cercano que está la proporción muestral p de la proporción poblacional

P

,

necesitamos comprender las propiedades de la distribución Muestral de p: su valor esperado, su desviación estándar y la forma de su distribución.

VALOR ESPERADO DE p

E(p) = P μp =P

DESVIACIÓN ESTÁNDAR DE p: Llamada también ERROR

ESTÁNDAR. Población finita

(

)

n P 1 P 1 N n N σp − − − = Población infinita

(

)

n PQ n σ n P 1 P σp = − = p =

VARIANTE ESTADÍSTICA

En muchos casos podemos utilizar la distribución normal apara evaluar la distribución muestral de proporciones, siendo:

(23)

p p p σ μ p σ P p n PQ P -p Z= = − = −

La distribución muestral de p se puede aproximar con una distribución normal de probabilidades, siempre que el tamaño de muestra sea grande. Se puede considerar que el tamaño de muestra es grande cuando se cumplen las dos condiciones siguientes:

5 p

n ≥

(

1-p

)

5

n ≥

Vale la pena observar la simbología que se utiliza en la muestra.

= ai

a Total de elementos que presenta la característica investigada

n a n

a

p = =

i Proporción de elementos que presenta la característica investigada n a n p 1

q= − = − Proporción de elementos que no presenta la

característica investigada

2 p

S : Varianza de una proporción ⇒ Sp2=pq

p

S : Desviación estándar ⇒ Sp= pq

EJEMPLOS

1. Se tiene que el 4% de las piezas producidas por cierta máquina son defectuosas. ¿Cuál es la probabilidad de

(24)

que un grupo de 200 piezas, el 3% o más son defectuosas? SOLUCIÓN 0,04 μp = p=0,03

(

)(

)

0,014 200 0,96 0,04 n PQ σp = = = Se desea determinar la P

(

p≥0,03

)

=?

(

)(

)

0,71 200 0,96 0,04 0,04 0,03 n PQ μ -p Z = p = − = −

(

p 0,03

)

P

(

z 0,71

)

P ≥ = ≥− = 0,5 + A(-0,71) = 0,5000 + 0,2612 = 0,7612 P

[

p≥0,03

]

= 76,12 %

Solución con Corrección

Si se quiere obtener una buena aproximación a la distribución normal, debe hacerse la corrección en la variable discreta, siendo igual a

2n 1 . Si se va a obtener 0 -0,71 0,04 0,03 Z p 0,5 0,2612

(25)

una área hacia la derecha, se restará este factor de corrección; en el caso de que sea a la izquierda, se sumará ese factor al valor de p.

p p σ μ -2n 1 -p Z       = ÁREA A LA DERECHA p p σ μ -2n 1 p Z       + = ÁREA A LA IZQUIERDA

(

p 0,03

)

P ≥ =

(

)

                  − ≥ 0,014 0,04 200 2 1 p Z P =                   ≥ 0,014 0,04 400 1 0,03 Z P =  ≥

(

)

 0,014 0,04 0,0025 0,03 Z P =  ≥ −  0,014 0,04 0,0275 Z P =P

[

Z≥−0,89

]

=0,5000+A(-0,89)=0,5000+0,3133 = 0,8133

[

p 0,03

]

P ≥ = 81,33 % 0 -0,89 0,04 0,03 Z p 0,5 0,3133

(26)

PRUEBA DE HIPOTESIS

OBJETIVOS DEL TEMA

Conocer el proceso para contrastar hipótesis y su relación con el método científico.

Diferenciar entre la hipótesis nula y alternativa

Fijar el nivel de significación

Toma de decisiones, Tipos de error y Cuantificación del error.

QUÉ ES UNA HIPÓTESIS?

Una creencia sobre la POBLACIÓN, principalmente sus parámetros:

Media Poblacional ( µ ) Varianza Poblacional ( σ 2 )

Proporción Poblacional ( P )

OJO! Si queremos contrastarla debe

establecerse antes del análisis.

IDENTIFICACIÓN DE HIPÓTESIS

Hipótesis Nula

H

o

Hipótesis

Alternativa

H

1

- La que contrastamos - Niega a Ho

- Los datos pueden refutarla - Los datos pueden mostrar

evidencia a favor.

- No debería ser rechazada - No debería ser aceptada sin

sin una buena razón. Una gran evidencia a favor.

(27)

H

o

: P = 50 % =; <=;

>=

H

1

: P

50%

; <

; >

¿QUIEN ES H

o

?

PROBLEMA: ¿La osteoporosis está relacionada con el

Género?

SOLUCIÓN

- Traducir a lenguaje estadístico : P = 50% - Establecer su opuesto P 50%

- Seleccionar la hipótesis nula

HHH

Es necesario indicar que la Inferencia estadística, comprende dos partes principales, a saber: la estimación

de parámetros y la prueba o docimasia de hipótesis,

que es motivo de la presente tarea, con el fin de desarrollar métodos y observar su aplicación a problemas

(28)

concientes de la vida diaria. La aplicación está en muestras grandes y pequeñas.

La prueba de hipótesis, denominada también prueba de

significación tiene como objeto principal evaluar

suposiciones o afirmaciones acerca de los valores estadísticos de la población denominados parámetros. La palabra docimar, significa probar y se convierte en una técnica de ayuda al profesional, investigador o administrador a tomar una decisión referente a una población, examinando una muestra de esa población.

HIPOTESIS ESTADISTICA

Es un supuesto acerca de un parámetro o de un valor estadístico de una población, también puede considerarse como la afirmación acerca de una característica ideal de una población sobre la cual hay inseguridad en el momento de formularla y que a la vez, es expresada de tal forma que puede ser rechazada.

TIPO DE ERROR

En la decisión de aceptar o rechazar una hipótesis puede cometerse dos tipo de error.

a) ERROR DE TIPO I: Rechazar una hipótesis nula

verdadera ( α ).

b) ERROR DE TIPO II: Se comete cuando se acepta una

(29)

La probabilidad de cometer un error de tipo II se designa por β.

Como las pruebas de hipótesis se basan en información de muestra, debemos considerar la posibilidad de cometer errores. Existen por lo tanto dos posibles decisiones: Aceptar o rechazar la hipótesis la que, a la vez, puede ser cierta o falsa.

TABLA Nº1 ERRORES Y DECISIONES CORRECTAS EN PRUEBA DE HIPOTESIS D E C I S I O N E S ACEPTA VERDADERA FALSA DECISIÓN CORRECTA ERROR TIPO II RECHAZA R ERROR TIPO I DECISIÓN CORRECTA HIPÓTESIS NULA Y ALTERNATIVA

(30)

La hipótesis se debe formular en forma correcta o lógica y debe ser enunciada antes de obtener los datos muestrales. Son ejemplos de hipótesis estadística:

a) El promedio de rendimiento que tendrán los alumnos maestristas en el curso Estadística Aplicada será superior a 16.

b) El 90% de los estudiantes aprobarán la asignatura

c) El 5% de las unidades producidas por una máquina serán defectuosas

d) El promedio de contenido de colesterol en adolescentes normales es de 180

Existen dos tipos de hipótesis que se deben formular:

La hipótesis nula, simbolizada por

Ho

y la hipótesis alternativa por

Ha.

LA HIPÓTESIS NULA.- Es aquella por medio de la cual se

hace una afirmación sobre un parámetro que se va a contrastar con el resultado muestral. Cuando el fabricante dice que su producto tiene una duración de 6000 horas, se le considera como hipótesis nula, pues es lo que se quiere probar.

LA HIPÓTESIS ALTERNATIVA.- Es todo aquella hipótesis

que difiere de la hipótesis nula, es decir ofrece una alternativa afirmando que la hipótesis nula es falsa. Por ejemplo se podría decir que la hipótesis alternativa podría ser:

(31)

a) El fabricante ha exagerado la duración de su producto (prueba unilateral a la izquierda)

b) El fabricante pudo haber dicho que su producto tiene una duración superior a 6000 horas (prueba unilateral a la derecha)

c) La duración del producto no es la señalada por el fabricante (prueba bilateral)

NIVEL DE SIGNIFICACIÓN Y PUNTOS CRÍTICOS

Se entiende por nivel de significancia, la máxima probabilidad de que se especifique, con el fin de hacer mínimo el primer tipo de error. Generalmente, esta probabilidad se fija antes de escoger la muestra. El nivel de significación se simboliza por alfa (α), siendo generalmente del

1%, 5% ó 10%;

pero se puede usar cualquier nivel, dependiente del tipo de investigación.

Cuando se trabaja con un nivel del 10% se considera poco

significativo, cuando se trabaja con un nivel del 5% el resultado se considera significativo; si se emplea el 1%

el resultado es altamente significativo.

El valor de significación corresponde a un área bajo la curva de probabilidad o normal, denominada región crítica o de rechazo, cuando n ≥ 30 y la distribución T ó χ2 para muestras pequeñas (n<30)

(32)

PROCEDIMIENTOS A SEGUIR EN LAS PRUEBAS

DE HIPÓTESIS

Se presenta en primer lugar una síntesis de los pasos a seguir, luego se amplia para que se tenga una mejor visión del procedimiento:

1. DATOS

2. SUPOSICIONES

3. FORMULAR LA HIPÓTESIS NULA Y ALTERNATIVA 4. SELECCIONAR EL NIVEL DE SIGNIFICACIÓN

5. CONOCER O ESTIMAR LA VARIANZA

6. DETERMINAR LA TÉCNICA Y LA PRUEBA ESTADÍSTICA

7. DETERMINAR LOS VALORES CRITICOS Y SUS REGIONES DE RECHAZO

8. CALCULAR LA ESTADÍSTICA DE PRUEBA 9. TOMAR LA DECISIÓN ESTADÍSTICA

Ho = Hipótesis Nula

Ha = Hipótesis Alternativa

o

a

o

a

o

a

o

o

o

o

o

o

H

H

H

H

H

H

µ

µ

µ

µ

µ

µ

µ

µ

µ

µ

µ

µ

>

<

=

=

=

:

:

:

:

:

:

po p o po p o po p a po p o po p o po p o

H

H

H

H

H

H

µ

µ

µ

µ

µ

µ

µ

µ

µ

µ

µ

µ

>

<

=

=

=

:

:

:

:

:

:

(33)

DISTRIBUCIÓN NORMAL

σ µ − =x Z

DISTRIBUCIÓN DE MEDIAS MUESTRALES

30 ≥ = µ − σ µ − = Z;n n / S x o n / x Z

DISTRIBUCIÓN DE PROPOSICIONES

30 ; ≥ − = siendo n n pq p p Z

PRUEBA DE HIPÓTESIS: DE UNA SOLA MEDIA DE

POBLACIÓN

Se presentan 3 casos:

CASO 1:

MUESTREO A PARTIR DE POBLACIONES

NORMALMENTE

DISTRIBUIDA:

(34)

1. Un grupo de investigadores está interesado en conocer la edad promedio de cierta población. Por decirlo así, se preguntan lo siguiente: ¿Se pude concluir que la edad promedio de la población es menor de 30 años?

SOLUCIÓN:

1. Datos. Los datos disponibles para los investigadores

son las edades de una muestra aleatoria simple de 60 individuos, extraída de la población de interés. A partir de esta muestra se calcula el promedio que es de 27 años. ( = 27 años ).

2. Supuestos. Se supone que la muestra de valores

proviene de una población cuyas edades siguen una distribución aproximadamente normal y que la varianza de la población es de 120 (σ 2 = 120 ). 3. HIPÓTESIS

H

o

:

µ

=

30

H

1

:

µ

<

30

4.

Nivel de significancia: α =0,05 Z = σX-μn ESTADÍSTICO DE PRUEBA

5. Cálculo del valor tabular ( tT )

Como α = 0.05 y la prueba es unilateral zT =

1.645

6. Cálculo del valor experimental ( ZO ) o estadística de Prueba

(35)

ZO = 10.95/7.75

30 27−

= - 2.12

7. Determinación de las regiones críticas

8. Decisión estadística.

Como ZO = – 2.12 es < que ZT= -1.645 el valor experimental se sitúa en la zona de rechazo, entonces

no se puede aceptar la H0.

9. Conclusión. Se concluye que la edad promedio de la

población es menor de 30 años y se beberá actuar de acuerdo a lo pertinente.

2. Se ha observado que numerosos enfermos con cáncer en el distrito de Ate Vitarte y en un estudio clínico determinado tienen una supervivencia media desde el diagnóstico de 38.3 meses, con una desviación estándar de 43.3 meses. Cien pacientes son tratados con una nueva técnica y su supervivencia media es de 46.9 meses. ¿Es este aparente incremento de la supervivencia media explicable por una fluctuación debida al azar? 1.645 -1.11. 645 R.A . Z α=0,5 R.R.

(36)

SOLUCIÓN

1. Datos: µ = 38.3 meses σ = 43.3 meses X = 46.9 mes.

2. Suposición: Supongamos que los datos de la muestra se distribuyen en forma aproximadamente normal.

3. HIPÓTESIS :

Ho: µ = 38.3 meses

H1: µ ≠ 38.3 meses

4. Nivel de significación: α = 0.05

5. ESTADÍSTICO DE PRUEBA: La distribución normal 6. Cálculo del valor Tabular ( tT ) :

Como α = 0.05 y la prueba es bilateral entonces zT =

1.96

7. Cálculo del valor experimental ( Z0 )

Z0 = 43.3/ 100 3 . 38 9 . 46 − = 48..336 = 1.99

8. Determinación de las regiones críticas

9. Decisión Estadística :

Como Z0 = 1.99 > ZT = 1.96 Se rechaza la hipótesis nula y se Acepta la hipótesis alternativa.

1,96 -1,96 Z 0,025 α = 2 0,025 α = 2 R.A. R.C. R.C.

(37)

10. Conclusión

El valor experimental apenas sobrepasa al valor

tabular, por lo tanto , la diferencia es significativa. Esta diferencia significativa sugiere que es poco probable que el incremento del tiempo medio de supervivencia se deba al azar. No sería prudente suponer que el nuevo tratamiento ha mejorado la supervivencia, por que algunas características de los pacientes podrían haber cambiado desde el registro de los primeros datos; por ejemplo, la enfermedad podía haber sido diagnosticada previamente. Finalmente lo que se puede afirmar es que es muy probable que la diferencia no sea un fenómeno debido al azar.

CASO 2: MUESTREO A PARTIR DE UNA POBLACIÓN NORMALMENTE DISTRIBUIDA: VARIANZA DE LA POBLACIÓN DESCONOCIDA

1. Se hicieron determinaciones de amilasa en el suero, en una muestra de 15 sujetos aparentemente normales. La muestra proporcionó una media de 96 unidades/100ml y una desviación estándar de 35u/100ml. Supóngase que se desea saber si puede concluirse que la media de la población de la cual provino la muestra de determinaciones de amilasa en el suero es diferente de 120 unidades /100ml

(38)

1. DATOS: Los datos consisten de las determinaciones de la amilasa en el suero de 15 sujetos aparentemente normales. La media y la desviación estándar calculadas a partir de la muestra son 96 y 35 unidades/100ml respectivamente.

2. SUPOSICIONES: 15 determinaciones constituyen una muestra aleatoria de una población de determinaciones que están normalmente distribuidas. Se desconoce la varianza de la población. 3. NIVEL DE SIGNIFICACIÓN: α=0,05 4. HIPÓTESIS 120 = μ : H0 120 ≠ μ : Ha

5. ESTADÍSTICA DE PRUEBA: Como no se conoce la varianza poblacional la estadística de prueba es:

n S μ -X t = 6. DISTRIBUCIÓN DE LA ESTADÍSTICA DE

PRUEBA: La estadística de prueba esta distribuida

como la T de Student con n – 1 grados de libertad si H0 es verdadera.

(39)

7. REGLA DE DECISIÓN: Se trata de una prueba bilateral, se pone α2 a cada cola de la distribución, entonces: 0 T 0 T t t 2,1448 SeaceptaH t -Si ≤ ≤ = a T 0 T t t 2,148 Se aceptaH t Si ≤ ≤− = −

8. CALCULO DE LA ESTADISTICA DE PRUEBA EXPERIMENTAL 2,65 9,04 24 15 35 120 -96 t0 = = − =−

9. DECISIÓN ESTADÍSTICA: 2.65 Cae dentro de la región de rechazo por lo tanto se acepta Ha y se

rechaza Ho.

10. DECISIÓN ADMINISTRATIVA: La conclusión, basada en estos datos, es que la media de la población de la cual provino la muestra no es 120 unidades/100ml. 2. 1448 RC 0 0,025 0,025 R.A. -2,1448

RC

(40)

CASO 3: MUESTREO A PARTIR DE UNA

POBLACIÓN

QUE

NO

ESTA

NORMALMENTE DISTRIBUIDA:

Si la muestra en la cual se basa la prueba de la hipótesis proviene de una población que no esta normalmente distribuida, si la muestra es grande, puede sacarse ventaja del teorema del limite central y usar

n σ

μ -X

Z = como la estadística de prueba. Si no se conoce la desviación estándar de la población, la practica común es usar la desviación estándar de la muestra como una estimación.

EJEMPLO:

En una encuesta sanitaria de cierta comunidad se entrevistaron 150 personas. Uno de los detalles de la información obtenida fue el número de recetas médicas que cada persona habrá tenido que pedir durante el año anterior. El número promedio para las 150 personas fue de 5.8 con una desviación estándar de 3.1. El investigador desea saber si estos datos proporcionan evidencia suficiente como para indicar que la media de la población es mayor que 5.

(41)

1. Suponga que la empresa que fabrica bombillas quiere saber si puede afirmar que sus bombillas tiene una duración de 1000 horas. La empresa toma una muestra aleatoria de 100 bombillas y calcula que el promedio de duración es 980 horas y que la desviación estándar es 80 horas. Utilice un nivel de significación del 5%.

2. Una empresa quiere saber, con un nivel de confianza del 95% , si puede afirmar que las cajas de detergente que vende contienen más de 500 gramos de detergente. De su experiencia anterior, la empresa sabe que la cantidad de de detergente contenido en las cajas sigue una distribución normal. La empresa toma una muestra aleatoria de 25 cajas y calcula que el promedio aritmético es 520 gramos y una desviación estándar de 75 gramos. Puesto que a la empresa le interesa contratar que el promedio poblacional es mayor que 500 gramos.

Referencias

Documento similar

Los planes de muestreo indican el número de unidades del producto que han de inspeccionarse de cada lote, es decir, el tamaño de la muestra, así, como el criterio para determinar

Para el desarrollo de esta investigación se utilizó un diseño cuasi experimental con una prueba de hipótesis con muestreo no probabilístico por conveniencia, se utilizó el

Esta última variable se operativizó en varios indicadores relativos al centro (actividades de experimentación, Seminarios Permanentes solicitados) o a la zona donde se

Las participantes fueron captadas en su tercer trimestre de la gestación mediante muestreo consecutivo, solicitándoles la cumplimentación de un cuestionario que

Por tanto eligiendo cuidadosamente la tasa de muestreo y las características a utilizar para la clasicación del tráco se pueden obtener grandes resultados de precisión realizando

La campaña de muestreo consistió en la toma de 5000 datos de velocidades instantáneas con 10 Hz por frecuencia de muestreo con equipo ADV, en distintas

Primeros ecos de la Revolución griega en España: Alberto Lista y el filohelenismo liberal conservador español 369 Dimitris Miguel Morfakidis Motos.. Palabras de clausura