4 Contraste de hipótesis en el modelo de regresión múltiple
Ezequiel Uriel
Universidad de Valencia Versión: 09-2013
4.1 El contraste de hipótesis: una panorámica 1
4.1.1 Formulación de la hipótesis nula y de la hipótesis alternativa 1
4.1.2 Estadístico de contraste 2
4.1.3 Regla de decisión 3
4.2 Contraste de hipótesis utilizando el estadístico t 5
4.2.1 Contraste de un solo parámetro 5
4.2.2 Los intervalos de confianza 16
4.2.3 Contraste de hipótesis sobre una combinación lineal de parámetros 17 4.2.4 Importancia económica versus significación estadística 22
4.3 Contraste de restricciones lineales múltiples utilizando el estadístico F 22
4.3.1 Restricciones de exclusión 22
4.3.2 Significación global del modelo 27
4.3.3 Estimando otras restricciones lineales 28
4.3.4 Relación entre los estadísticos F y t 29
4.4 Contrastes sin normalidad 30
4.5 Predicción 31
4.5.1 Predicción puntual 31
4.5.2 Predicción por intervalos 31
4.5.3 Predicción de y en un modelo logarítmico 35
4.5.4 Evaluación de las predicciones y predicción dinámica 36
Ejercicios 38
4.1 El contraste de hipótesis: una panorámica
Antes de contrastar las hipótesis en el modelo de regresión múltiple, vamos a ofrecer una panorámica sobre el contraste de hipótesis.
El contraste de hipótesis permite realizar inferencias acerca de parámetros poblacionales utilizando datos provenientes de una muestra. Para realizar el contraste de hipótesis estadístico, en general, hay que realizar los siguientes pasos:
1) Establecer una hipótesis nula y una hipótesis alternativa relativas a los parámetros de la población.
2) Construir un estadístico para contrastar las hipótesis formuladas.
3) Definir una regla de decisión para determinar si la hipótesis nula debe ser, o no, rechazada en función del valor que tome el estadístico construido.
Vamos a examinar a continuación cada uno de estos pasos.
4.1.1 Formulación de la hipótesis nula y de la hipótesis alternativa
Antes de referirnos al modo de formular la hipótesis nula y alternativa, distinguiremos entre hipótesis simples e hipótesis compuestas. Las hipótesis que se formulan mediante una o más igualdades se denominan hipótesis simples. Cuando para formular una hipótesis se utilizan los operadores "desigualdad", "mayor que" y "menor que", entonces a dicha hipótesis se le denomina compuesta.
Es importante señalar que el contraste de hipótesis se refiere siempre a los parámetros poblacionales. El contraste de hipótesis implica tomar la decisión, sobre la base de los datos muestrales, de rechazar o no que ciertas restricciones sean satisfechas por el modelo básico asumido. Las restricciones que se desean contrastar se conocen
como la hipótesis nula, a la que designa H0. Así pues, una hipótesis nula es una declaración sobre los parámetros poblacionales.
Aunque es posible formular hipótesis nulas compuestas en el contexto del modelo de regresión, siempre consideraremos que la hipótesis nula es una hipótesis simple. Es decir, para formular una hipótesis nula, utilizaremos siempre el operador
“igualdad”. Veamos a continuación algunos ejemplos de hipótesis nulas referidas al modelo de regresión:
a) H0 : 1=0 b) H0 : 1+ 2 =0 c) H0 : 1=2 =0 d) H0 : 2+3 =1
También vamos a definir una hipótesis alternativa, designada por H1, que representa nuestra conclusión en el caso de que el contraste concluya que H0 es falsa.
Aunque las hipótesis alternativas pueden ser también simples o compuestas, en el modelo de regresión, tomaremos siempre, como hipótesis alternativa, una hipótesis compuesta. La hipótesis alternativa, a la que se designa H1, se formula mediante el operador "desigualdad" en la mayor parte de los casos. Así, por ejemplo, dada la H0:
0: j 1
H (4-1)
podemos formular la siguiente H1 :
1: j 1
H (4-2)
que es una hipótesis "alternativa de dos colas".
Las siguientes hipótesis se llaman “alternativas de una cola”:
1: j 1
H (4-3)
1: j 1
H (4-4)
4.1.2 Estadístico de contraste
Un estadístico de contraste es una función de una muestra aleatoria, por lo que también es una variable aleatoria. Cuando se calcula el estadístico de contraste para una muestra dada, se obtiene un resultado, es decir, un número. Al realiza un contraste estadístico sería conveniente conocer la distribución del estadístico de contraste bajo la hipótesis nula. Esta distribución depende en gran medida de las hipótesis formuladas en el modelo. Si en la especificación del modelo se asume el supuesto de normalidad, entonces la distribución estadística apropiada será la distribución normal o alguna de las distribuciones asociadas a la misma, como son la Chi-cuadrado, la t de Student, o la F de Snedecor.
En el cuadro 4.1 se muestran algunas distribuciones, que son apropiadas en diferentes situaciones, bajo el supuesto de normalidad de las perturbaciones del modelo.
CUADRO 4.1. Algunas distribuciones utilizadas en el contraste de hipótesis.
1 restricción 1 o más restricciones
2 conocida N Chi-square
2 desconocida t de Student F de Snedecor
El estadístico utilizado para el contraste se construye teniendo en cuenta la H0 y los datos muestrales. En la práctica, como 2 es siempre desconocida, se utilizarán siempre las distribuciones t y F.
4.1.3 Regla de decisión
Para el contraste de hipótesis vamos a considerar dos enfoques: el enfoque clásico y un enfoque alternativo basado en los valores-p. Pero antes de ver la manera de aplicar la regla de decisión, examinaremos los tipos de error que se pueden cometer en el contraste de hipótesis.
Tipos de errores en el contraste de hipótesis
En el contraste de hipótesis, podemos cometer dos tipos de errores: error de tipo I y error de tipo II.
Error de tipo I
Nosotros podemos rechazar la H0 cuando en realidad es cierta. A este error se le denomina error de tipo I. Generalmente, se define el nivel de significación () de un contraste como la probabilidad de cometer un error de tipo I. Simbólicamente,
0 0
Pr(rechazar H H | )
(4-5)
Dicho de otro modo, el nivel de significación es la probabilidad de rechazar la H0 cuando la H0 es cierta. Las reglas para el contraste de hipótesis se construyen haciendo que la probabilidad de un error de tipo I sea suficientemente pequeña. Los niveles de significación usuales para son 0.10, 0.05 y 0.01. Algunas veces también se utiliza 0.001.
Después de haber tomado la decisión de rechazar o no la H0, la decisión puede haber sido la correcta o puede que se haya cometido un error. Nunca sabremos con certeza si se cometió un error. Sin embargo, podemos calcular la probabilidad de haber cometido un error de tipo I o un error de tipo II.
Error de tipo II
Podemos fracasar en rechazar la H0 cuando en realidad es falsa. Si esto sucede se ha cometido un error de tipo II.
0 1
Pr(No rechazar H H| )
(4-6)
En otras palabras, es la probabilidad de no rechazar H0 cuando H1 es cierta.
Es importante señalar que no es posible minimizar ambos tipos de error de forma simultánea. En la práctica lo que hacemos es seleccionar un nivel de significación bajo.
Enfoque clásico: Aplicación de la regla de decisión El método clásico implica los siguientes pasos:
a) Elección de . El contraste de hipótesis clásico requiere que inicialmente se especifique un nivel de significación. Cuando se especifica un valor para , esencialmente lo que estamos cuantificando es nuestra tolerancia para un error de tipo I.
Si =0.05, entonces el investigador está dispuesto a rechazar H0 falsamente en un 5%
de los casos.
b) Obtención de c, valor crítico, utilizando tablas estadísticas. El valor c se determina por el valor de .
El valor crítico en un contraste de hipótesis es un umbral con el cual se compara el estadístico de contraste para determinar si la hipótesis nula se rechaza o no.
c) Comparando el resultado del estadístico de contraste, s, con c, la H0 se rechaza o no para un valor dado de .
La región de rechazo (RR), delimitada por el valor crítico (c), es un conjunto de valores del estadístico de contraste para los cuales se rechaza la hipótesis nula. (Véase figura 4.1). Es decir, el espacio muestral del estadístico de contraste se divide en dos regiones: una región (la región de rechazo) nos lleva a rechazar la hipótesis nula H0, mientras que la otra no nos deja rechazar la hipótesis nula. Por lo tanto, si el valor observado del estadístico de contraste s se encuentra en la región crítica, rechazamos la H0; en el caso de que no se encuentre en la región de rechazo llegamos a la conclusión, de no rechazar la H0 o de fracasar en rechazar la H0.
Simbólicamente,
0
0
Si se rechaza Si no se rechaza
s c H
s c H
(4-7)
Si la hipótesis nula se rechaza con la evidencia de la muestra, ésta es una conclusión fuerte. Sin embargo, la aceptación de la hipótesis nula es una conclusión débil porque no conocemos cuál es la probabilidad de no rechazar la hipótesis nula cuando debe ser rechazada. Es decir, no conocemos la probabilidad de cometer un error de tipo II. Por lo tanto, en lugar de utilizar la expresión de la aceptación de la hipótesis nula, es más correcto decir fracasar en rechazar la hipótesis nula, o no rechazar, ya que lo que realmente sucede es que no tenemos suficiente evidencia empírica para rechazar la hipótesis nula.
En el proceso de contrastación, la parte más subjetiva es la determinación a priori del nivel de significación. ¿Qué criterios se pueden utilizar para determinar ? En general, se trata de una decisión arbitraria, aunque como ya hemos dicho, los niveles de 1%, 5% y 10% para son los más utilizados en la práctica. A veces se efectúa el contraste condicionado a distintos niveles de significación.
FIGURA 4.1. Contraste de hipótesis: enfoque clásico.
Un enfoque alternativo: el valor-p
Con la utilización de ordenadores, el contraste de hipótesis puede contemplarse desde otra perspectiva mucho más racional. Así, los programas de ordenador suelen ofrecer, junto al estadístico de contraste una probabilidad. Esta probabilidad, a la cual se le denomina valor-p (p-value) -es decir, valor de probabilidad-, también es conocida como nivel de significación crítico o exacto, o probabilidad exacta de cometer un error de tipo I. Más técnicamente, el valor-p se define como el más bajo nivel de significación al que puede ser rechazada una hipótesis nula.
Una vez que el valor-p ha sido determinado, sabemos que la hipótesis nula se rechaza para cualquier nivel de significación valor-p; por el contrario, la hipótesis nula no se rechaza cuando <valor-p. Por lo tanto, el valor-p es un indicador del nivel de admisibilidad de la hipótesis nula: cuanto mayor sea el valor-p, más confianza podemos tener en la hipótesis nula. El uso de valor-p cambia por completo el enfoque en el contraste de hipótesis. Así, en lugar de fijar a priori el nivel de significación, se calcula el valor-p, que nos permite determinar los niveles de significación para los que se rechaza la hipótesis nula.
En las secciones siguientes vamos a ver en la práctica el uso de valor-p en el contraste de hipótesis.
4.2 Contraste de hipótesis utilizando el estadístico t 4.2.1 Contraste de un solo parámetro
El estadístico t
Bajo los supuestos del MCL del 1 al 9,
ˆj ~N j, var( ) ˆj j 1, 2,3, ,k
(4-8)
Si tipificamos
ˆ ˆ
~ 0,1 1, 2,3, ,
ˆ ( )ˆ
var( )
j j j j
j j
N j k
sd
(4-9)
El supuesto de normalidad se apoya en el Teorema del Límite Central (TCL), pero este teorema es restrictivo en algunos casos. Es decir, la normalidad no siempre se
Región de no rechazo
RNR
Región de rechazo
RR
c
W
puede asumir. En cualquier aplicación, asumir o no el supuesto de normalidad de u es realmente una cuestión empírica. A menudo, mediante una transformación, por ejemplo, tomando logaritmos, se obtiene una distribución que está más cercana a la normalidad y que es más fácil de manejar desde un punto de vista matemático. Las muestras grandes nos permiten prescindir del supuesto de normalidad sin afectar demasiado a los resultados.
Bajo los supuestos de MLC del 1 al 9, se obtiene una distribución t de Student ˆ
( )ˆ
j j
n k j
ee t
b b
b -
- (4-10)
donde k es el número de parámetros desconocidos en el modelo poblacional (k-1 parámetros de pendiente y el término independiente, 1). La expresión (4-10) es importante porque nos permite contrastar la hipótesis sobre j.
Si comparamos (4-10) con (4-9), vemos que la distribución de t de Student deriva del hecho de que el parámetro de ee( )ˆj ha sido reemplazado por su estimador ˆ, que es una variable aleatoria. Así pues, los grados de libertad de la t son n-k, correspondientes a los grados de libertad utilizados en la estimación de . ˆ2
Cuando una distribución t tiene muchos grados de libertad (gl) se aproxima a una distribución normal estándar. En la figura 4.2 se ha representado la función de densidad normal y la función de densidad de la t para diferentes grados de libertad.
Como puede verse, las funciones de densidad de la t son más aplanadas (platicúrticas) y con las colas más anchas que la función de densidad normal, pero a medida que aumentan los gl, la función de densidad de la t está más próxima de la función de densidad normal. De hecho, lo que pasa es que la distribución t tiene en cuenta que 2 se ha estimado por ser desconocida. Dada esta incertidumbre, la distribución de la t se extiende más que la de la normal. Sin embargo, cuando los gl crecen, la distribución t está más cerca de la distribución normal porque la incertidumbre de no conocer 2 disminuye.
Por lo tanto, debería tenerse en mente la siguiente convergencia en distribución:
(0,1)
n n
t N (4-11)
Así pues, cuando el número de grados de libertad de una t de Student tiende hacia infinito converge hacia una distribución N(0,1). En el contexto del contraste de hipótesis, si crece el tamaño de la muestra, también lo harán los grados de libertad. Esto implica que para tamaños grandes se puede utilizar, de forma prácticamente equivalente, la distribución normal para contrastar hipótesis con una sola restricción, aun cuando no se conozca la varianza poblacional. Como regla práctica, cuando los gl son mayores que 120, pueden tomarse valores críticos de la distribución normal.
todas
…,xj
corre para t, o la
estim un v indic cero?
que e que h está decid altern Hipó
FIGURA 4
Consider
Puesto q s las otras v
j 1, xj+1,…
esponde al contrastar a ratio t, de
Cuando mador insesg
alor pequeñ cará una hip
?
Debemo el tamaño d hacemos cu
ˆj
alejada dir sobre l nativas unil ótesis altern En prime
4.2. Funcione
re la hipóte
que j mide variables in , xk han si denominad
0: j 0
H
e ˆj y se ex
vamos a c gado de j. ño indicará pótesis nula
os recordar q de ˆj debe uando usam de cero. A la hipótesi laterales (co nativa de un er lugar, vam
es de densidad
sis nula,
e el efecto ndependient ido tenidos
o contraste , contra cua xpresa como t
ontrastar H En una mu una hipóte a falsa. La p
que hay un comparase os ˆ
j
t , ya q A fin de det
s alternativ ola derecha na cola: der
mos a consi
d: normal y t
0: j 0
H
parcial de tes, H0:j
en cuenta e de signific
alquier otra o
ˆ
ˆ ( )ˆ
j
j
j
t ee
0: j 0
H , uestra dada esis nula ve pregunta es
n error de m con su erro que este est terminar un va relevant
e izquierda) recha
iderar la hip
t para diferen
0
xj sobre y,
0 signifi a, x no tien
catividad. E alternativa
)
es natural ˆj
nunca s rdadera, mi s: ¿hasta qu
muestreo en or de muestr adístico mid a regla para te. Hay tre ) e hipótesis
pótesis nula
ntes grados d
después d ica que, una ne efecto so El estadístic
, se denomi
tener prese será cero ex ientras que ué punto ˆj
la estimaci reo. Esto es de cuantos a rechazar H es posibilid s alternativa
de libertad
de controlar a vez que x obre y. Est co que se u ina el estad
ente a ˆj nu xactamente,
un valor g
j está aleja ión de ˆj, p s precisamen
errores está H0, tenemo dades: hipó a de dos col
r para x2, x3,
ta H0
utiliza dístico
uestro , pero rande da de
por lo nte lo ándar, os que ótesis las.
contr
caso R
como
1: H lo gr parte de si cuan
se tie no.
exam valor el va signi
<va
FIG
h EJEM
en un que 0
ra la hipótes
Este es u la siguiente Regla de dec
Por lo ta o puede ve
j 0
el v rande que s e, para obten
ignificación ndo dismin
Hasta cie ene que eleg En la fig men de la fig r en las tabl alor-p ha si
ificación en alor-p.
GURA 4.3. Reg hipótesis alter
MPLO 4.1 ¿Es l Como se v n modelo linea . Es decir, en
sis alternativ
un contrast e:
cisión Si Si
anto, rechaz erse en la valor de ˆ
tj
sea, no prop ner tn k en n y los gr
nuye, tn k a erto punto, gir un de gura 4.4 se gura, la dete las estadísti
do determin n que >val
gión de rechaz rnativa de col
la propensión ve en el ejemp al, es equivale
el modelo
va
te de signif
ˆ
ˆ
j
j
t t
t t
zamos H0: figura 4.3 debe ser p porciona nin
la tabla esta rados de lib aumenta.
el enfoque antemano, y e representa
erminación icas para un
nado, sabem lor-p, por el
zo utilizando la a la derech
n marginal a c plo 1.1, contra ente a contras
c
0: j 0
H
1: j 0
H
ficación pos
se re no s
n k
n k
t t
j 0
en . Está muy positivo. Un
nguna evid adística de bertad. En
clásico es, y, dependie a el enfoqu del valor-p n determina mos que se
l contrario,
o la t:
ha. FIGU
consumir men astar la propo star si el térmi
cons 1 0
0
sitiva. La r
echaza e rechaza
H H
favor de H y claro que n resultado n dencia a fav
la t, sólo ne todo caso,
en algún se endo de esa ue alternativ p es la opera ado nivel de rechaza la la hipótesis
URA 4.4. El va alternativ
nor que la pro sición 3 de la ino independi
2inc u
egla de dec
0
0
H H
1: j 0
H c
e para rech negativo de vor de H1:
ecesitamos es importan
entido arbitr elección, la vo. Como s ación invers e significaci H0 para cu s nula no se
alor-p utilizan va de cola a la
opensión medi función de co ente es signif
cisión es en
(
cuando ˆ tj
hazar H0 c e ˆ
tj, no im
j 0
. Por conocer el ante destaca
rario, puest a H0 se rech se desprend sa de encont ión. Una ve ualquier niv e rechaza cu
ndo la t: hipó a derecha.
dia al consumo onsumo keyne ficativamente
n este
(4-12)
tn k
contra mporta
r otra nivel ar que
o que haza o de del
trar el z que vel de uando
ótesis
o?
esiana, mayor
Tenem
estima admis
signif grado estadí respec para región otras p
=1.17 rechaz
FIG
utiliz
Hipó
contr
mos que contr
Con una m
Los núme adores.
La pregun sible? A contin
1) En este
2) El contr
3) Regla d Es conve ficación de 0.
os de libertad ística de la t ctivamente), e Como t<1
=0.05 (t400.05 n de rechazo
palabras, los d En el enfo 71 para una t
za la H0.
GURA 4.5.Eje zando la t con
ótesis altern Consider
ra la hipótes
rastar si
muestra aleato
eros entre par nta que nos pla
nuación, respo caso, las hipó
raste estadístic
de decisión eniente utiliza
10 porque el son 40 (42 ob t (fila 40 y c encontramos q .303, no se re
1.684
) o =
corresponde a datos muestra oque alternati con 40 gl es
emplo 4.1: Re n hipótesis alt la derecha.
nativa de un remos ahora
sis alternativ
ria de 42 obse
i
cons
éntesis, debaj anteamos es la ondemos a est ótesis nula y a
co es:
0
1 1
1
ˆ ( )ˆ t ee
ar varios niv valor de t es bservaciones columna de 0 que t400.101.30 echaza la H0.
=0.01 (t400.012 a =0.10. Por
les no son con vo, como pue s igual a 0.12
egión de rech ternativa de c
na cola: izq a la hipótesi
va
1 0
ervaciones, se
(0.350)0.41 0.8(0.0
= +
jo de los coe
a siguiente: ¿e ta pregunta.
alternativa son
0 1
1 1
: 0
: 0
H H
0 1
1
ˆ 0 0
ˆ 0
( ) ee
veles de sig s relativament
menos 2 pará 0.10 o 0.20, 03 .
Si no rechaza 2.423 ), como r lo tanto, no nsistentes con ede verse en 24. Para <0.
hazo
cola a FIGU t con
uierda is nula
0: j 0
H
1: j 0
H
e han obtenido
843062)inci ficientes, son
es la tercera pr
n las siguiente
0.41 1.171 0.35
gnificación. C te pequeño (m ámetros estim
en las tabla
amos la H0 pa puede verse se puede rech n la proposició
la figura 4.6, .124 - por eje
RA 4.6. Ejem n hipótesis alt
0
0
o los siguientes
los errores e
roposición de
s:
Comencemos menor que 1.5 mados). Si nos s de una col
ara =0.10, ta en la figura 4 hazar la H0 en n 3 de Keyne
el valor-p co emplo, 0.10, 0
plo 4.1: El va ternativa de c
s resultados
estándar (ee)
la teoría keyn
con un niv 5). En este ca s fijamos en la
la, o de dos
ampoco se rec 4.5. En esta fig
n favor de la H es.
orrespondiente 0.05 y 0.01-,
alor-p utilizan cola a la dere
de los
nesiana
vel de so, los a tabla colas,
chazará gura la H1. En
e a tˆ1
no se
ndo la echa.
Este es un contraste de significación negativa.
La regla de decisión es en este caso es la siguiente:
Regla de decisión
ˆ 0
ˆ 0
Si se rechaza Si no se rechaza
j
j
n k
n k
t t H
t t H
(4-13)
Por lo tanto, rechazamos H0:j 0 en favor de H1:j para un 0 dado cuando ˆ
j n
t , como puede verse en la figura 4.7. Está muy claro que para rechazar t H0 en contra de H1:j , el valor de 0 ˆ
tj debe ser negativo. Un valor positivo de ˆ tj, no importa lo grande que sea, no proporciona ninguna evidencia a favor de H1:j . 0
En la figura 4.8 se representa el enfoque alternativo. Una vez que el valor-p ha sido determinado, se sabe que se rechaza H0 para cualquier nivel de significación tal que
>valor-p; por el contrario, la hipótesis nula no se rechaza cuando <valor-p.
FIGURA 4.7. Región de rechazo utilizando la t:
hipótesis alternativa de cola a la izquierda. FIGURA 4.8. El valor-p utilizando la t: hipótesis alternativa de cola a la izquierda.
EJEMPLO 4.2 ¿Tiene la renta una influencia negativa sobre la mortalidad infantil?
El siguiente modelo ha sido planteado para explicar las muertes de niños menores de 5 años por 1000 nacidos vivos (deathun5).
1 2 3
5
deathun gnipc ilitrate u
donde gnipc es la renta nacional bruta per cápita e ilitrate es la tasa de analfabetismo de adultos (15 años o más) en porcentaje.
Con una muestra de 130 países (fichero hdr2010) se ha realizado la siguiente estimación:
(5.93) (0.00028) (0.183)
5i 27.91 0.000826 i 2.043 i deathun = - gnipc + ilitrate
Los números entre paréntesis, debajo de los coeficientes, son los errores estándar (ee) de los estimadores.
Una de las preguntas formuladas por los investigadores es si la renta tiene una influencia negativa sobre la mortalidad infantil. Para responder a esta pregunta se lleva a cabo un contraste en el que las hipótesis nula y alternativa y el estadístico de contraste son los siguientes:
0 2
1 2
: 0
: 0
H H
22
ˆˆ 0.0008260.00028 2.966 t ( )
ee
Dado que el valor de t es relativamente alto, vamos a empezar a contrastar con un nivel del 1%.
Para =0.01, t130 20.01 t600.012.390. Teniendo en cuenta que t<-2.390, como se muestra en la figura 4.9, se rechaza la H0 a favor de la H1. Por lo tanto, la renta nacional bruta per cápita tiene una influencia que es significativamente negativa en la mortalidad de niños menores de 5 años; es decir, cuanto mayor sea la
Región de no rechazo
RNR Región
de rechazo
RR
tn k
tn k
0
No se rechaza para α>p-value
Se rechaza para
ɑ<p-value tn k
ˆj
t 0
p-value
renta Como
ˆ1
t =-2 se rec
FIG
utili
Hipó
contr
por intere
R
cuan H0 a nega
absol E se re
nacional brut o la H0 se ha re
En el enfo 2.966 para t c chaza la H0.
GURA 4.9. Eje izando la t co col
ótesis altern Consider
ra la hipótes
Esta es l la teoría o esados en e La regla Regla de dec
Por lo ta ndo ˆ
tj favor de H ativo.
Es impo luto.
En el enfoqu echaza H0 p
ta per cápita m echazado para oque alternativ
on menos de
emplo 4.2: Re on una hipóte la a la izquier
nativa con d remos ahora
sis alternativ
la alternativ o el sentido el valor abso de decisión cisión
Si Si
anto, rechaz
/2
tn k , como
1: j 0
H ,
ortante hac ue alternativ para cualqu
más bajo será a =0.01, tamb
vo, como pue 61 gl es igual
egión de rech esis alternativ
rda.
dos colas a la hipótesi
va
va relevante o común. C
oluto del est n en este cas
ˆ
ˆ
j
j
t t
zamos H0 puede vers
ˆj
t debe s
cer notar q vo, una vez uier nivel de
á el porcentaj mbién será rech ede verse en l l a 0.0000. Pa
hazo
va de FIGU
la t
is nula
0: j 0
H
1: j 0
H
e cuando el Cuando la tadístico t. E so es la sigu
/2
/2
se re no s
n k
n k
t t
:j en0 e en la figu ser lo sufici
que cuando z que el val e significac
je de mortalid hazada por los la figura 4.10 ara todos los
URA 4.10. Eje t con una hip
0
0
l signo de alternativa Este es un c uiente:
echaza se rechaza
favor de H ura 4.11. En
ientemente
o decrec lor-p ha sid ción si >v
dad de niños m s niveles de 5%
, el valor-p co
>0.0000 com
mplo 4.2: El ótesis alterna
izquierda.
j no está b es de dos contraste de
0
0
H H
1: j 0
H
n este caso, grande, bie
ce, tn k/2 au do determina
valor-p; por
menores de 5
% y 10%.
orrespondient mo 0.01, 0.05 y
valor-p utiliz ativa de cola
bien determ s colas, est e significaci
(
para un para recha en sea posit
umenta en nado, se sab
r el contrar
5 años.
te a un y 0.10,
zando a la
inado tamos ión.
(4-14)
dado zar la tivo o
valor e que rio, la
hipót las d
F
que e un
EJEM
model
donde margi
(prim claro:
entre
crimin pregu
Para inform a favo con un
vemo que e 0.000 Como 0.000 valor-
tesis nula n dos colas de
FIGURA 4.11. R hipótesis a
Cuando el contraste dado, se sue
MPLO 4.3 La ta Para expli lo:
e rooms es el inal" en la zon Los resul eras 55 obser "Estadístico el "Coeficient En relació nalidad juega unta, se ha llev En este ca
CUADRO
C rooms lowstat crime Dado que
=0.01, t510.01/ 2
mación para ca or de la H1. Po n nivel de sign En el enfo s que el valor l estadístico t 1. Es decir, e o puede verse 2, tales como -p sería igual
no se rechaz forma simé
Región de rec alternativa de
no se espe e de hipótes
ele decir qu
asa de delincu icar el precio
pri l número de h na y crime son ltados del mo rvaciones), ap
t" es el dato r te" y el "Error ón con este m a un papel im vado a cabo el aso, la hipótesi
0 4
1 4
: : H H
O 4.2. Salida e Variable
el valor de t e
2 0.01/ 2
50 2.6
t
ada gl, uno a u or lo tanto, la
nificación del oque alternativ r de valor-p pa t sea mayor d el valor de va e en esta figu
0.01, 0.05 y 0 a 0.0002/1=0.
za cuando étrica, como
chazo usando e dos colas.
cífica una h sis es de do ue "xj es esta
uencia, ¿juega de la viviend
1 2
ice ro habitaciones n los delitos co
odelo ajustad parece en el c
requerido para r estándar", y
modelo la pr mportante en siguiente pro is nula y altern
0 0
estándar en u Coeficie -1569 6788 -268.
-3853 es relativamen 69 . (En las t uno, más allá delincuencia 1% y, por tan vo podemos r ara el coeficie de 4.016 es 0.0
lor-p, como s ura, se rechaz 0.10. Si se tra .0001.
<valor-p. E o se muestra
o t: FIGUR
us
hipótesis al os colas. Si adísticamen
a un papel en da en una ciud
ooms3lows de la casa, lo ometidos per c do realizado cuadro 4.2. El a hacer un con
"Prob" es el v regunta que s
el precio de ocedimiento.
nativa, y el es
ˆ4
t ( ee
una regresión
ente Error es
93.61 80
8.401 12
1636 80
3.564 95
nte alto, vamo tablas estadíst de 20). Tenie tiene una infl nto, de un 5%
realizar el con ente crime es d 0001 y la pro se muestra en za H0 para to atara de un con
En este caso a en la figur
RA 4.12. valor ando t: hipót
lternativa, p se rechaza nte significa
el precio de l dad estadounid
stat4crime owstat es el p capita en la zo con E-views l significado d ntraste de sign valor-p para un se hacen los las casas de
stadístico de c
4 4
3854 ˆ ) 960
n para explica stándar Esta 021.989 - 210.720 0.70678 - 59.5618 - os a empezar a ticas habituale endo en cuenta luencia signifi
y 10%.
ntraste con m de 0.0002. Eso obabilidad de n la figura 4.1 odos los nivel ntraste de una
o valor-p se ra 4.12.
r-p usando t:
esis alternati
por lo gener la H0 a fav ativa para el
la vivienda de dense se ha es
e u
porcentaje de ona.
s, utilizando de las tres pri nificación, es n contraste de investigadore
la zona. Par
ontraste, son l
4.016
ar el precio d adístico t
-1.956324 5.606910 -3.322690 -4.015962 a contrastar pa es para la dis a que t 2.6 icativa en el p
ayor precisión o significa qu
que t sea men 3 se distribuy les de signific cola, en el en
e distribuye
Región de re iva de dos col
ral, se cons vor de la H1
l nivel ".
e un área?
stimado el sig
personas de
el fichero h imeras colum decir, es la re e dos colas.
es es si la ta ra responder
los siguientes
de una casa. n Prob.
0.0559 0.0000 0.0017 0.0002 ara un nivel d stribución t, n 69, rechazamo
precio de la vi
n. En el cuad ue la probabili enor de -4.016
ye en los dos icación superi nfoque alterna
entre
echazo las.
sidera
1 para
guiente
"clase
hprice2 mnas es elación
asa de a esta
:
n=55.
del 1%.
no hay s la H0
vienda
ro 4.2, dad de 6 es de lados.
iores a ativo el
el qu que e
dista
EJEM
en fru
donde punde elastic result
¿Es la hipóte
Para lo tan rechaz
FIGURA
Hasta ah ue un parám el parámetro
En este c
Al igual anciada de
MPLO 4.4 ¿Es l Para respo uta (fruit):
e inc es la ren er5 es la propo Dado que cidad del gast ados del cuad
CUADRO
C ln(inc) househs punder5
a elasticidad d Para respo esis nula y alte
Para =0.
=0.05, t360.05/ 2
nto, rechazam zamos para =
4.13. Ejempl
hora hemos metro toma e o en la H0 to
caso, el esta
l que antes
0
j, valor qu
la elasticidad onder a estas d
ln(fruit) nta disponible orción de niño las variables f to/renta. Utiliz dro 4.3.
O 4.3. Salida e Variable
size 5
del gasto en fr onder a esta pr ernativa, y el
0 2
1 2
: 1
: 1
H H
.10, nos enco
2 0.05/ 2
35 2.0
t
mos que la el
=0.05, ni para
o 4.3: valor-p
visto el con el valor 0 en
oma un valo H adístico t ad
t s, ˆ
j
t mide ue toma el p
del gasto en f dos preguntas
1 2
) ln(i e de los hoga os menores de fruit e inc apa zando una mu
estándar de u Coeficie
-9.767 2.004 -1.205 -0.017
rutas/ renta ig regunta, se ha estadístico de
ontramos con 03 . Como t| |
lasticidad del a=0.01.
p utilizando t:
ntraste sign n la H0. Aho
or específic
0: j j
H decuado es
ˆ
ˆ ( )ˆ
j
j j
j
t ee
e la cantid parámetro en
frutas/renta ig s vamos a util
) 3
inc house ares, househsi e cinco años en
arecen expres uestra de 40 h
una regresión ente Error es
7654 3.7
4539 0.5
5348 0.1
7946 0.0
gual a 1?
a llevado a cab e contraste, son
0
2 2
2
ˆ ( )ˆ t ee
que t360.10/ 2
| <2.03 no rec l gasto en fru
: hipótesis alt
nificativo de ora vamos a o cualquier
0
j
0
)
j
ad de desv n la hipótes
gual a 1? ¿Es lizar el siguien
ehsize4pun ize es el núme
n el hogar.
adas en logar hogares (fiche
n que explica stándar Esta
701469 -2
512370 3
178646 -
013022 -
bo el siguient n los siguiente
2 2
ˆ 1 2.0
ˆ 0
( ) ee
0.10/ 2
35 1.69
t .
chazamos H0 p uta/renta sea
ternativa de d
e una cola y a ver un caso
a:
viaciones es is nula.
s la fruta un b nte modelo pa
nders u ero de miemb
itmos naturale ero demand),
los gastos en dístico t P 2.638859 3.912286 6.747147 1.378128
e procedimien es:
005 1 1.961 .512
Como | |t >1 para =0.05, n igual a 1 pa
dos colas.
y de dos col o más gener
stándar est
bien de lujo?
ara explicar e
bros de la fam
es, entonces se han obteni
fruta. n=40.
Prob.
0.0122 0.0004 0.0000 0.1767
nto. En este ca
1
1.69 se recha ni para =0.0 ara=0.10, pe
las en ral en
tá ˆj
l gasto
milia y
2 es la ido los
aso las
aza H0. 01. Por ero no