TAMAÑO MUESTRAL PARA LA COMPARACIÓN DE MEDIAS

DETERMINACIÓN DEL TAMAÑO MUESTRAL

9.3 TAMAÑO MUESTRAL PARA LA COMPARACIÓN DE MEDIAS

Muchos diseños epidemiológicos, bien sean observacionales (estudios de cohortes o de casos y controles) o experimentales (ensayos clínicos), se realizan con un afán comparativo, donde el objetivo no es tanto estimar la magnitud de un determinado parámetro poblacional, sino más bien comparar parámetros entre distintas poblaciones. En tales diseños, el problema radica en determinar el tamaño muestral mínimo necesario en cada grupo de comparación, de tal forma que el contraste de hipótesis que se pretende realizar tenga una potencia suficiente para detectar posibles diferencias clínica o epidemiológicamente relevantes. En este apartado se presentan

143 Tamaño muestral para la comparación de medias

Pastor-Barriuso R.

las fórmulas del tamaño muestral para contrastar diferencias en los niveles medios de una variable cuantitativa a partir de dos muestras dependientes o independientes.

9.3.1 Tamaño muestral para la comparación de medias en dos muestras independientes Supongamos que se pretende contrastar la hipótesis nula H₀: μ₁ = μ₂ de igualdad de medias frente a la hipótesis alternativa bilateral H₁: μ₁ ≠ μ₂ en dos distribuciones con igual varianza σ₁²

= σ₂² = σ². Según los resultados del Apartado 6.3, la distribución muestral de la diferencia de medias

5 1.2 MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central informan acerca de cuál es el valor más representativo de una determinada variable o, dicho de forma equivalente, estos estimadores indican alrededor de qué valor se agrupan los datos observados. Las medidas de tendencia central de la muestra sirven tanto para resumir los resultados observados como para realizar inferencias acerca de los parámetros poblacionales correspondientes. A continuación se describen los principales estimadores de la tendencia central de una variable.

1.2.1 Media aritmética

La media aritmética, denotada por x, se define como la suma de cada uno de los valores muestrales dividida por el número de observaciones realizadas. Si denotamos por n el tamaño muestral y por xi el valor observado para el sujeto i-ésimo, i = 1, ..., n, la media vendría dada por

n x x

x x

x n ⁿ ⁿ

i i

+ +

= +



1 1 2 ...

1 .

La media es la medida de tendencia central más utilizada y de más fácil

interpretación. Corresponde al “centro de gravedad” de los datos de la muestra. Su principal limitación es que está muy influenciada por los valores extremos y, en este caso, puede no ser un fiel reflejo de la tendencia central de la distribución.

Ejemplo 1.4 En este y en los sucesivos ejemplos sobre estimadores muestrales, se utilizarán los valores del colesterol HDL obtenidos en los 10 primeros sujetos del estudio “European Study on Antioxidants, Myocardial Infarction and Cancer of the Breast“ (EURAMIC), un estudio multicéntrico de casos y controles realizado entre 1991 y 1992 en ocho países Europeos e Israel para evaluar el efecto de los

1 –

5 1.2 MEDIDAS DE TENDENCIA CENTRAL

1.2.1 Media aritmética

n x x

x x

x n ⁿ ⁿ

i i

+ +

= +



1 1 2 ...

1 .

La media es la medida de tendencia central más utilizada y de más fácil

2 en muestras independientes de tamaño n₁ y n₂ será aproximadamente normal con media μ₁ – μ₂ = 0 bajo H₀ y μ₁ – μ₂ ≠ 0 bajo H₁, y varianza σ₁² /n₁ + σ₂² /n₂ = σ²(1/n₁ + 1/n₂) (Figura 9.1). Para asegurar una probabilidad α de cometer un error de tipo I, la hipótesis nula se rechazará sólo si el estadístico

8 9.3 TAMAÑO MUESTRAL PARA LA COMPARACIÓN DE MEDIAS

Muchos diseños epidemiológicos, bien sean observacionales (estudios de cohortes o de casos y controles) o experimentales (ensayos clínicos), se realizan con un afán

comparativo, donde el objetivo no es tanto estimar la magnitud de un determinado parámetro poblacional, sino más bien comparar parámetros entre distintas poblaciones.

En tales diseños, el problema radica en determinar el tamaño muestral mínimo necesario en cada grupo de comparación, de tal forma que el contraste de hipótesis que se

pretende realizar tenga una potencia suficiente para detectar posibles diferencias clínica o epidemiológicamente relevantes. En este apartado se presentan las fórmulas del tamaño muestral para contrastar diferencias en los niveles medios de una variable cuantitativa a partir de dos muestras dependientes o independientes.

9.3.1 Tamaño muestral para la comparación de medias en dos muestras independientes

Supongamos que se pretende contrastar la hipótesis nula H0: μ1 = μ2 de igualdad de medias frente a la hipótesis alternativa bilateral H1: μ1 ≠ μ2 en dos distribuciones con igual varianza σ1² = σ2² = σ². Según los resultados del Apartado 6.3, la distribución muestral de la diferencia de medias x1 - x2 en muestras independientes de tamaño n1 y n2 será aproximadamente normal con media μ1 - μ2 = 0 bajo H0 y μ1 - μ2 ≠ 0 bajo H1, y varianza σ1²/n1 + σ2²/n2 = σ²(1/n1 + 1/n2) (Figura 9.1). Para asegurar una probabilidad α de cometer un error de tipo I, la hipótesis nula se rechazará sólo si el estadístico

2 1

/ 1 /

1 n n

x x

−

σ ≤ z1 α/2 ó

2 1

/ 1 /

1 n n

x x

−

σ ≥ z1 α/2

o, equivalentemente, si la diferencia de medias

  

o, equivalentemente, si la diferencia de medias

x1 x2≤ z1 α/2σ 1/n₁ +1/n₂ ó x1 x2 ≥ z1 α/2σ 1/n₁ +1/n₂ . Así, bajo la hipótesis alternativa, la potencia del test para detectar una diferencia subyacente μ1 - μ2 vendrá dada por

1 - β = P(x1 - x2 ≤ -z1-α/2σ 1/n₁ +1/n₂ | H1) + P(x1 - x2 ≥ z1-α/2σ 1/n₁ +1/n₂ | H1).

Asumiendo sin pérdida de generalidad que μ1 < μ2 (Figura 9.1), la segunda probabilidad de la expresión anterior, que representa el evento de que x1 sea apreciablemente mayor que x2, será virtualmente cero. La potencia se reduce entonces a

1 - ^β = P(x1 - x2 ≤ -z1-α/2σ 1/n₁ +1/n₂ | H1)

= 











−

− +

≤ − +

−

− −

1 2

2 1 2 1

2 / 1 2

2 1 2 1

/ 1 / 1

) (

/ 1 / 1 /

1 / 1

)

( H

n n

n n z

n n x P x

μ μ σ

μ α

= 











+ + −

−

Φ ₋

2 1

2 2 1

1 1/ 1/

n z n

μ μ

α ,

donde la última igualdad se deriva de la distribución normal de x1 - x2 bajo la hipótesis alternativa. Notar que se alcanzaría el mismo resultado si μ1 > μ2. Esta expresión

permite determinar a posteriori la potencia de un contraste para detectar una diferencia de medias subyacente μ1 - μ2 a partir de dos muestras independientes de tamaños n1 y n2.

[Figura 9.1 aproximadamente aquí]

Ejemplo 9.3 En un ensayo clínico para evaluar la eficacia antihipertensiva de un nuevo fármaco en combinación con un tratamiento estándar, se asignaron



   

Así, bajo la hipótesis alternativa, la potencia del test para detectar una diferencia subyacente μ₁ – μ₂ vendrá dada por

9 x1 - x2 ≤ -z1-α/2σ 1/n₁ +1/n₂ ó x1 - x2 ≥ z1-α/2σ 1/n₁ +1/n₂ .

Así, bajo la hipótesis alternativa, la potencia del test para detectar una diferencia subyacente μ1 - μ2 vendrá dada por

1 ^β = P(x1 x2 ≤ z1α/2σ 1/n₁ +1/n₂ | H1) + P(x1 x2≥ z1 α/2σ 1/n₁ +1/n₂ | H1).

1 - β = P(x1 - x2 ≤ -z1-α/2σ 1/n₁ +1/n₂ | H1)

= 











−

− +

≤ − +

−

− ₋

1 2

2 1 2 1

2 / 1 2

2 1 2 1

/ 1 / 1

) (

/ 1 / 1 /

1 / 1

)

( H

n n

n n z

n n x P x

μ μ σ

μ α

= 











+ + −

−

Φ ₋

2 1

2 2 1

1 1/ 1/

n z n

μ μ

α ,

donde la última igualdad se deriva de la distribución normal de x1 - x2 bajo la hipótesis alternativa. Notar que se alcanzaría el mismo resultado si μ1 > μ2. Esta expresión

permite determinar a posteriori la potencia de un contraste para detectar una diferencia de medias subyacente μ1 - μ2 a partir de dos muestras independientes de tamaños n1 y n2.

[Figura 9.1 aproximadamente aquí]

Ejemplo 9.3 En un ensayo clínico para evaluar la eficacia antihipertensiva de un nuevo fármaco en combinación con un tratamiento estándar, se asignaron

   

 

Figura 9.1

)) / 1 / 1 ( ,

~ (

2 2 1

2 1 2

1 x N n n

x − → μ −μ σ +

α/2 α/2

1 -β

μ₁-μ₂ 0

H₀: μ₁= μ₂ H₁: μ₁≠μ₂

)) / 1 / 1 ( , 0

~ (

2 2 1

1 x N n n

x − → σ +

2 1 2 /

1 1/n 1/n

z +

− ₋_α σ z₁₋_α_/₂σ 1/n₁+1/n₂ ))

/ 1 / 1 ( ,

~ (

2 2 1

2 1 2

1 x N n n

x − → μ −μ σ +

α/2 α/2

1 -β

μ₁-μ₂ 0

H₀: μ₁= μ₂ H₁: μ₁≠μ₂

)) / 1 / 1 ( , 0

~ (

2 2 1

1 x N n n

x − → σ +

2 1 2 /

1 1/n 1/n

z +

− ₋_α σ z₁₋_α_/₂σ 1/n₁+1/n₂

Figura 9.1 Representación de la potencia del contraste bilateral de medias a partir de dos muestras independientes.

144

Determinación del tamaño muestral

Pastor-Barriuso R.

Asumiendo sin pérdida de generalidad que μ₁ < μ₂ (Figura 9.1), la segunda probabilidad de la expresión anterior, que representa el evento de que

5 1.2 MEDIDAS DE TENDENCIA CENTRAL

1.2.1 Media aritmética

n x x

x x

x n ⁿ ⁿ

i i

+ +

= +



1 1 2 ...

La media es la medida de tendencia central más utilizada y de más fácil

1 sea apreciablemente mayor que

5 1.2 MEDIDAS DE TENDENCIA CENTRAL

1.2.1 Media aritmética

n x x

x x

x n ⁿ ⁿ

i i

+ +

= +



1 1 2 ...

La media es la medida de tendencia central más utilizada y de más fácil

2, será virtualmente cero. La potencia se reduce entonces a

9 x1 - x2 ≤ -z1-α/2σ 1/n₁ +1/n₂ ó x1 - x2 ≥ z1-α/2σ 1/n₁ +1/n₂ .

Así, bajo la hipótesis alternativa, la potencia del test para detectar una diferencia subyacente μ1 - μ2 vendrá dada por

1 - ^β = P(x1 - x2 ≤ -z1-α/2σ 1/n₁ +1/n₂ | H1) + P(x1 - x2 ≥ z1-α/2σ 1/n₁ +1/n₂ | H1).

1 β = P(x1 x2≤ z1α/2σ 1/n₁ +1/n₂ | H1)

= 











−

− +

≤ − +

−

− ₋

1 2

2 1 2 1

2 / 1 2

2 1 2 1

/ 1 / 1

) (

/ 1 / 1 /

1 / 1

)

( H

n n

n n z

n n x P x

μ μ σ

μ α

= 











+ + −

−

Φ ₋

2 1

2 2 1

1 1/ 1/

n z n

μ μ

α ,

donde la última igualdad se deriva de la distribución normal de x1 - x2 bajo la hipótesis alternativa. Notar que se alcanzaría el mismo resultado si μ1 > μ2. Esta expresión

permite determinar a posteriori la potencia de un contraste para detectar una diferencia de medias subyacente μ1 - μ2 a partir de dos muestras independientes de tamaños n1 y n2.

[Figura 9.1 aproximadamente aquí]

Ejemplo 9.3 En un ensayo clínico para evaluar la eficacia antihipertensiva de un nuevo fármaco en combinación con un tratamiento estándar, se asignaron

− −

donde la última igualdad se deriva de la distribución normal de

5 1.2 MEDIDAS DE TENDENCIA CENTRAL

1.2.1 Media aritmética

n x x

x x

x n ⁿ ⁿ

i i

+ +

= +



1 1 2 ...

La media es la medida de tendencia central más utilizada y de más fácil

1 –

5 1.2 MEDIDAS DE TENDENCIA CENTRAL

1.2.1 Media aritmética

n x x

x x

x n ⁿ ⁿ

i i

+ +

= +



1 1 2 ...

La media es la medida de tendencia central más utilizada y de más fácil

2 bajo la hipótesis alternativa. Notar que se alcanzaría el mismo resultado si μ₁ > μ₂. Esta expresión permite determinar a posteriori la potencia de un contraste para detectar una diferencia de medias subyacente μ₁ – μ₂ a partir de dos muestras independientes de tamaños n₁ y n₂.

Ejemplo 9.3 En un ensayo clínico para evaluar la eficacia antihipertensiva de un nuevo fármaco en combinación con un tratamiento estándar, se asignaron aleatoriamente 50 pacientes hipertensos al grupo de monoterapia estándar y otros 50 pacientes de similares características al grupo de tratamiento combinado con el nuevo fármaco. Después de 4 semanas de tratamiento, la media y la desviación típica de la presión arterial sistólica fueron 155 y 22 mm Hg en el grupo de monoterapia, y 150 y 18 mm Hg en el grupo de tratamiento combinado. Como paso previo a la comparación de medias, se contrasta la igualdad de varianzas mediante el estadístico

10 aleatoriamente 50 pacientes hipertensos al grupo de monoterapia estándar y otros 50 pacientes de similares características al grupo de tratamiento combinado con el nuevo fármaco. Después de 4 semanas de tratamiento, la media y la desviación típica de la presión arterial sistólica fueron 155 y 22 mm Hg en el grupo de monoterapia, y 150 y 18 mm Hg en el grupo de tratamiento combinado. Como paso previo a la comparación de medias, se contrasta la igualdad de varianzas mediante el estadístico

F = ₂ ₂²

2 12

= 22 s

s = 1,49,

que bajo la distribución F de Fisher con n1 – 1 = 49 y n2 – 1 = 49 grados de libertad, corresponde a un valor P bilateral 2P(F49,49 ≥ 1,49) = 2⋅0,082 = 0,164.

Así, la comparación del nivel medio de presión arterial sistólica entre ambos grupos puede realizarse mediante la prueba t de Student para muestras independientes asumiendo igualdad de varianzas, cuyo estadístico resulta

t =

50 1 50 1 1 , 20

150 155 1

2 1

= − +

− n s n

x = 1,24,

donde la varianza combinada es s² = {(50 - 1)22² + (50 - 1)18²}/(50 + 50 - 2) = 404. Utilizando la distribución t de Student con n1 + n2 – 2 = 98 grados de libertad, el valor P bilateral es 2P(t98 ≥ 1,24) = 2⋅0,108 = 0,216; es decir, los resultados del estudio no aportan suficiente evidencia para afirmar que el tratamiento combinado es más eficaz que la monoterapia.

que bajo la distribución F de Fisher con n₁ – 1 = 49 y n₂ – 1 = 49 grados de libertad, corresponde a un valor P bilateral 2P(F_49,49 ≥ 1,49) = 2∙0,082 = 0,164. Así, la comparación del nivel medio de presión arterial sistólica entre ambos grupos puede realizarse mediante la prueba t de Student para muestras independientes asumiendo igualdad de varianzas, cuyo estadístico resulta

F = ₂ ₂²

2 12

=22 s

s = 1,49,

que bajo la distribución F de Fisher con n1 – 1 = 49 y n2 – 1 = 49 grados de libertad, corresponde a un valor P bilateral 2P(F49,49 ≥ 1,49) = 2⋅0,082 = 0,164.

t =

50 1 50 1 1 , 20

150 155 1

2 1

= − +

− n s n

x = 1,24,

donde la varianza combinada es s² = {(50 – 1)22² + (50 – 1)18²}/(50 + 50 – 2) = 404.

Utilizando la distribución t de Student con n₁ + n₂ – 2 = 98 grados de libertad, el valor P bilateral es 2P(t₉₈ ≥ 1,24) = 2∙0,108 = 0,216; es decir, los resultados del estudio no aportan suficiente evidencia para afirmar que el tratamiento combinado es más eficaz que la monoterapia.

A partir de estos resultados cabría preguntarse si en realidad ambos tratamientos son igualmente eficaces o si, por el contrario, el estudio carece de potencia suficiente para detectar una diferencia que, aun siendo moderada o pequeña, sea importante en términos clínicos. Si se considera clínicamente relevante una diferencia absoluta de |μ₁ – μ₂| = 5 mm Hg en la presión arterial sistólica media, y asumiendo un nivel de significación α =

145 Tamaño muestral para la comparación de medias

Pastor-Barriuso R.

0,05 y una desviación típica σ = 20 mm Hg en ambos grupos, la potencia para detectar dicha diferencia en un estudio con n₁ = n₂ = 50 sería

11 importante en términos clínicos. Si se considera clínicamente relevante una diferencia absoluta de |μ1 - μ2| = 5 mm Hg en la presión arterial sistólica media, y asumiendo un nivel de significación α = 0,05 y una desviación típica σ = 20 mm Hg en ambos grupos, la potencia para detectar dicha diferencia en un estudio con n1 = n2 = 50 sería

1 β = 



 





+ +

−

Φ 20 1/50 1/50 96 5

,1 = Φ( 0,71) = 0,239.

Es decir, únicamente un 23,9% de los estudios con este tamaño muestral

detectarían como estadísticamente significativa una diferencia real de 5 mm Hg.

Por tanto, no es sorprendente que el estudio anterior arrojara un resultado no significativo, aun cuando exista una diferencia subyacente de dicha magnitud entre ambos tratamientos.

Como ilustra el ejemplo anterior, en el diseño de un estudio es importante determinar a priori qué tamaño muestral será necesario en cada grupo de comparación para evitar la obtención de resultados no concluyentes por falta de potencia. Supongamos, en el caso más general, que se pretende asignar distinto tamaño a ambas muestras n2 = kn1, donde k es un número positivo prefijado. A partir de la fórmula de la potencia con n2 = kn1, y recordando que Φ(z1-β) = 1 - β, se sigue que

1 1

2 2 1

/ 1

1 1 1

kn n z

+ + −

−

= ₋

−

α μ

β ,

de donde puede despejarse n1 para obtener

2 2 1

2 1 2

2 / 1

1 ( )

) )(

1 (

μ μ

β σ

− +

= + ⁻ ⁻

z z

n k ,

− −

Es decir, únicamente un 23,9% de los estudios con este tamaño muestral detectarían como estadísticamente significativa una diferencia real de 5 mm Hg. Por tanto, no es sorprendente que el estudio anterior arrojara un resultado no significativo, aun cuando exista una diferencia subyacente de dicha magnitud entre ambos tratamientos.

Como ilustra el ejemplo anterior, en el diseño de un estudio es importante determinar a priori qué tamaño muestral será necesario en cada grupo de comparación para evitar la obtención de resultados no concluyentes por falta de potencia. Supongamos, en el caso más general, que se pretende asignar distinto tamaño a ambas muestras n₂ = kn₁, donde k es un número positivo prefijado.

A partir de la fórmula de la potencia con n₂ = kn₁, y recordando que Φ(z_1–β) = 1 – β, se sigue que

1 - β = 

 





+ +

−

Φ 20 1/50 1/50 96 5

,1 = Φ(-0,71) = 0,239.

Es decir, únicamente un 23,9% de los estudios con este tamaño muestral

detectarían como estadísticamente significativa una diferencia real de 5 mm Hg.

Por tanto, no es sorprendente que el estudio anterior arrojara un resultado no significativo, aun cuando exista una diferencia subyacente de dicha magnitud entre ambos tratamientos.

1 1

2 2 1

/ 1

1 1 1

kn n z

+ + −

−

= ₋

−

μ μ

β ,

de donde puede despejarse n1 para obtener

2 2 1

2 1 2

2 / 1

1 ( )

) )(

1 (

μ μ

β σ

− +

= + ⁻ ⁻

z z

n k ,

de donde puede despejarse n₁ para obtener

1 - β = 

 





+ +

−

Φ 20 1/50 1/50 96 5

,1 = Φ(-0,71) = 0,239.

Es decir, únicamente un 23,9% de los estudios con este tamaño muestral

detectarían como estadísticamente significativa una diferencia real de 5 mm Hg.

Por tanto, no es sorprendente que el estudio anterior arrojara un resultado no significativo, aun cuando exista una diferencia subyacente de dicha magnitud entre ambos tratamientos.

1 1

2 2 1

/ 1

1 1 1

kn n z

+ + −

−

= ₋

−

μ μ

β ,

de donde puede despejarse n1 para obtener

2 2 1

2 1 2

2 / 1

1 ( )

) )(

1 (

μ μ

β σ

− +

= + ⁻ ⁻

z z

n k ,

que corresponde al tamaño necesario en la primera muestra y n₂ = kn₁ al de la segunda muestra.

En el caso particular de que se desee un mismo tamaño muestral en ambos grupos k = 1, éste vendrá determinado por

que corresponde al tamaño necesario en la primera muestra y n2 = kn1 al de la segunda muestra. En el caso particular de que se desee un mismo tamaño muestral en ambos grupos k = 1, éste vendrá determinado por

2 2 1

2 1 2

2 / 1 2

1 ( )

) (

μ μ

β σ

−

= +

= z⁻ z⁻

n .

La asignación de igual tamaño a ambas muestras es, en general, más eficiente ya que da lugar a un menor tamaño total del estudio. No obstante, hay situaciones prácticas en las que es preferible seleccionar muestras de distinto tamaño, aun cuando ello conlleve un aumento de la muestra total para alcanzar la misma potencia; tal es el caso de los estudios donde la disponibilidad de sujetos o los costes difieren entre los grupos, o cuando se requieren estimaciones más precisas en uno de los grupos. Además de estas consideraciones, en el cálculo del tamaño muestral para la comparación de medias es necesario determinar previamente los siguientes elementos:

• El nivel de significación α del contraste bilateral, que representa la probabilidad de rechazar erróneamente la hipótesis nula y se establece usualmente en α = 0,05.

• La potencia 1 - β del contraste, que determina la probabilidad de detectar hipótesis alternativas ciertas y se fija habitualmente en 1 - β = 0,80 ó 0,90.

• La varianza poblacional σ². En la determinación del tamaño muestral suele asumirse que la varianza es común para ambos grupos, ya que generalmente se carece de información previa suficiente para determinar una varianza específica en cada uno de los grupos.

• La diferencia mínima detectable |μ1 - μ2|. El tamaño muestral será tanto mayor cuanto menor sea la diferencia que se pretende detectar. La magnitud de esta

y El nivel de significación α del contraste bilateral, que representa la probabilidad de rechazar erróneamente la hipótesis nula y se establece usualmente en α = 0,05.

y La potencia 1 – β del contraste, que determina la probabilidad de detectar hipótesis alternativas ciertas y se fija habitualmente en 1 – β = 0,80 ó 0,90.

y La varianza poblacional σ². En la determinación del tamaño muestral suele asumirse que la varianza es común para ambos grupos, ya que generalmente se carece de información previa suficiente para determinar una varianza específica en cada uno de los grupos.

y La diferencia mínima detectable |μ₁ – μ₂|. El tamaño muestral será tanto mayor cuanto menor sea la diferencia que se pretende detectar. La magnitud de esta diferencia debe ser

In document BIOESTADÍSTICA - GESDoc (página 152-157)