• No se han encontrado resultados

Muestreo y Tamaño de Muestra

N/A
N/A
Protected

Academic year: 2021

Share "Muestreo y Tamaño de Muestra"

Copied!
172
0
0

Texto completo

(1)

MUESTREO Y

TAMAÑO DE MUESTRA

Una guía práctica para personal

de salud que realiza investigación

Víctor M. Velasco Rodríguez

Verónica A. Martínez Ordaz

José Roiz Hernández

Francisco Huazano García

(2)

Muestreo y tamaño

de muestra

Una guía práctica para personal de salud que realiza investigación

(3)

MC. VÍCTOR MANUEL VELASCO RODRÍGUEZ Coordinador de Investigación en Salud

Delegación Coahuila

Instituto Mexicano del Seguro Social

MC. VERÓNICA ARACELI MARTÍNEZ ORDAZ

Investigador. Unidad de Investigación en Epidemiología Clínica Hospital de Especialidades Nº 71, Torreón, Coahuila

Instituto Mexicano del Seguro Social MC. JOSÉ ROIZ HERNÁNDEZ

Investigador. Unidad de Investigación en Epidemiología Clínica Hospital de Especialidades Nº 71, Torreón, Coahuila

Instituto Mexicano del Seguro Social MC. FRANCISCO HUAZANO GARCÍA Especialista en Anestesiología.

Hospital General de Zona Nº 16, Torreón, Coahuila Instituto Mexicano del Seguro Social

MC. ARMANDO NIEVES RENTERÍA Especialista en Dermatología.

Hospital de Especialidades Nº 71, Torreón, Coahuila Instituto Mexicano del Seguro Social

(4)

Víctor Manuel Velasco R. (ed.),

Verónica Araceli Martínez O., José Roiz Hernández,

Francisco Huazano G., Armando Nieves R.

Muestreo y tamaño

de muestra

Una guía práctica para personal

de salud que realiza investigación

(5)

Esta obra también está disponible en soporte papel, bajo la modalidad de “libro a pedido”.

© 2002, por Víctor Manuel Velasco Rodríguez (ed.)

© Primera edición virtual y en papel, e-libro.net, Buenos Aires, enero de 2003.

ISBN 987-9499-36-0

(6)

Todos los triunfos nacen cuando nos atreve-mos a comenzar.

(7)

A todos nuestros alumnos y a la gente inquieta que labora en áreas de la salud y que desean contribuir al conocimiento científico, porque ellos son nuestra moti-vación diaria y la esperanza de brindar una mejor atención a nuestros enfermos

(8)

PRÓLOGO

DURANTE el tiempo en que hemos tenido la gran experiencia

de participar en la enseñanza de la metodología de la investiga-ción científica con personal de salud, nos hemos percatado de la dificultad que implica la incorporación e integración mental de los procesos matemáticos y estadísticos al quehacer de la investiga-ción clínica, lo que motiva sentimientos de miedo y rechazo ante el uso de esta herramienta, que es necesaria para darle valor a las experiencias y observaciones médicas.

Mención especial merecen los aspectos de muestreo y cálcu-lo del tamaño de muestra, que requieren de la compresión de as-pectos matemáticos con los que estamos poco familiarizados, y cuya ausencia disminuye la validez del estudio y dificulta su difu-sión en revistas de impacto, lo que puede bloquear nuestra innata capacidad inquisitiva y hacernos desistir de las inquietudes cien-tíficas. Es por ello que nos dimos a la tarea de elaborar un ma-nual práctico que aborde estos temas y permita a los estudiantes y trabajadores de la salud, solventar estos puntos críticos en la elaboración y desarrollo de un proyecto de investigación sin te-ner que profundizar en procesos estadísticos complicados.

Este documento no se realizó con el anhelo de que fuera una revisión exhaustiva y seguramente no será suficiente para el que

(9)

desee profundizar en el tema, solamente se pretende presentar una guía práctica y accesible, que permita a los estudiantes y médicos que realizan investigación, conocer los principios básicos para obtener una muestra que sea representantiva de la población estudiada, y adquirir los conocimientos y habilidades necesarios para calcular el tamaño que se requiere para que la muestra sea adecuada, de acuerdo con el diseño del estudio que se proponga. Estamos conscientes de que no se abarcan todos los proce-sos inferenciales que se requieren para llegar a las fórmulas y que incluso, en el afán de simplificar la explicación y manejo de las mismas puede subestimarse en algunas ocasiones el cálculo del tamaño de muestra, sin embargo, esperamos que las aproxi-maciones aquí presentadas contribuyan a hacer un poco más amigable y aplicativa esta labor.

(10)

ÍNDICE

Prólogo ... 8

1. MUESTREO... 14

1.1. Terminología y conceptos ... 15

1.2. Aspectos generales del muestreo ... 16

1.3. Tipos de muestreo ... 17

1.3.1. Muestreo no probabilístico ... 18

1.3.2. Muestreo probabilístico ... 19

1.4. Sesgo en el muestreo ... 22

2. TAMAÑO DE MUESTRA... 25

2.1. Algunos conceptos teóricos ... 27

2.1.1. Relación con teoría de probabilidades y conceptos de hipótesis alterna y nula ... 27

2.1.2. Error tipo I y error tipo II ... 27

2.2. Requerimientos para el cálculo del tamaño de muestra ... 30

2.2.1. Tipo de estudio ... 30

2.2.2. Relación de los grupos a comparar ... 30

2.2.3. El sentido de la hipótesis que se desea poner a prueba ... 31

(11)

2.2.4. Características y número de variables

que se desea medir... 31

2.2.5. La magnitud de la diferencia que se considere de importancia o significativa (∆) ... 32

2.2.6. La variabilidad de la población de la cual se extraerá la muestra ... 32

2.2.7. La confiabilidad que se espera del estudio ... 33

2.2.8. Estadística empleada para probar la validez de la hipótesis ... 34

2.3. Tamaño de muestra y significación ... 35

3. CÁLCULO DEL TAMAÑO DE MUESTRA... 38

3.1. Estudios descriptivos ... 39

3.1.1. Estudios cuyo objetivo es la estimación de una proporción ... 39

3.1.2. Estudios cuyo objetivo es la estimación de una media ... 44

3.2. Estudios comparativos ... 46

3.2.1. Estudios cuyo objetivo es comparar dos proporciones ... 46

3.2.2. Estudios cuyo objetivo es comparar dos medias ... 49

3.3. Estudios de equivalencia ... 51

3.3.1. Estudios de equivalencia de proporciones ... 52

3.3.2. Estudios de equivalencia de medias ... 54

3.4. Estudios donde se busca correlación ... 56

3.4.1. Correlación simple en un grupo ... 57

3.4.2. Comparación de dos correlaciones ... 58

3.5. Estudios de casos y controles ... 59

3.5.1. Estudios de casos y controles no pareado ... 60

3.5.2. Estudios de casos y controles pareado... 62

3.5.3. Estudios de casos y controles analizados mediante regresión logística ... 65

(12)

3.6. Ensayos clínicos ... 68

3.6.1. Ensayo clínico individual y no pareado ... 68

3.6.2. Ensayo clínico fase II ... 69

3.6.3. Ensayos clínicos con variable de salida ordinal ... 70

3.6.4. Ensayo clínico en grupos relacionados ... 72

3.6.5. Ensayos clínicos en grupos... 73

3.7. Estudios de cohorte ... 74

3.7.1. Estudio para búsqueda de reacciones adversas con antecedente conocido ... 74

3.7.2. Estudio para búsqueda de reacciones adversas sin antecedente conocido ... 76

3.7.3. Estudios para el análisis de sobrevida en un grupo... 78

3.7.4. Estudios para comparar dos curvas de sobrevida ... 79

3.8. Estudios para pruebas diagnósticas ... 82

3.8.1. Estudio de una prueba diagnóstica ... 82

3.8.2. Estudios para comparar dos pruebas diagnósticas ... 84

3.9. Estudios de concordancia ... 85

4. EJERCICIOS... 87

Estudios descriptivos para determinar una proporción... 87

Estudios descriptivos para determinar una media ... 89

Estudios comparativos de dos proporciones ... 91

Estudios comparativos de dos medias ... 92

Estudios de equivalencia de proporciones ... 93

Estudios de equivalencia de medias ... 94

Estudios que buscan correlación de variables ... 95

Estudios de casos y controles ... 95

(13)

Estudios de cohorte. Determinación de reacciones

adversas ... 99

Estudios de cohorte. Análisis de sobrevida ... 100

Estudios de prueba diagnóstica ... 101

Estudios de concordancia ... 102

APÉNDICE A. TABLAS... 104

APÉNDICE B. RESPUESTA A LOS EJERCICIOS... 129

APÉNDICE C. CUADROS Y FÓRMULAS ... 155

APÉNDICE D. GLOSARIO... 162

(14)

1. MUESTREO

SEDESARROLLARÁN primero algunos conceptos teóricos, se

pre-sentan los diferentes tipos de muestreo, sus características y al-gunos problemas relacionados con el mismo que pueden producir sesgo. Posteriormente se presentan conceptos acerca del tamaño de la muestra, los principios y elementos que se necesitan para el cálculo de la misma, las fórmulas empleadas para los diferentes diseños, acompañado de algunos ejemplos y luego algunas tablas para consulta directa de la muestra requerida.

Uno de los propósitos importantes para desarrollar cualquier investigación, es poder generalizar los resultados de una muestra a una población más grande. Este proceso de inferencia se efec-túa basado en cálculos matemáticos que tienen como fundamento la ley de las probabilidades, sin embargo, su aplicación práctica en la selección de la muestra tiene que ver más con aspectos de lógica, de criterio y de factibilidad.

(15)

1.1. TERMINOLOGÍA Y CONCEPTOS

Para hablar de muestreo, es necesario definir algunos términos: Población. Es todo conjunto de objetos, situaciones o suje-tos con un rasgo común. Es un conjunto global de casos que satis-face una serie predeterminada de criterios. No siempre se refiere a humanos ya que pudiera referirse al total de expedientes clínicos archivados en un determinado hospital. Sea cual fuere la unidad fundamental, la población siempre abarca el total de elementos que interesan al investigador y se debe partir de los criterios es-pecíficos que se desean incluir.

Puede diferenciarse en dos niveles: La población blanco o diana que es el gran conjunto de unidades en todo el mundo a los que se generalizarán los resultados del estudio, y están definidas por las condiciones clínicas y demográficas; y la población accesi-ble que es el subconjunto de la población diana que se encuentra disponible para el estudio y está determinada por las caracterís-ticas geográficas y temporales. Es el sitio donde supuestamente se podrá localizar a todas las unidades que integrarán la muestra y también se conoce como marco muestral.

Elementos o unidades muestrales. Es la unidad básica alrededor de la cual se recaba la información. Es el elemento que da origen al valor de las variables (un expediente, una radio-grafía, un paciente, un animal de laboratorio, etc.).

Muestra. Es el subconjunto de la población integrado por las unidades muestrales seleccionadas, la cual también tiene dos niveles, aquella que se plantea obtener en el proyecto, y aquella que realmente fue estudiada (figura 1).

Muestreo es la selección de un número de unidades de estu-dio a partir de una población definida. Es una parte importante del diseño y metodología de una investigación, ya que se encuentra fuertemente relacionado con el grado de generalización que se pue-da efectuar de los resultados obtenidos de un estudio específico.

(16)

1.2. ASPECTOS GENERALES DEL MUESTREO

Al efectuar una investigación existen varias razones para muestrear:

a) Rapidez. b) Costo. c) Factibilidad. d) Exactitud.

En cuanto a las tres primeras razones, es obvio que existe mayor rapidez y menor costo en estudiar cien personas que mil o más y es más posible hacerlo por situaciones de recursos huma-nos, físicos y apoyos logísticos. En cuanto a exactitud, se refiere al hecho de que a menor volumen de trabajo, es posible emplear personal mejor capacitado que garantice una medición del fenó-meno de interés con mayor precisión y poder supervisar mejor para producir resultados más exactos.

Para efectuar un muestreo tenemos que responder a tres preguntas:

1. ¿Cuál es la población en estudio?

2. ¿Cuántas personas se requieren en la muestra? 3. ¿Cómo seleccionar la muestra?

Para responder a la primera pregunta, la población en es-tudio debemos definirla de acuerdo con el problema que se quie-re investigar. Recordar que la población está conformada por

Verdad en el Universo Pregunta a investigar Verdad en el Estudio Plan de estudio Hallazgos en el Estudio Estudio Real Población diana Población accesible Muestra que se pretende obtener Individuos estudiados en la realidad

Fenómenos de interés Variables que se

pretenden medir Mediciones reales Figura 1. Relaciones de la población y la muestra con el fenómeno a estudiar.

(17)

unidades de estudio que pueden ser personas, comunidades, ins-tituciones, expedientes, muestras de laboratorio, especimenes de biopsia, etc.

Una muestra debe ser:

•Representativa: Que implica tener todas las características

importantes de la población de la que se tomó, en proporciones similares. Esto es para que el investigador pueda hacer inferencias válidas respecto a toda la población de donde obtuvo su muestra, es decir, que pueda cubrir uno de los requisitos para transpolar los resultados de su muestra hacia la población de donde la obtuvo.

Adecuada: Se refiere a su tamaño y viene a responder a

la segunda pregunta. Se calcula con diversas fórmulas estable-cidas de acuerdo a si el estudio busca una proporción existente en una población (por ejemplo un estudio de prevalencia), dife-rencias entre las medias o las proporciones de dos poblaciones, correlación entre dos o más factores, factores de riesgo (estu-dios de riesgos relativos o razones de momios), pruebas diagnósticas (estudios de sensibilidad, especificidad y valores predictivos), etc. Los capítulos 2 y 3 abordan este tema.

Para responder la tercera pregunta, hay que conocer los diferentes métodos de muestreo, que es el objetivo de este primer capítulo.

1.3. TIPOS DE MUESTREO

A) No Probabilístico: si la muestra es escogida por medio de un proceso subjetivo o arbitrario de modo que la probabilidad de selección de cada unidad de la población no es conocida (se utiliza con frecuencia cuando no se conoce el marco muestral).

B) Probabilístico: cuando el método de selección de la muestra permite que todos los elementos de la población tengan la misma probabilidad de ser seleccionados en la muestra. Utiliza

(18)

procedimientos de selección aleatoria para asegurar que cada unidad de la muestra se seleccione por probabilidad (es factible si se conoce el marco muestral, es decir, se cuenta con un lista-do completo de todas las unidades que componen la población). El siguiente esquema nos presenta en forma global los tipos de muestreo:

Por conveniencia (a criterio) NO PROBABILÍSTICO Por casos consecutivos

Por cuota Aleatorio simple Sistemático PROBABILÍSTICO Estratificado Por conglomerados Multietápico 1.3.1. Muestreo no probabilístico

Es aquel muestreo en el que la probabilidad de selección de cada unidad muestral no es igual ni conocida.

1.3.1.1. Por conveniencia. Se seleccionan a las unidades de estudio que se encuentren disponibles al momento de la reco-lección de datos. Su ventaja es que es más fácil, económico y ac-cesible y puede dar una visión inicial buena. Se usa en estudios exploratorios. Su desventaja es que puede ser poco representativo, algunas unidades estarán subrepresentadas y otras sobrerrepre-sentadas. Una variación de éste es el llamado muestreo a crite-rio, donde además de encontrarse disponibles, se elige a los que se suponen más apropiados para participar en el estudio

1.3.1.2. Por casos consecutivos. Consiste en elegir a cada paciente que cumpla con los criterios de selección dentro de un intervalo de tiempo específico o hasta alcanzar un número defi-nido de pacientes. Es el mejor y el más fácil de los muestreos no

(19)

probabilísticos ya que su limitante solamente es la duración del estudio. Su problema es precisamente cuando la duración es dema-siado corta para representar adecuadamente todos los factores estacionales o cambios que puedan producirse con el tiempo y que sean importantes para la pregunta que se investiga (por ejem-plo, prevalencia de infecciones respiratorias en un estudio que abarque dos meses e inicie en abril).

1.3.1.3. Por cuotas. Se seleccionan unidades de estudio de cada uno de los subgrupos que componen la población en una cuota predeterminada, por ejemplo, si hablamos de edades, se-leccionar un porcentaje de cada uno de los grupos de edad. Ase-gura que un determinado número de unidades de muestreo de diferentes categorías aparezcan en la muestra de modo que to-dos queden representato-dos. Es útil para balancear las unidades de estudio pero no se obtiene la representatividad de la población.

1.3.2. Muestreo probabilístico

Es aquel donde el método de selección de la muestra permi-te que todos los elementos de la población permi-tengan la misma pro-babilidad de ser seleccionados en la muestra.

1.3.2.1. Aleatorio simple. Cada individuo tiene la misma probabilidad de ser seleccionado para el estudio. Requiere tener una lista numerada de todas las unidades del marco muestral, decidir el tamaño de la muestra, seleccionar la muestra al azar mediante tablas de números aleatorios, calculadora o computado-ra. Generalmente la selección se hace “sin remplazo” esto es, que el individuo seleccionado no vuelve a ser tomado en cuenta para el sorteo.

1.3.2.2. Sistemático. Todos los individuos se seleccionan a intervalos regulares, cada K elemento (el tercero, quinto, déci-mo). Se selecciona dividiendo el total de población entre el número de elementos deseados lo que nos dará el intervalo de cada

(20)

cuán-tos se eligen (por ejemplo, en una población de 300 elemencuán-tos y un tamaño de muestra requerido de 60, 300/60 = 5, se escogerá cada quinto elemento). Puede tomarse el elemento inicial de cada grupo o el medio, aunque esto se comporta erráticamente, por lo que es preferible tomar el primer elemento de manera aleatoria y los demás de acuerdo con la sistematización que se haya de-terminado (por ejemplo, si el primer elemento elegido aleatoria-mente fue el Nº 4, el siguiente será 4 + 5 = 9, el que le sigue será el 14, etc.). No debe utilizarse cuando existe repetición cícli-ca inherente al marco de muestreo (por ejemplo los días de la semana).

Ventajas sobre el aleatorio simple: Es más fácil sacar una muestra sin errores y ahorra tiempo. Desventajas sobre el alea-torio simple: El riesgo de sesgo es mayor.

1.3.2.3. Estratificado. Se divide primero a la población en estratos pertinentes (subgrupos) y luego de cada estrato se selec-ciona la muestra aleatoria, es decir, las extracciones de la mues-tra deben hacerse independientemente en los diferentes esmues-tratos (es una muestra aleatoria simple en cada estrato). Es posible sólo cuando se conoce la proporción de la población en estudio que pertenece a cada grupo de interés. Las subpoblaciones no deben traspolarse (deben ser mutuamente excluyentes) y en su conjun-to corresponden a conjun-toda la población (n1 + n2 + n3 + ni = N).

El muestreo estratificado se utiliza en algunas situaciones como: a) Cuando se requiere tener una precisión conocida en algunas subdivisiones de la población; b) Por conveniencia admi-nistrativa; c) Por dificultades específicas en algunas partes de la población, y d) Para favorecer el análisis de grupos más homo-géneos dentro de la heterogeneidad de la población.

En el muestreo estratificado puede mejorarse la precisión de la medición sobre el aleatorio simple si se cumplen tres requisi-tos que son: a) La población consta de subconjunrequisi-tos que varían mucho en tamaño; b) Las principales variables a medir están

(21)

ínti-mamente relacionadas con los tamaños de las instituciones, y c) Si se cuenta con una buena medida del tamaño para establecer los estratos.

El problema que se presenta es que la mejor asignación para una característica no necesariamente es la mejor para otra, por lo que se sugiere reducir las características consideradas en la asignación a un número relativamente pequeño (es decir, estra-tificar de acuerdo con el menor número de variables en estudio posible), y calcular la asignación óptima para cada característica por separado y verificar hasta que punto existe desacuerdo.

La diferencia del muestreo aleatorio estratificado con el siste-mático es que el sistesiste-mático estratifica la población en n estratos que consisten en las primeras k unidades, las segundas k unida-des, etc. y las unidades ocurren en la misma posición relativa del estrato, mientras que en el aleatorio estratificado, la posición den-tro del estrato se determina separadamente por aleatorización dentro de cada estrato.

1.3.2.4. Por conglomerados. Es la selección de grupos de unidades de estudio, en lugar de unidades de estudio individua-les (generalmente son unidades geográficas u organizacionaindividua-les). Su principal ventaja es que no se necesita el marco muestral de las unidades de estudio individuales. Su desventaja es que si no se incluyen en el estudio a todos los individuos de cada conglo-merado se puede generar sesgo. Es un método menos preciso y requiere muestras de mayor tamaño. Su principal uso es en es-tudios epidemiológicos.

1.3.2.5. Multietápico. Se efectúa en pasos o fases (eta-pas) y habitualmente involucra más de un método de muestreo. Sus principales ventajas son que no se requiere un listado de las unidades de estudio, inicialmente el listado de los conglomerados es suficiente y luego sólo se requiere la lista de los conglomera-dos seleccionaconglomera-dos y de la muestra de las unidades. Además, la muestra es más fácil de seleccionar ya que las unidades están

(22)

físicamente unidas en grupos en vez de diseminadas en toda la población de estudio. Su desventaja es que hay más probabili-dad que la muestra final no sea representativa de la población y depende del número de conglomerados seleccionados en la pri-mera etapa; a más conglopri-merados seleccionados existe mayor representatividad.

Los métodos probabilísticos de muestreo son los que mejor se acercan a lograr la representatividad de la muestra, sin em-bargo no la garantizan en forma absoluta, ya que siempre estará presente la probabilidad de que el azar determine diferencias entre la muestra y la población, lo cual se puede medir mediante métodos estadísticos. Además, el no trabajar con toda la pobla-ción, puede dar lugar a que los resultados de la muestra no nece-sariamente correspondan a los de la población. Lo anterior se debe a errores metodológicos por mala aplicación de la técnica de muestreo, lo cual recibe el nombre de sesgo en el muestreo, que es un error sistemático en los procedimientos de muestreo que lleva a la distorsión de los resultados del estudio.

1.4. SESGO EN EL MUESTREO

Es importante reconocer la posibilidad de tener sesgos de muestreo en nuestros estudios ya que ello merma su validez ex-terna (capacidad de transpolar resultados a la población).

Las principales fuentes de sesgo en el muestreo son: a) No respuesta, que es la no participación de personas que originalmente se encontraban incluidas en el estudio, por no haberse presentado, por negarse a responder o participar, o por cualquier otra causa. La razón por la cual produce sesgo es por-que rompe o anula el beneficio por-que la selección aleatoria había logrado. Es la causa de sesgo más frecuente y para evitarlo se sugiere:

(23)

•Probar y reestructurar los instrumentos de captación de

da-tos para asegurar la cooperación de las personas incluidas.

•Si no se encuentra a los sujetos seleccionados en la

prime-ra visita, buscarlos.

•Si a pesar de encontrarlos, no quieren ser entrevistados,

averiguar si existen diferencias con los que si participan y en que son diferentes.

•Planear las pérdidas, para considerar un número extra de

entrevistas.

Es importante mencionar la tasa de no respuesta en cada estudio y discutir honestamente como puede esto influir en los resultados.

b) Estudio solamente de voluntarios. El estudiar voluntarios no garantiza la representatividad ni es un muestreo aleatorio, ya que existen diferencias en las características de este grupo en relación con el resto de la población, que los llevan a participar como voluntarios (puede haber más enfermos, o grupos de edad más representados, o diferencias de género, etc.).

c) Muestreo sólo de los registrados. El utilizar solamente los que se encuentran en un registro puede sesgar la muestra, a me-nos que el registro sea completo y universal, sin embargo, esto pocas veces ocurre. Por ejemplo, tomar como punto de partida para el muestreo solamente los que vengan en el directorio telefó-nico, produciría sesgo ya que no toda la población tiene teléfono y los que no lo tienen, pueden compartir características comunes (como estado social y económico o área geográfica de vivienda) que no se encontrarán representadas en la muestra.

d) Pérdida de casos de corta duración. Por la misma razón que la no respuesta.

e) Sesgo estacional. Esto es válido cuando el fenómeno que se está estudiando tiene un patrón estacional. Por ejemplo, si se muestrea en Verano solamente en busca de infecciones respira-torias, no encontraremos los mismos datos que si se muestrea en

(24)

invierno, o bien en poblaciones donde existe migración de habi-tantes de manera estacional (por ejemplo para pizcas, trabajos específicos, etc.); si el muestreo se realiza en esas épocas, esa parte de la población no estará representada en la muestra.

f) Accesibilidad de áreas seleccionadas. Si el muestreo se hace solamente de las áreas accesibles porque existen los me-dios de comunicación adecuados, el grupo de población que vive en áreas no accesibles no estará representado en la muestra.

(25)

2. TAMAÑO DE MUESTRA

UNAVEZ determinada la forma en que seleccionaremos nuestra

muestra, es necesario conocer cuántos elementos requerimos estudiar en ella. Este conocimiento es importante, ya que si la muestra es muy pequeña, se corre el riesgo de no detectar re-sultados válidos y dar por negativo un resultado por estimación inadecuada de su tamaño, como lo demostró Freiman en 1978, y si es demasiado grande, puede exponer a los sujetos de estudio a un riesgo innecesario y a desperdicio de recursos.

Si bien es cierto que de acuerdo con principios matemáticos conocidos como teorema del límite central, la muestra tenderá a semejarse más a la población mientras mayor sea su tamaño, la creencia de que mientras mayor sea la muestra mejor será el estudio no es necesariamente cierta, además de que no siempre es posible. Al calcular un tamaño de muestra, debe lograrse un equilibrio entre lo deseable y lo factible, dependiendo de la dispo-nibilidad de tiempo, personal, accesibilidad, presupuesto, etc.

¿Cuántos elementos debe contener mi muestra?, es una pre-gunta a la que con frecuencia buscamos responder de manera simplista, así, hay personas que dicen que con estudiar al 10% de la población es suficiente, pero el tamaño de la muestra no pue-de reflejarse en función pue-de un porcentaje pue-de la población, como

(26)

En la tabla se observa que a menor tamaño de la población, el tamaño de muestra es pequeño, pero constituye un porcentaje alto de la población, mientras que a mayor tamaño de la pobla-ción, el tamaño de la muestra es mayor, pero el porcentaje de la misma necesario para que la muestra sea adecuada, es menor. El cálculo se realizó en programa Epi Info 2000, considerando una frecuencia esperada del fenómeno en estudio entre 18% y 20% con una confianza del 95% para la estimación (cuadro 1). se aprecia en la siguiente tabla calculada en base a estudios de prevalencia en poblaciones de diversos tamaños.

Cuadro 1. Porciento de la población estudiada con base en el tamaño de la misma

Tamaño de la población Tamaño de la muestra Porcentaje

50 48 96.0 100 94 94.0 200 177 88.5 500 377 75.4 1000 606 60.6 3000 1016 33.8 5000 1175 23.5 10,000 1332 13.3 30,000 1462 4.87 50,000 1491 2.98 100,000 1513 1.50 500,000 1532 0.31 1.000,000 1534 0.15

(27)

2.1. ALGUNOS CONCEPTOS TEÓRICOS

Antes de pasar a los aspectos prácticos del cálculo del tamaño de muestra, consideramos conveniente recordar algunos concep-tos teóricos entre los que se encuentran: la relación de la mues-tra con la teoría de probabilidades, los conceptos de hipótesis alterna y nula, error tipo I y error tipo II, significación, confianza y poder de un estudio.

2.1.1. Relación con teoría de probabilidades y conceptos de hipótesis alterna y nula

El cálculo del tamaño de la muestra se encuentra sustentado en la Teoría de la probabilidad y en las pruebas de hipótesis, de manera que la estimación de la realidad a partir de la medición de una muestra se encuentra sujeta a cierta imprecisión. De acuer-do con la teoría de la probabilidad, es prácticamente imposible asegurar que un hallazgo es verdadero con un 100% de probabi-lidad, por lo que se acepta de antemano que la hipótesis de tra-bajo (Ha o hipótesis alterna) no se puede probar. Para solucionar esto, se plantea una hipótesis contraria (Ho o hipótesis nula) y el investigador orienta sus esfuerzos para probar que esta es falsa, y si lo logra, es decir la rechaza, entonces implícitamente acepta la hipótesis alterna. A este juicio se le asigna un nivel de proba-bilidad, que en forma convencional se ha aceptado como signifi-cativo a niveles mayores de 95%.

2.1.2. Error tipo I y error tipo II

Dependiendo del tipo de estudio que realicemos, la hipótesis nula puede afirmar que no existe asociación entre las variables predictoras y de desenlace, o que no existen diferencias entre la muestra de estudio y la población, o que no existen diferencias

(28)

entre las muestras de estudio, o que no existe correlación. Al efectuar la prueba de hipótesis, es decir, someter nuestra hipósis nula a prueba para verificar si es posible rechazarla o no, te-nemos cuatro posibles resultados:

a) El primero es que rechacemos la hipótesis nula cuando no debimos rechazarla, es decir, que afirmemos que sí existe aso-ciación o diferencias cuando en realidad no existen, y esto se conoce como error tipo I, que no es otra cosa que la probabi-lidad de que la asociación o diferencia entre los grupos no sea verdadera, sino debida al azar.

b) Segundo, que no rechacemos la hipótesis nula cuando de-bimos rechazarla, es decir, que en el estudio no se encuentre asociación o diferencia, cuando en realidad si la hay y esto se conoce como error tipo II.

c) Tercero, no rechazar la hipótesis nula porque verdadera-mente no se puede rechazar, es decir, verdaderaverdadera-mente no existe diferencia o asociación.

d) Por último, lo que más desea el investigador, que es re-chazar la hipótesis nula cuando realmente debemos rere-chazarla, es decir, comprobar que nuestra hipótesis de trabajo es cierta cuando realmente lo es (cuadro 2).

Cuadro 2. Esquema de los cuatro posibles resultados de una prueba de hipótesis

La Hipótesis nula realmente es

Falsa Verdadera

Falsa

(Rechazo Ho) Correcto Error Tipo I Mi estudio dice que

la hipótesis nula es: (o bien, qué decisión

tomo sobre la hipótesis nula)

Verdadera

(No rechazo Ho) Error Tipo II Correcto Cuando probamos una hipótesis, la confiabilidad del estudio depende de la probabilidad que tenga de afirmar que no se

(29)

pue-de rechazar la hipótesis nula porque verdapue-deramente no se puepue-de rechazar (es decir, que la hipótesis nula es verdadera) y a esto lo denominamos confianza, y la probabilidad de afirmar que recha-zamos la hipótesis nula cuando realmente debimos rechazarla (es decir, afirmar que existe asociación o diferencia cuando real-mente la hay) y a esto lo denominamos poder del estudio.

La probabilidad de cometer un error tipo I (la probabilidad de señalar que si existe una diferencia cuando en realidad no la hay, o de rechazar Ho cuando no debimos rechazarla) es igual a la significación del estudio y generalmente se simboliza con la le-tra griega α y se aceptan como significativos valores de 5% o menores. Su contraparte es la confianza del estudio (1-α) y se aceptan valores de 95% o mayores. La probabilidad de cometer error tipo II (la probabilidad de afirmar que no hay diferencia, cuando en realidad si la hay o de no rechazar la hipótesis nula cuando debimos rechazarla) se simboliza por la letra griega β y generalmente se aceptan valores del 20% o menores. El poder o potencia del estudio, que es la probabilidad de que los resultados de mi estudio representen la realidad, o dicho de otra manera, la capacidad del estudio de detectar verdaderas asociaciones o di-ferencias entre grupos, como se mencionó, corresponde a 1-β y se aceptan valores de 80% o mayores. Lo anterior se ejemplifi-ca en el cuadro 3.

Cuadro 3. Relación de αααα, βββββ, Poder y confianza,α

con la prueba de hipótesis

La Hipótesis nula realmente es

Falsa Verdadera Falsa (Rechazo Ho) Correcto Poder (1-β) Error Tipo I (α = 0.05) Mi estudio dice que

la hipótesis nula es: (o bien, la decisión que se tomó sobre la

hipótesis nula es)

Verdadera (No rechazo Ho)

Error Tipo II (β = 0.20)

Correcto Confianza(1-α)

(30)

2.2. REQUERIMIENTOS PARA EL CÁLCULO DEL TAMAÑO DE MUESTRA

Para calcular el tamaño de la muestra se requiere conocer previamente algunas situaciones que se enlistan a continuación:

a) El tipo de estudio.

b) La relación entre los grupos a comparar.

c) El sentido de la hipótesis que se desea poner a prueba. d) Número y características de la variable que se desean

medir.

e) La magnitud de la diferencia que se considere de impor-tancia o significativa (∆).

f) La variabilidad de la población de la cual se extraerá la muestra.

g) La confiabilidad que se espera del estudio.

h) Estadística empleada para probar la validez de la hipótesis.

2.2.1. Tipo de estudio

En forma general podemos decir que se requiere calcular tamaño de muestra en aquellos estudios que quieran conocer la frecuencia de un fenómeno (prevalencia), probar hipótesis de causalidad, los que busquen relación entre un factor de riesgo y una enfermedad, que busquen correlación entre variables, o que busquen precisar que un tratamiento sea mejor que otro. Las se-ries de casos por lo general no requieren del cálculo de tamaño de muestra ya que son reportes descriptivos que solamente pre-sentan resultados en un número de casos existentes.

2.2.2. Relación de los grupos a comparar

Esto se refiere a si los grupos son independientes, es decir, diferentes entre sí; o son relacionados, es decir, son grupos que

(31)

se parearon por alguna característica específica, o son compara-ciones de antes y después en un grupo. En los grupos independien-tes, la variabilidad obviamente es mayor, por lo que el tamaño de muestra se incrementará. En grupos relacionados, principalmen-te en mediciones de anprincipalmen-tes y después, la variabilidad dentro del grupo es menor, ya que son los mismos sujetos, por lo que gene-ralmente el tamaño de la muestra disminuye.

2.2.3. El sentido de la hipótesis que se desea poner a prueba

La hipótesis de trabajo debe tener una dirección (una o dos colas). Se habla de una hipótesis de una cola cuando nos intere-sa evaluar el efecto de la intervención en un sentido, por ejemplo la mejoría de un evento; dicho de otra manera, estamos conven-cidos que una intervención es mejor que otra. Se habla de una hipótesis de dos colas cuando desconocemos o no estamos segu-ros de la dirección del efecto, entonces no hablamos de un mejor o peor efecto, sino solamente diferente. El tamaño de la muestra para probar hipótesis de una sola cola es menor que para probar hipótesis de dos colas.

2.2.4. Características y número de variables que se desea medir

En necesario tener en claro si la variable se medirá en forma numérica (medias, varianzas, etc.) o en forma de proporciones (tasas) y si se desea medir una sola variable, estimar una media o una proporción con cierta precisión, por ejemplo en estudios de prevalencia, para lo cual se requiere especificar la frecuencia esperada del fenómeno en estudio y la precisión o margen de error (intervalos de confianza) que se espera de dicha estimación; o si se busca comparar dos medias o dos proporciones, para lo cual

(32)

hay que especificar el tamaño de la diferencia que se espera entre ambas.

2.2.5. La magnitud de la diferencia que se considere de importancia o significativa (∆∆∆∆∆)

Ya sea desde el punto de vista clínico o de salud pública, la magnitud de la diferencia que se considere de importancia o sig-nificativa la debe fijar el investigador, basado en el conocimiento que tenga del evento que estudia, o bien, de lo que se acepte como importante entre los expertos del tema o los especialistas del área. Corresponde a la diferencia que estamos dispuestos a acep-tar entre el valor real y el que obtengamos en el estudio. Algunas preguntas que pueden orientar para determinarla pueden ser: ¿qué diferencia en el resultado será importante para los clínicos, en el tratamiento de este tipo de pacientes? o bien, ¿qué diferencia sería significativa para un paciente quien pudiera sufrir las con-secuencias de una enfermedad? o ¿qué diferencia en el resulta-do justificaría el uso de un tratamiento más efectivo a pesar de ser de mayor costo o con mayores efectos indeseables?

2.2.6. La variabilidad de la población de la cual se extraerá la muestra

Mientras más homogénea sea la constitución de la población de la cual se extraerá la muestra, menor tamaño de la misma se requiere, y a la inversa, en una población más heterogénea (con mayor variabilidad del fenómeno en estudio) se requerirá mayor tamaño de muestra. La medida de variabilidad que se utiliza para calcular el tamaño de muestra es la desviación estándar (σ) que puede tomarse de la reportada en estudios previos, o calcularse a partir de una muestra actual.

(33)

2.2.7. La confiabilidad que se espera del estudio

Este aspecto se refiere fundamentalmente a dos medidas:

•Qué tanta seguridad quiero tener de que si se repite mi

estu-dio, los resultados que obtengan sean similares en un nivel de probabilidad aceptado (generalmente 95%, aunque esto depen-derá de que tan estricto requiero ser con dicha probabilidad). Este valor está dado por Zα.

•Qué poder estoy dispuesto a aceptar en mi estudio, es

de-cir, que tanta seguridad quiero tener de que los resultados de mi estudio representen la realidad. Generalmente se ubica en 80% (a veces se requiere 90%) y está dado por Z1-β.

El valor Z no es otra cosa que la transformación de un valor cualquiera, independientemente de sus unidades de medida, en un valor cuya unidad de medida es la cantidad de desviaciones estándar que dicho valor se aleja de la media de la muestra estu-diada. Así, el valor Zα corresponde a la distancia de su media que tendrá el valor de probabilidad asignado a la confianza, por ejemplo un alfa de 0.05, de acuerdo con las tablas de Z de la distribución normal, se encuentra a 1.96 desviaciones estándar del valor de la media en dicha distribución, en hipótesis de dos colas y a 1.64 desviaciones estándar en hipótesis de una cola. De la misma manera, el valor Z1-β corresponde a la distancia de la media, del valor asignado al poder del estudio, así, un valor beta de 0.2 (poder 80%), se encuentra a 0.84 desviaciones estándar de su media. El cuadro 4 de la página siguiente presenta lo valores Zα y Z1-β más frecuentemente utilizados.

(34)

2.2.8. Estadística empleada para probar la validez de la hipótesis

El tipo de estadístico con el cual se probará la hipótesis (es-tadístico Z, t de Student, X2, r de Pearson, etc.) depende princi-palmente del tipo de estudio y del tipo de hipótesis a probar.

La forma como influyen algunas de las características men-cionadas sobre el tamaño de muestra se observa en el cuadro 5.

Cuadro 5. Factores que influyen en el tamaño de la muestra

Nivel de significancia (αααα) Poder (1-ββββ)

% Valor Z Una cola Dos colas 99.0 2.33 0.01 0.02 97.5 1.96 0.025 0.05 95.0 1.64 0.05 0.1 90.0 1.28 0.1 0.2 85.0 1.04 0.15 0.3 80.0 0.84 0.2 0.4 75.0 0.67 0.25 0.5 70.0 0.52 0.3 0.6 60.0 0.25 0.4 0.8

Cuadro 4. Valores Z ααααα y Z βββββ más frecuentemente utilizados

Factor

Efecto sobre el tamaño de la

muestra ↓ del error tipo I que aceptamos ↑ ↓ del error tipo II que aceptamos ↑ ↓ variabilidad de las mediciones de los

resultados ↓

↓ magnitud de las diferencias esperadas

entre los resultados entre los grupos ↑ ↑ número de grupos en estudio ↑ ↑ número de variables en estudio ↑ Dirección de la Hipótesis, Una cola

(35)

2.3. TAMAÑO DE MUESTRA Y SIGNIFICACIÓN

El tamaño de la muestra estudiada juega un papel importante en la posibilidad de encontrar una diferencia estadísticamente significativa entre grupos. En una muestra pequeña se puede no encontrar diferencias significativas por estadística, aunque esta diferencia verdaderamente exista (incrementa probabilidad de error tipo II). El cuadro 6 nos muestra diferencia entre dos tra-tamientos de un 15% que pudiera considerarse importante, pero que no es estadísticamente significativa.

Cuadro 6. Diferencia grande entre dos tratamientos en una muestra pequeña

Tratamiento A % Tratamiento B %

Éxito 30 81 30 66

Fracaso 7 15

Total 37 45 p = 0.14.

Por otra parte, en una muestra de gran tamaño, pudiera en-contrarse diferencia estadísticamente significativa aún con dife-rencias numéricas mínimas como se observa en el cuadro 7, en donde la diferencia en los efectos entre ambos tratamientos de 1.4%, tiene significación estadística menor de 0.05.

Cuadro 7. Diferencia pequeña entre dos tratamientos en una muestra grande

Tratamiento A % Tratamiento B %

Éxito 6000 81 8000 79.6

Fracaso 1400 2050

Total 7400 10050 P < 0.05.

(36)

Con los dos ejemplos anteriores, se aprecia claramente la influencia del tamaño de la muestra sobre el nivel de significa-ción estadística, sin embargo, existe otro concepto que no hay que olvidar y es el de la significación clínica de un evento. Exis-ten diferencias entre tratamientos, así como asociaciones o co-rrelaciones que pueden tener significación estadística y no tener ninguna importancia en la clínica, y también existen situaciones en la que no se podrá demostrar significación estadística, pero que tengan importancia para una decisión clínica. La importancia de un hallazgo es una situación de criterio, y debe fundamentarse en aspectos como la plausibilidad de una asociación encontrada, la simplicidad de un método que facilite un diagnóstico, el costo de un tratamiento o de un método diagnóstico que lo haga acce-sible a grupos grandes de población, el impacto que una medida de salud pueda tener sobre la sociedad, la trascendencia de un buen control o de la curación en un paciente con una enferme-dad de impacto social, laboral o personal elevado, etc.

Por lo anterior, hay que darle su justo lugar al procedimiento del cálculo de tamaño de muestra, como una herramienta más que nos facilite dicho juicio crítico y no que lo interfiera o lo que es peor, lo impida.

A manera de conclusión afirmamos tres comentarios: a) El cálculo del tamaño de la muestra es una aproximación a lo deseable y se tendrá que ajustar a la factibilidad (tiempo, costo, etc.). Es preferible realizar un estudio aún con el conoci-miento de las limitaciones que pueden existir para determinar la presencia de una diferencia o una asociación, que no realizarlo por no poder cumplir con el tamaño muestra requerido. Además, en algunos casos que requieren de tamaños de muestra muy grandes, siempre se podrán recurrir a estrategias como son: incrementar el número de controles por caso, efectuar estudios multicéntri-cos, efectuar un estudio piloto con la muestra que se encuentra accesible y recalcular el tamaño de muestra con los resultados.

(37)

b) Una muestra demasiado grande podrá alargar inútilmente un estudio y causar que diferencias sin importancia clínica, resul-ten estadísticamente significativas.

c) Es siempre preferible incrementar la confiabilidad de la recolección de los datos que el tamaño de la muestra. Esto tiene que ver con los aspectos del diseño que le confieren validez in-terna al estudio y los procedimientos para incrementar y medir la consistencia y validez de las mediciones.

(38)

3. CÁLCULO DEL TAMAÑO DE MUESTRA

HASTA el momento, se han presentado los conceptos y

funda-mentos teóricos para el cálculo del tamaño de muestra y se ha hecho referencia a los elementos necesarios para ello. Existen al menos tres maneras para poder conocer cuántos elementos se requieren en la muestra, aunque los tres caminos tienen los mis-mos principios. El primero, es someter los datos de mi estudio a fórmulas preestablecidas y mediante el desarrollo de las mismas, obtener dicho número. El segundo consiste en consultar tablas precalculadas, en donde, mediante la ubicación de los datos de mi estudio en las hileras y columnas correspondientes, localice el número buscado. Y por último, incluir los datos en algún paquete estadístico dedicado a esta tarea para obtener el resultado me-diante un cálculo electrónico.

En este apartado, se pretende abordar de una manera lo más sencilla posible, las fórmulas comunes para el cálculo del tamaño de muestra y algunos ejemplos que permitan clarificar su aplicación. Se dividirá la presentación por tipos de estudio, iniciando con los estudios descriptivos de una muestra, estudios comparativos tanto con variables numéricas como categóricas, estudios de equivalencia, estudios de correlación, analíticos y experimentales, diseños de fac-tores de riesgo, de tratamientos y de pruebas diagnósticas.

(39)

3.1. ESTUDIOS DESCRIPTIVOS

Este tipo de estudios se realizan en un solo grupo y habitual-mente pretenden estimar un parámetro de la población a partir de una muestra de la misma

3.1.1. Estudios cuyo objetivo es la estimación de una proporción

Son estudios que intentan responder preguntas como ¿cuál es la prevalencia, proporción o porcentaje del fenómeno en estu-dio? Son estudios en los que a partir de los valores observados en una muestra y utilizando la inferencia estadística, se busca estimar el valor de dicho parámetro en la población.

Al tomar una muestra para estimar lo que sucede en la rea-lidad, es necesario aceptar que la medición realizada en la mues-tra nos dará una apreciación de la población de la cual se tomó, pero con cierto grado de variabilidad (o error). La variabilidad que estamos dispuestos a aceptar en dicha estimación es lo que llamamos precisión y puede manejare a través de los intervalos de confianza (es decir, los límites superior e inferior dentro de los cuales se encontrará el verdadero valor del parámetro estimado). Como se mencionó en la sección anterior, se requiere cono-cer algunos datos para el cálculo del tamaño de muestra reque-rido, entre los que destacan:

a) La proporción que se desea poder detectar, por ejemplo, si el estudio busca detectar la prevalencia de diabetes mellitus tipo 2 en una población y por estudios previos sabemos que la proporción mundialmente reportada fluctúa entre 8 y 12%, utiliza-mos esta cifra como referencia para anotarla en nuestra fórmula en términos de fracciones de la unidad (esto es, 0.08 a 0.12). Cuando se desconoce la proporción buscada, se utiliza p = 0.5 en la fórmula, que es la que proporciona el máximo valor de n.

(40)

b) El nivel de confianza deseado: Usualmente 95%, que co-rresponde a un valor α = 0.05. Este valor indica el grado de con-fianza que se tendrá de que el verdadero valor del parámetro en la población caiga dentro del intervalo obtenido. Cuanta más con-fianza se desee, menor será el valor de α, mayor el valor de Zα y más elevado el número de sujetos necesarios.

c) La precisión (δ) con que se desea obtener la estimación, es decir, la amplitud que se acepte del intervalo de confianza. Cuanta más precisión se desee, más estrecho deberá ser este in-tervalo y más sujetos deberán ser estudiados.

Con los datos anteriores, podemos despejar la siguiente fór-mula para variables cualitativas (una proporción):

Fórmula 1. Tamaño de muestra para una proporción. Población infinita. En donde:

N = Tamaño de la muestra que se requiere.

p = Proporción de sujetos portadores del fenómeno en estudio. q = 1 – p (complementario, sujetos que no tienen la variable en estudio).

δ = Precisión o magnitud del error que estamos dispuestos a aceptar.

Zα = Distancia de la media del valor de significación pro-puesto. Se obtiene de tablas de distribución normal de probabi-lidades y habitualmente se utiliza un valor α de 0.05, al que le corresponde un valor Z de 1.96 (cuadro 4).

Por ejemplo, deseamos conocer el porcentaje de pacientes de una población que reaccionen a la prueba de coccidioidina. Existen estimaciones nacionales previas que sugieren que dicho valor se encuentra alrededor de 40% (p = 0.40). Se acepta una precisión de ±3% (δ = 0.03) (o sea que el valor de la proporción

2 2( )( ) ) ( δ α p q Z N=

(41)

que buscamos pueda estar entre 37 y 43%) y una confianza del 95%(α = 0.05, Zα = 1.96). Se sustituyen estos valores en la fór-mula para obtener 1024 sujetos, como se aprecia a continuación:

Literatura: Sujetos reactores = 40% (p = 0.40), (q = 1 – p = 0.60).

Precisión de la estimación = ±3% (δ = 0.03). Nivel de confianza = 95% (α = 0.05, Zα = 1.96).

Este mismo ejemplo podemos resolverlo sin necesidad de efectuar operaciones matemáticas, consultando las tablas exis-tentes para ello. Por ejemplo, en la tabla I del anexo A, busca-mos en la columna de la izquierda la proporción esperada del fenómeno (40%). En la segunda columna se aprecia el nivel de confianza deseado (95%) y en la sexta columna ubicamos la pre-cisión de la estimación marcada en la primera hilera como ±3%. Cruzamos los datos y apreciamos que el número marcado por tablas son 1022 sujetos.

Si se desea una precisión más alta (variación ±1%, δ = 0.01) se requerirán un mayor número de sujetos:

Literatura: Sujetos reactores = 40% (p = 0.40), (q = 1 – p = 0.60).

Precisión de la estimación = ±1% (δ = 0.01). Nivel de confianza = 95% (α = 0.05, Zα = 1.96).

En la tabla I buscamos en la columna de la izquierda la pro-porción esperada del fenómeno (40%). En la segunda columna el nivel de confianza deseado (95%) y en la tercer columna

ubi-1024 0009 . 0 92 . 0 0009 . 0 ) 24 . 0 ( 84 . 3 03 . 0 ) 6 . 0 )( 4 . 0 ( ) 96 . 1 ( ) )( ( ) ( 2 2 2 2 = = = = = Zα δ p q N 9229 0001 . 0 92 . 0 0001 . 0 ) 24 . 0 ( 84 . 3 01 . 0 ) 6 . 0 )( 4 . 0 ( ) 96 . 1 ( ) )( ( ) ( 2 2 2 2 = = = = = δ α p q Z N

(42)

camos la precisión de la estimación marcada en la primera hilera como ±1%. Al cruzar los datos se aprecia el número marcado en 9053 sujetos.

De la misma manera, con una precisión baja (δ = 0.1) se re-quieren 92 sujetos:

mismo valor observado en la tabla I.

Cuando el tamaño total de la población es menor de 5,000 (población finita), se requiere efectuar un ajuste en la fórmula:

Fórmula 2. Tamaño de muestra para una proporción.

Población finita (<5,000).

De tal manera que si en el primer ejemplo solamente existie-ran 1000 elementos en la población, y la muestra nos indica que requerimos 1024 sujetos en la muestra, substituyendo los valores requeriríamos:

1024/1+1.024 =

= 1024/2.024 = 506 sujetos

Estos valores, son los mismos que obtenemos al incluir los datos del estudio en un paquete estadístico de cálculo de tamaño de muestra (Epi Info, Epidat).

Vamos a suponer que ahora necesitamos saber la prevalen-cia de enfermos con diabetes mellitus en un poblado rural que tiene 1,250 habitantes. Existe la sospecha, por los hechos de

ob-92 01 . 0 92 . 0 01 . 0 ) 24 . 0 ( 84 . 3 10 . 0 ) 6 . 0 )( 4 . 0 ( ) 96 . 1 ( ) )( ( ) ( 2 2 2 2 = = = = = δ α p q Z N ) / ( 1 1 1 población n n N + = = + = + = ) 100 / 1024 ( 1 1024 ) / ( 1 1 1 población n n N

(43)

servación, que en la población en estudio pueda llegar al 20%. ¿Qué tamaño de muestra se requiere estudiar en dicha población para tener la certeza de detectar el verdadero valor de prevalen-cia de DM2 con un intervalo de confianza de ±2, a una significa-ción de 0.05?

¿Qué necesitamos saber primero?

¡Exacto! Requerimos conocer los parámetros que incluire-mos en la fórmula, esto es:

Prevalencia que esperamos encontrar = 20% (p = 0.20), (q = 1-0.20 = 0.80).

Precisión de la estimación = ±2% (δ = 0.02). Nivel de confianza = 95% (α = 0.05, Zα= 1.96).

¿Qué sigue?… ¡Claro!, sustituir los valores en la fórmula 1 y entonces quedaría:

(Esto lo puedo consultar directamente en la tabla I y evitar-me los cálculos matemáticos.)

¿Y luego?, si solamente tengo 1,250 sujetos en la población. ¡Por supuesto! Aplico la fórmula para ajuste (fórmula 2) y quedaría: 1536/1 + 1.2288 = = 1536/2.2288 = 689 sujetos Y eso es todo. 1536 0004 . 0 6144 . 0 0004 . 0 ) 16 . 0 ( 84 . 3 02 . 0 ) 8 . 0 )( 2 . 0 ( ) 96 . 1 ( ) )( ( ) ( 2 2 2 2 = = = = = δ α p q Z N = + = + = ) 1250 / 1536 ( 1 1536 ) / ( 1 1 1 población n n N

(44)

3.1.2. Estudios cuyo objetivo es la estimación de una media

Este tipo de estudios responden a la pregunta ¿cuál es el valor promedio de X parámetro estudiado en la población? El cálculo es similar a lo referido en tamaño de muestra para una propor-ción. Deben fijarse el nivel de confianza y la precisión de la es-timación que determinarán la amplitud del intervalo alrededor de la media que se desea estimar. La diferencia es que con las va-riables cuantitativas, la medida de la variabilidad está proporcio-nada por la varianza de su distribución en la población. De tal manera que la fórmula es:

Fórmula 3. Tamaño de muestra para una media. Población infinita. En donde:

N = Tamaño de la muestra que se requiere. σ = Desviación estándar de la población.

δ = Precisión o magnitud del error que estamos dispuestos a aceptar.

Zα = Distancia de la media del valor de significación pro-puesto.

Por ejemplo, se desea determinar el valor promedio de la presión sistólica en la inducción con anestesia general balan-ceada, en pacientes hipertensos. Por la literatura se sabe que en otras poblaciones la media de la Presión sistólica es de 160 mm Hg con una desviación estándar de 20 mm Hg. Para la estimación se acepta una precisión (amplitud del I.C.) de ±5 mm Hg y un nivel de confianza del 95% (α = .05 y Zα = 1.96). La precisión de ±5 mm Hg significa que aceptamos que el valor medio de la presión arterial real puede encontrarse entre 155 y 165 mm Hg en el 95% de las veces. Sustituimos en la fórmula y tendremos:

2 2 2( ) ) ( δ σ α Z N=

(45)

=

= 62 sujetos a estudiar

Si se desea ser más preciso y aceptar un intervalo de ±4 mm Hg (es decir, que el valor real de la media que detectemos se encontrará entre 156 y 164 mm Hg en el 95% de las ocasiones), entonces se necesitan:

= 96 sujetos a estudiar

Y si se quiere aún mayor precisión (±2 mm Hg):

= 384 sujetos a estudiar

Si la población de donde se obtendrá la muestra, es menor de 5000 sujetos, es necesario aplicar la misma corrección que para las proporciones (fórmula 2), de tal manera que si sólo tenemos una población de 100 sujetos de donde tendremos que extraer la mues-tra, en el ejemplo anterior, en lugar de los 384 sujetos de estudio requeriremos:

= 384/ 1 +(384/100) = 79 sujetos

En la tabla II, localizamos en la primera columna el valor co-nocido de la desviación estándar poblacional (en el caso del

ejem-5 . 61 25 1536 25 ) 400 ( 84 . 3 5 ) 20 ( ) 96 . 1 ( ) ( ) ( 2 2 2 2 2 2 = = = = = δ σ α Z N = = = = = 16 1536 16 ) 400 ( 84 . 3 4 ) 20 ( ) 96 . 1 ( ) ( ) ( 2 2 2 2 2 2 δ σ α Z N 4 1536 4 ) 400 ( 84 . 3 2 ) 20 ( ) 96 . 1 ( ) ( ) ( 2 2 2 2 2 2 = = = = = δ σ α Z N = + = ) / ( 1 1 1 población n n N

(46)

plo 20 mm Hg). En la hilera superior, ubicamos el valor de la va-riación que aceptamos (en el ejemplo ±5 mm Hg) y cruzamos en el valor de significación del 95% que se propuso y tenemos a los 62 pacientes obtenidos con la fórmula.

3.2. ESTUDIOS COMPARATIVOS

Este tipo de estudios se realizan en dos grupos que pueden ser independientes o relacionados y buscan comparar una carac-terística específica entre ambos.

3.2.1. Estudios cuyo objetivo es comparar dos proporciones

En este tipo de estudios, comparamos dos muestras someti-das a diferentes intervenciones (ensayos clínicos), o las muestras de dos poblaciones que presumimos son diferentes (cohortes), o un grupo de sujetos con enfermedad y otro sin ella (casos y con-troles en grupos iguales) y la medición está efectuada en una escala cualitativa, reportada como la cantidad de sujetos (pro-porción o porcentaje) con la presencia de la variable de interés. Las preguntas que se responden son ¿Las muestras (o las po-blaciones) son diferentes? (estudio de dos colas o bilateral), ¿la muestra (o la población) A, tiene la variable de interés en mayor proporción que la B?, ¿La muestra (o población) A tiene la va-riable de interés en menor proporción que la B? (estudio de una cola o unilateral).

La fórmula para tamaño de muestra para dos proporciones es la siguiente:

Fórmula 4. Tamaño de muestra para dos proporciones.

2 2 1 2 2 1 1 ) ( ) )( ( p p K q p q p n − + =

(47)

Los elementos que necesitamos para poder calcular el tama-ño de la muestra son:

a) Determinar la proporción esperada de la variable de inte-rés en ambos grupos. En ensayos clínicos y cohortes, se requie-re prequie-resuponer la frequie-recuencia del requie-resultado en el grupo 1 (p1) y la proporción de sujetos sin el resultado (q1 = 1 – p1) y la frecuencia del resultado que se espera en el grupo 2 (p2) así como su comple-mento q2 (1 – p2). En estudios de casos y controles, p1 correspon-de a la frecuencia correspon-de exposición en casos y p2 en controles.

b) Identificar si la hipótesis del estudio es unilateral (la pro-porción de un grupo mayor o menor que en el otro grupo) o bila-teral (las proporciones en ambos grupos son diferentes).

c) Anotar el nivel de confianza que se desea. Generalmente se trabaja al 95%, lo que implica probabilidad de error α = 5% (0.05), pero puede ser mayor (99%, error α = 0.001 o 1%) o menor (90%, error α = 0.1 o 10%) de acuerdo con lo que se busque.

d) Establecer el poder o potencia del estudio (1 – β). Gene-ralmente se fija en 80%, lo que significa aceptar la probabilidad de un error β de 20%. Recordar que un error β de 20% significa un 80% de probabilidad de detectar una diferencia si esta existe en la realidad. Este nivel también lo fija el investigador depen-diendo de lo estricto que quiera ser con su estudio.

e) Con el nivel de confianza y el poder o potencia propuestos del estudio, consultar en el cuadro 8 los valores de Zα y Zβ sumados y elevados al cuadrado, que constituyen la constante K de la fórmula.

Cuadro 8. Tabla de K (Zααααα + Zβββββ)2. Valores más comunes Poder

Nivel significación

dos colas 50% 80% 90% 95% Nivel significación una cola

0.1 2.7 6.2 8.6 10.8 0.05

0.05 3.8 7.9 10.5 13.0 0.025

0.025 5.4 10.0 13.0 15.8 0.01

(48)

Por ejemplo, en un estudio donde se pretende demostrar que la proporción de pacientes con diabetes mellitus que logran un buen control metabólico es mayor en el grupo que reciben una estrategia educativa (grupo A) que en aquellos que no la reciben (grupo B), necesitamos:

a) Determinar la proporción esperada de la variable de inte-rés en ambos grupos. Se espera que el porcentaje de éxitos (con-trol metabólico) en el grupo sin estrategia educativa sea de 40% (P1 = 0.4) y la proporción de control metabólico en el grupo a quien se le impartió la estrategia lo esperamos de 50% (P2 = 0.5). b) Identificar si la hipótesis del estudio es unilateral o bilate-ral. En este ejemplo, como estamos suponiendo que el grupo a quien se le impartió la estrategia tenga mejor control, estamos hablando de un estudio unilateral.

c) Anotar el nivel de confianza que se desea. α = 5% (0.05), Zα = 1.645 (si el estudio fuera bilateral, Zα sería 1.96 de acuer-do con el cuadro 4).

d) Establecer el poder o potencia del estudio (1 – β). Si β = 10% (0.10), entonces potencia (1 – β) = 90% (o 0.90) y Zβ = 1.282 (cuadro 4).

e) Con el nivel de confianza y el poder o potencia propuestos del estudio, consultar en el cuadro 8 los valores de Zα y Zβ su-mados y elevados al cuadrado, que constituyen la constante K de la fórmula, para obtener un valor de 8.6.

Al sustituir en la fórmula queda:

=

sujetos por cada grupo de estudio

Si un poder de 80% fuera suficiente, entonces el tamaño de muestra disminuye ya que K disminuye a 6.2 (cuadro 8):

[ ] 01 . 0 ) 6 . 8 )( 49 . 0 ( 1 . 0 ) 6 . 8 )( 25 . 0 )( 24 . 0 ( ) 5 . 0 4 . 0 ( ) 6 . 8 ( ) 5 . 0 )( 5 . 0 ( ) 6 . 0 )( 4 . 0 ( ) ( ) )( ( 2 2 2 2 1 2 2 1 1 = = − + = − + = p p K q p q p n 421 01 . 0 214 . 4 = =

(49)

=

sujetos por cada grupo de estudio

Si la diferencia esperada fuera mayor, por ejemplo, p1 = 0.4 y p2 = 0.65, también se disminuye el tamaño de muestra:

sujetos por cada grupo de estudio

Si se plantea la hipótesis bilateral, es decir, que existe dife-rencia entre grupos sin precisar a favor de cual, con un poder del 80% y el mismo nivel de significación de 0.05:

=

sujetos por cada grupo de estudio

Si queremos buscarlo en la tabla III, debemos primero en-contrar en la primera columna el valor de la proporción menor (en este último ejemplo es 0.4), luego en la hilera superior loca-lizar la diferencia esperada entre ambas proporciones (en este caso es 0.5 – 0.1= 0.1) y cruzar en el nivel de confianza deseado (95%) y encontramos el mismo valor de 387 sujetos por grupo.

3.2.2. Estudios cuyo objetivo es comparar dos medias

Los estudios que comparan medias parten de principios si-milares que los que comparan proporciones, pero la variable de interés se mide en escala numérica, por lo cual utilizan la desvia-ción estándar como medida de variadesvia-ción. Al igual que la

compa-[ ] 01 . 0 ) 2 . 6 )( 49 . 0 ( 1 . 0 ) 2 . 6 )( 25 . 0 )( 24 . 0 ( ) 5 . 0 4 . 0 ( ) 2 . 6 ( ) 5 . 0 )( 5 . 0 ( ) 6 . 0 )( 4 . 0 ( ) ( ) )( ( 2 2 2 2 1 2 2 1 1 = = − + = − + = p p K q p q p n 304 01 . 0 038 . 3 = = [ ] 25 . 0 ) 2 . 6 )( 2275 . 0 )( 24 . 0 ( ) 65 . 0 4 . 0 ( ) 2 . 6 ( ) 35 . 0 )( 65 . 0 ( ) 6 . 0 )( 4 . 0 ( ) ( ) )( ( 2 2 2 2 1 2 2 1 1 = = − + = − + = p p K q p q p n 49 0625 . 0 8985 . 2 = = 0625 . 0 ) 2 . 6 )( 4675 . 0 ( = [ ] 01 . 0 ) 9 . 7 )( 49 . 0 ( 1 . 0 ) 9 . 7 )( 25 . 0 )( 24 . 0 ( ) 5 . 0 4 . 0 ( ) 9 . 7 ( ) 5 . 0 )( 5 . 0 ( ) 6 . 0 )( 4 . 0 ( ) ( ) )( ( 2 2 2 2 1 2 2 1 1 = = − + = − + = p p K q p q p n 387 01 . 0 871 . 3 = =

(50)

ración de proporciones, también se pretende conocer si las me-dias son diferentes, mayores o menores en un grupo que en el otro y se necesita tener los siguientes datos:

a) Identificar si la hipótesis es unilateral o bilateral

b) Establecer niveles de alfa y beta deseados y con ellos con-sultar el valor K (Zα + Zβ)2 en el cuadro 8.

c) La diferencia de medias que esperaríamos encontrar o que queremos ser capaces de detectar con nuestro estudio (µ1 – µ2).

d) La desviación estándar esperada en cada grupo. e) Sustituir en la fórmula 5 y despejar.

Fórmula 5. Tamaño de muestra para dos medias.

Ejemplo: En un estudio se pretende demostrar que la neuro-leptoanestesia (NLA) produce una mayor disminución de la

pre-sión sistólica que la anestesia general balanceada.

1. Se plantea una hipótesis unilateral: Ha: A > B, Ho: A = B. 2. Error α = 5% (0.05) y Error β 10% (0.10), poder (1 – β) = 90% (0.90), para una hipótesis unilateral, buscamos K (Zα + Zβ)2 en el cuadro 8 =8.6.

3. Magnitud mínima importante de la diferencia (µ1 – µ2) (di-ferencia mínima considerada clínicamente importante) = 10 mm Hg.

4. Desviación estándar en cada grupo (σ) = 20 mm Hg.

= = 68 sujetos por grupo

Si en este mismo ejemplo, se quiere tener la capacidad de detectar una diferencia más pequeña de medias, por ejemplo 2

2 2 1 2 2 2 1 ) ( ) ( µ µ σ σ − + =K n 68 100 ) 800 ( 6 . 8 100 ) 400 400 ( 6 . 8 10 ) 20 20 ( 6 . 8 ) ( ) ( 2 2 2 2 2 1 2 2 2 1 = = + = + = − + = µ µσ σ K n

(51)

mm Hg (µ1 – µ2 = 2), tendríamos un incremento del tamaño de la muestra de la siguiente manera:

= 1720 sujetos por grupo

Y si se fuera menos exigente en el poder del estudio, por ejemplo 80%, la muestra se disminuiría a:

= 1240 sujetos por grupo

Si analizamos la tabla IV, encontramos que en la primera columna se encuentra la diferencia esperada entre las medias, dividida entre la desviación estándar, que en el caso del primer ejemplo sería 10/20 = 0.5, y al cruzar los valores a un nivel de confianza de 95% (alfa de 0.05) en estudio unilateral con un poder de 90% se observa que se requieren 70 sujetos por grupo. En el segundo ejemplo, la diferencia de medias entre la desviación están-dar es de 2/20 = 0.1 y al cruzar con la hilera del nivel de confian-za de 95% y la columna de poder 90% se aprecia que el valor de sujetos requeridos es 1715 y en la columna de poder de 80% es de 1237. Valores bastante cercanos a los obtenidos mediante la fórmula. Esta tabla presupone que las desviaciones estándar de ambos grupos en comparación son iguales.

3.3. ESTUDIOS DE EQUIVALENCIA

En los ensayos comparativos el interés está centrado en deci-dir si dos tratamientos son diferentes, y los análisis utilizan

prue-4 ) 800 ( 6 . 8 4 ) 400 400 ( 6 . 8 2 ) 20 20 ( 6 . 8 ) ( ) ( 2 2 2 2 2 1 2 2 2 1 = = + = + = − + = µ µ σ σ K n 4 ) 800 ( 2 . 6 4 ) 400 400 ( 2 . 6 2 ) 20 20 ( 2 . 6 ) ( ) ( 2 2 2 2 2 1 2 2 2 1 = = + = + = − + = µ µ σ σ K n

(52)

bas de significación para determinar que tanto la hipótesis nula de no diferencia puede rechazarse, sin embargo, en ocasiones nos interesa demostrar que dos tratamientos son similares, de manera que la hipótesis nula refiere que no existe equivalencia entre los grupos de estudio mientras que la hipótesis alterna re-fiere que la equivalencia si existe. En estos estudios, las pruebas convencionales de significación tienen poca relevancia, ya que por una parte, la falla en detectar una diferencia no necesaria-mente implica que exista equivalencia y por otra, una diferencia que se detecta puede no tener ninguna importancia clínica y corres-ponder a una equivalencia práctica. Lo anterior pone de mani-fiesto que la medida en la cual se fundamenta el cálculo de la muestra son los intervalos de confianza, es decir, el rango de equi-valencia o la amplitud de la diferencia máxima permisible más allá de la cual no podemos sustentar dicha equivalencia.

3.3.1. Estudios de equivalencia de proporciones

Si partimos de la fórmula 4 utilizada para diferencia de pro-porciones, solamente tendríamos que restarle el tamaño de la máxima diferencia permitida (ε) como se aprecia en la fórmula:

Y si consideramos que ambos tratamientos son igualmente efectivos, entonces p1 = p2 por lo que la fórmula se simplifica de la siguiente manera:

Fórmula 6. Tamaño de muestra para equivalencia de proporciones.

2 2 2 1 1 ) 2 1 ( ) )( ( ε − − + = p p K q p q p n 2 ) ( 2 ε K pq n=

(53)

Por ejemplo, si sabemos que el antibiótico A negativiza los cultivos de Escherichia coli en un 80% a las setenta y dos ho-ras y se quiere probar que el antibiótico B tiene efectos equiva-lentes, ¿de qué tamaño tiene que ser la muestra en estudio para aseverar la equivalencia de ambos con un nivel de significación de 0.05 y poder del 80%?

1. Primero determinamos P = 0.8, y q = 0.2 (q = 1 – p). 2. Buscamos en el cuadro 8 el valor de K (Zα + Zβ)2 para un alfa 0.05 y poder (1 – β) de 0.8 y en un estudio a dos colas corresponde a 7.9.

3. Definimos que amplitud de intervalo es aceptable para con-siderar equivalencia en ambos tratamientos y consideramos que si el antibiótico B negativiza los cultivos en un 80 ± 2.5%, pode-mos considerarlo equivalente. Como 2.5% equivale a una proba-bilidad de 0.025 y es hacia ambos lados, entonces ε = 0.05.

4. Sustituimos en la fórmula y tenemos que

=

= 1011.2 sujetos por grupo

En el mismo ejemplo, vamos a suponer que se considerará equivalente al antibiótico B si negativiza al menos el 80% de los cultivos a las 72 horas. En este caso el cálculo es similar, sola-mente que estamos proponiendo una hipótesis unilateral, por lo cual cambia el valor de K a 6.2 de acuerdo con el cuadro 8, de manera que:

1. El valor de p continúa siendo 0.8 y el de q de 0.2. 2. El valor de K (Zα + Zβ)2 para un alfa 0.05 y poder (1 – β) de 0.8 en un estudio a una cola corresponde a 6.2.

3. La amplitud de intervalo aceptable para considerar equi-valencia (ε) continúa siendo 5% (0.05).

[

]

2 2 0.05 9 . 7 ) 2 . 0 )( 8 . 0 )( 2 ( ) ( 2 = = ε K pq n

Referencias

Documento similar

Ciaurriz quien, durante su primer arlo de estancia en Loyola 40 , catalogó sus fondos siguiendo la división previa a la que nos hemos referido; y si esta labor fue de

En la parte central de la línea, entre los planes de gobierno o dirección política, en el extremo izquierdo, y los planes reguladores del uso del suelo (urbanísticos y

Tras establecer un programa de trabajo (en el que se fijaban pre- visiones para las reuniones que se pretendían celebrar los posteriores 10 de julio —actual papel de los

En cuarto lugar, se establecen unos medios para la actuación de re- fuerzo de la Cohesión (conducción y coordinación de las políticas eco- nómicas nacionales, políticas y acciones

b) El Tribunal Constitucional se encuadra dentro de una organiza- ción jurídico constitucional que asume la supremacía de los dere- chos fundamentales y que reconoce la separación

que hasta que llegue el tiempo en que su regia planta ; | pise el hispano suelo... que hasta que el

Para ello, trabajaremos con una colección de cartas redactadas desde allí, impresa en Évora en 1598 y otros documentos jesuitas: el Sumario de las cosas de Japón (1583),

Habiendo organizado un movimiento revolucionario en Valencia a principios de 1929 y persistido en las reuniones conspirativo-constitucionalistas desde entonces —cierto que a aquellas