Medidas descriptivas para una tabla 2 x
2. ESTIMACIÓN DE LAS MEDIDAS DESCRIPTIVAS
Para calcular un parámetro es necesario disponer de los datos de toda la población de interés. En cualquier estudio cuyo objetivo tenga cierto grado de generalidad, el tamaño de la población hará prácticamente imposible medir a todos los indivi- duos. Por tanto, se estudia una parte de la población, llamada muestra, que permita obtener un estimador del parámetro. Si la muestra cumple con los requisitos de cali- dad necesarios (véase la Sección II.3) puede esperarse que valor del estimador y el del parámetro sean similares.
a) ESTIMACIÓN DE PUNTO O PUNTUAL
Un estimador de punto es una estadística que, bajo ciertas condiciones, se presume tiene un valor cercano al del parámetro estimado. Por lo general, el estimador se calcula en la misma forma que el parámetro, pero en vez de usarse los datos de toda la población de referencia se utiliza la información obtenida de una muestra.
La similitud esperada entre el parámetro y su estimador es una función de la variabilidad de la estimación, la cual se evalúa con el error estándar del estima-
dor, que indica la magnitud de la variabilidad por azar que puede ocurrir en el esti-
mador.
El error estándar de un estimador es inversamente proporcional a su preci- sión, cuanto más pequeño es hay menores variaciones aleatorias en la estimación y, por tanto, se tiene un estimador más preciso.
Cuando no se analiza la población completa sino sólo una muestra, no basta con estimar el parámetro: es necesario evaluar la consistencia de la estimación, lo que puede hacerse, en parte, mediante los intervalos de confianza; pero, antes de cualquier generalización respecto al asunto investigado, se debe determinar la sig-
nificancia de la estimación alcanzada, es decir, si los resultados obtenidos mediante
la muestra verdaderamente apoyan tal o cual conclusión aplicable a la población de referencia. Para lograrlo deben utilizarse las pruebas de hipótesis descritas en el siguiente capítulo y, para algunos casos especiales, en el capítulo V.
b) ESTIMACIÓN POR INTERVALO
A diferencia del estimador de punto, que es un solo valor, la estimación por intervalo se constituye con dos límites, para los cuales se tiene cierto grado de confianza de que el parámetro esté contenido entre ambos; es decir, existe una probabilidad conocida de que el parámetro sea mayor que el límite inferior y menor que el supe-
rior. Los límites que cumplen con esa condición forman el intervalo de confianza.
La probabilidad de que un intervalo contenga al parámetro se conoce como
confiabilidad del intervalo. El nivel de confianza para el intervalo es decisión de
quien lo calcula. Los más comunes son los intervalos al 95% y al 99% de confianza. Para una misma muestra, un intervalo al 95% de confianza es más estrecho que uno al 99%, pero menos confiable: la probabilidad de que contenga al paráme- tro es menor. El nivel de confianza para un intervalo se decide en función de la am- plitud del mismo —buscando que sea lo más estrecho posible— y de la confianza que ofrece —tratando que sea máxima—. Como uno y otro criterio se contraponen, en cada caso debe decidirse a cuál dar más peso y con ello qué grado de confianza dar al estimador de intervalo.
Conceptualmente, el nivel de confianza equivale al complemento de la proba- bilidad de cometer un error tipo I al probar una hipótesis, es decir a (1 - a), por lo que la lectura de la introducción del capítulo IV apoyará la comprensión de lo expuesto.
La estimación por intervalo se basa en un estimador de punto del parámetro correspondiente y el error estándar del estimador, en combinación con un factor
de confiabilidad.
El intervalo de confianza brinda información muy importante para lograr una buena interpretación de los resultados. La amplitud del intervalo depende de dos factores: primero, del nivel de confianza, como ya se explicó y, segundo, de la preci- sión del estimador de punto; si el estimador es muy preciso el intervalo de confianza será estrecho, pero si la estimación es vaga será amplio. Por ello un intervalo de confianza demasiado amplio señala la falta de precisión en el estimador del pará- metro, indicando que los resultados no aportan información concluyente acerca del problema.
Cuando el intervalo de confianza es más amplio de lo aceptable, antes que ha- cer inferencias sobre el parámetro se debe pensar que la muestra no es lo bastante buena para brindar una base adecuada a la inferencia, por tanto conviene tomar una muestra mayor.
Aunque este aspecto de la interpretación de los intervalos de confianza basta para justificarlos, no es el único uso que puede dárseles: el intervalo de confianza indica los niveles en que puede ocurrir el parámetro estimado, dando una idea del rango en que puede estar el valor real del parámetro.
Por ejemplo, si se estima que la proporción de animales no vacunados que puede enfermar es de 5%, un veterinario pensaría que no es conveniente vacunar; pero si se le informa que la proporción de animales que desarrollan la enfermedad varía de 0 a 15%, y él considera que un porcentaje de enfermos mayor al 10% justi- fica la protección, entonces concluirá que, en tanto no se tenga nueva información, será recomendable vacunar. Es posible que al mismo tiempo se dedique a estudiar mejor el problema a fin de determinar con mayor precisión el riesgo de no vacunar. Con sólo un estimador de punto no es posible lograr esta interpretación y se perde- ría parte importante del provecho que puede lograrse de los datos colectados.