EN CIENCIAS DE LA SALUD

¿Para qué sirve la estadística en ciencias de la salud? La estadística es muy útil para tu formación a cualquier nivel en las ciencias de la salud.

Datos

Marrón Marrón Azul Marrón Marrón Verde Marrón Verde Verde Marrón Marrón Marrón Marrón. En cuanto a la estatura del alumno, tal como se nos presenta, es una variable cuantitativa.

Estad´ıstica descriptiva univariante

Frecuencias absolutas y relativas

Representaci´ on gr´ afica

Esta representación se puede decorar con etiquetas dentro o fuera del gráfico, y también es práctica común incluir la frecuencia relativa de la variable para cada categoría de la variable (o, si se desea, la frecuencia absoluta de la variable). Use un gráfico de barras para representar la variable de color de ojos en el Ejemplo 1.3.

Estad´ıstica descriptiva univariante

Tabulaci´ on de variables cuantitativas
Medidas de centralizaci´ on
Medidas de orden o posici´ on (localizaci´ on)
Medidas de dispersi´ on
Valores at´ıpicos (outliers)
Representaci´ on gr´ afica
Medidas de forma (idea a nivel gr´ afico)

Usando una tabla de frecuencias, resuma los valores de la variable altura en el ejemplo 1.3. Si el número de datos de la muestra es impar, este es el valor central de la muestra ordenada (muestra en la que las unidades experimentales aparecen ordenadas por el valor que toman).

Estad´ıstica descriptiva bivariante

Dos variables cualitativas

Resume en una tabla de contingencia y mediante una representación gráfica la relación entre las variables Género e Hipertensión arterial de un estudio en el que se relacionan estos factores (no se muestran los datos originales). En la tabla de contingencia, simplemente contamos cuántas veces ocurrió cada combinación de ambas variables.

Una variable cualitativa y otra cuantitativa

Dos variables cuantitativas

Representa gráficamente la relación entre las variables altura y peso del estudio anterior. Podemos ser conscientes de que, en general, las personas más altas coinciden con las de mayor peso y ambas variables siguen una relación que se asemeja a una línea recta, es decir, una relación lineal.

Ejercicios Cap´ ıtulo 1

Los valores de la variable se distribuyen normalmente (o siguen una distribución normal) en cada uno de los grupos definidos por el factor, es decir, para cada grupo i, Yij ∼ N (µi, σ2). Talla de camiseta (S, M, L, XL, XXL): Cualitativo ordinal Número de calzado: Cuantitativo discreto (¿cualitativo ordinario?).

Variables aleatorias y distribuci´ on Normal 35

La distribuci´ on Normal

Distribuci´ on Normal Est´ andar (N (0, 1))
Aritm´ etica de variables normales

Ejercicios Cap´ ıtulo 2

Calcula un intervalo centrado que contenga el 99% de los valores del peso de los niños de un año. Encuentre un intervalo que contenga el 90 % de los pesos más altos (omitiendo el 10 % de los pesos más bajos).

Introducci´ on a la Inferencia estad´ ıstica 57

Muestreo y muestra aleatoria

La población se divide en subpoblaciones definidas por la categoría de la variable de confusión y se toma una muestra aleatoria dentro de cada subpoblación. Supongamos también que la población de estudio se compone de: 55% mujeres - 45% hombres.

Estad´ısticos, estimadores y par´ ametros

Si por casualidad seleccionamos más o menos personas mayores en nuestra muestra de n = 100 personas que proporcionalmente en la población, podríamos obtener una presión arterial promedio de nuestra muestra que podría estar por encima o , el nivel de población promedio (que queremos aproximar). Así, al final, la muestra estaría formada por 100 personas de todas las edades en aproximadamente la misma proporción que en la población.

Consistencia, insesgadez y precisi´ on

Variaci´ on entre muestras

Si tomamos diferentes muestras de temperatura corporal en una población sana, tendremos una varianza muestral bastante baja (la variabilidad de esta variable es baja entre distintas personas). Si tomamos la presión arterial en la población española, obtendremos una variación muestral mucho mayor.

Distribuci´ on de estad´ısticos en el muestreo

Error est´ andar de la media muestral

Comportamiento de la media muestral (de tamaño 50) de una variable con media 10 y desviación estándar 1,5. Se supone que el peso de los niños de un año sigue una distribución normal con media µ = 10 kg y desviación estándar σ=2 kg.

Ejercicios Cap´ ıtulo 3

La estimación del intervalo de confianza consiste en determinar un posible rango de valores o intervalo (a, b), cuyos límites contendrá con alguna probabilidad el valor del parámetro poblacional que buscamos En este capítulo estudiaremos la estimación de intervalos de confianza para una proporción o un porcentaje (P ) en el caso de tener una variable categórica y la media (µ) cuando tengamos una variable cuantitativa.

Intervalos de confianza 67

Distribuci´ on t-Student

A continuación se muestra la representación de varias distribuciones t con diferentes grados de libertad junto con una distribución normal estándar. En la siguiente figura, presentamos conjuntamente una distribución de Student con 30 grados de libertad y la distribución normal estándar.

Intervalo de confianza para una media

Intervalo de confianza para una media: desviaci´ on t´ıpica poblacional conocida 72

En un estudio, el objetivo es estimar la edad media a la que se diagnostica la diabetes mellitus en Valencia. Calcular un intervalo de confianza del 95% para la edad media de diagnóstico de esta enfermedad en la región de estudio.

Intervalo de confianza para un porcentaje

El objetivo del estudio es estimar el porcentaje de hipertensos entre las personas mayores de 65 años de la Comunidad Valenciana. Además de la estimación puntual de este porcentaje, es interesante obtener un intervalo de confianza del 95% para este parámetro poblacional (P.

C´ alculo del tama˜ no muestral para obtener un error de estimaci´ on prefijado

Tama˜ no muestral necesario para la estimaci´ on de una media poblacional con
Tama˜ no muestral necesario para la estimaci´ on de un porcentaje poblacional

Tamaño de muestra necesario para estimar un porcentaje poblacional con un error dado. Calcule el tamaño de muestra necesario para realizar la estimación bajo los requisitos anteriores.

Ejercicios Cap´ ıtulo 4

En principio aceptaremos H0 (le damos el beneficio de la duda) y tendremos que determinar si los datos nos aportan suficiente evidencia contra la hipótesis nula. Por el contrario, aquellos contrastes en los que la hipótesis nula es de la forma < o > se conocen como contrastes unilaterales.

Introducci´ on a los contrastes de hip´ otesis 83

Mec´ anica de los contrastes de hip´ otesis

Además, dado que la hipótesis alternativa es (H1: µ < 57), sabemos que solo considera valores menores a 57 kilos (estos corresponden a valores negativos en la distribución estandarizada). Debido a que el pivote (0.485) cae fuera de la región de rechazo, no podemos rechazar la hipótesis nula.

Resoluci´ on de contrastes mediante el c´ alculo del P-valor

Contrastes para una media

De la muestra recogida se ha obtenido un peso medio de 54,54 kg y una desviación típica de 5 kg. El valor de significancia (0.05) nos dice qué tan grande debe ser la región de rechazo.

Contrastes para un porcentaje

Resolveremos la prueba anterior por el método de las regiones de rechazo, para el nivel de significación α = 0,05. Por lo tanto, de nuevo el valor P nos da alguna información que la prueba de la región de rechazo no nos dio.

Errores de tipo I y tipo II

Ejercicios Cap´ ıtulo 5

Resuelve la prueba según la región de rechazo y aceptación y también calcula el valor p de la prueba. Resuelve la prueba según la región de rechazo y aceptación y también calcula el valor p de la prueba.

Comparaci´ on de dos grupos 105

Comparaci´ on de dos varianzas

Distribuci´ on F de Snedecor
Resoluci´ on del contraste de hip´ otesis

Una vez establecida la distribución F, necesitaremos la distribución muestral de un estadístico conocido bajo la hipótesis nula para resolver la prueba de hipótesis propuesta. Se supone que esta variable sigue una distribución normal en ambas poblaciones (Operación por técnica 1 y Operación por técnica 2).

Comparaci´ on de dos medias

Muestras independientes. Varianzas poblacionales conocidas e iguales
Muestras independientes. Varianzas poblacionales desconocidas pero pudi´ endo-
Muestras independientes. Varianzas poblacionales desconocidas y no pu-
Muestras dependientes o pareadas

Dado que el pivote (0.1837) no está en la región de aceptación, no podemos asumir la igualdad de varianzas de la variable en ambas poblaciones, es decir, existen diferencias significativas entre las varianzas del nivel de calcio plasmático entre hombres y mujeres. Rechaza la hipótesis de que el tratamiento realmente produjo una disminución significativa (α=0,05) de la presión arterial.

Ejercicios Cap´ ıtulo 6

A su vez, se tomó una muestra de 2010 personas de la zona sur, en la que se observaron 113 casos. Realizar las pruebas preliminares necesarias y la oportuna contrahipótesis para verificar si las sospechas de la investigación son ciertas.

An´ alisis de la varianza 125

Contraste de hip´ otesis

Datos
Idea intuitiva del funcionamiento del contraste
Resoluci´ on del contraste de hip´ otesis

Para resolver este contraste se utiliza el estadístico F, que bajo la hipótesis nula sigue una distribución F de Snedecor con k − 1 y n − k grados de libertad. Mientras que un resultado en el que no pudiéramos rechazar la hipótesis nula indicaría que no tenemos evidencia para concluir que existen diferencias significativas entre las medias.

Hip´ otesis necesarias para la aplicaci´ on del ANOVA

Muestreo aleatorio
Normalidad
Homocedasticidad

Muestreo: Esta hipótesis se cumple ya que los 45 pacientes disponibles se asignan aleatoriamente a cada uno de los tres tratamientos. Así, podemos asumir esta hipótesis como verdadera (como en el caso anterior, al menos estamos seguros de que si no es verdadera, no difiere mucho de ella).

Comparaciones m´ ultiples

Conclusión: Tenemos evidencia para concluir que existen diferencias significativas entre los valores medios de Hb de al menos dos de los tratamientos. Por otro lado, en los resultados mostrados para la comparación de los tratamientos 1 y 3, observamos un intervalo para la diferencia de medias que contiene 0 y un valor de p superior al nivel de significación (0.05).

Ejercicios Cap´ ıtulo 7

Relación entre la exposición al tabaco y la presencia de migraña en menores de 25 años. Llamamos a esta distribución de la respuesta, que ignora el valor de otras variables, la distribución marginal de la variable.

Test Chi-cuadrado 139

Valores Observados y Valores Esperados

En la medida en que los valores observados sean similares a los valores esperados, esto indicaría una independencia de las variables. Y por el contrario, en la medida en que los valores observados se desvíen de los valores esperados, esto indicaría una dependencia de las variables.

Distribuci´ on Chi-cuadrado

En el gráfico anterior podemos ver distintas distribuciones, y es que la distribución χ2, al igual que la distribución t, tiene como parámetro los grados de libertad. En la presentación anterior observamos así esta distribución con 3, 5 y 10 grados de libertad respectivamente.

Test de independencia de dos variables categ´ oricas χ 2

Observamos que cuanto mayor es el número de grados de libertad, la distribución permite 2 valores más altos, es decir una variable χ2 con un número bajo de grados de libertad tendrá valores bajos, mientras que una variable con un número de grados de libertad n' mayor en su distribución tomará valores más altos con mayor probabilidad. Por ello, se trata de una prueba de hipótesis de una cola donde la región de rechazo está formada por α × 100% de los valores más altos de la distribución χ2 correspondiente.

Ejercicios Cap´ ıtulo 8

Además, si existe una relación lineal entre ellas, es posible predecir el valor de una de ellas (la variable dependiente) a partir del valor de la otra (la variable independiente). Si existe una relación entre dos variables X e Y, no tiene por qué ser porque una sea la causa de la otra.

Regresi´ on lineal simple 149

Test de independencia lineal para el coeficiente de correlaci´ on lineal (ρ)

A partir de los datos del ejemplo con el que ilustramos este tema, nos preguntamos si existe una relación lineal significativa entre la edad y la talla de los niños de 3 a 9 meses (consideraremos, como es habitual, el nivel de significancia α = 0,05.P- el valor asociado a este pivote es < 0,001 en esta distribución y contraste bilateral, por lo que se rechaza la hipótesis nula (independencia lineal entre variables) y podemos concluir que existe una relación lineal significativa entre la edad y la talla de niños entre 3 y 9 meses.

Coeficiente de determinaci´ on

Sabemos que para este problema el coeficiente de correlación lineal de la muestra tiene el valor r = 0.88 y que el valor de n en este caso es 14, ya que tenemos 14 pares de valores (o datos de 14 personas).

El modelo de regresi´ on lineal

Test de independencia lineal para el coeficiente de regresi´ on (B)

Seguimos con el ejemplo de Edad y Altura de los niños de 3 a 9 meses. Si la pendiente de la línea de regresión poblacional fuera 0, esto indicaría la ausencia de una relación lineal entre las variables (aumentar la variable independiente no tendría efecto sobre la variable dependiente).

Ejercicios Cap´ ıtulo 9

Explique si las conclusiones que obtiene son equivalentes a las obtenidas con la prueba de independencia del coeficiente de correlación lineal. Indica cuál es el coeficiente de determinación e interpreta tu resultado en el contexto del ejercicio.

Anexo I: Soluciones Num´ ericas Ejercicios 163

Soluciones num´ ericas Ejercicios Cap´ıtulo 2

Soluciones num´ ericas Ejercicios Cap´ıtulo 4

Soluciones numéricas Ejercicios Capítulo 7. b) Conclusión: dado que todos los p-valores son > α, no se rechaza H0 y se cumple la hipótesis de normalidad. El tiempo medio de eficacia del tratamiento C no tiene diferencias significativas con el tratamiento A ni con el tratamiento B. Ejercicios de solución numérica Capítulo 8.

Soluciones num´ ericas Ejercicios Cap´ıtulo 7

Conclusión: El tiempo medio de eficacia del tratamiento B es significativamente mayor que el tiempo medio de eficacia del tratamiento A. El tiempo medio de eficacia del tratamiento C no tiene diferencias significativas con el tratamiento A ni con el B.