¿Para qué sirve la estadística en el campo de las Ciencias de la Salud? La Estadística es muy útil para tu formación a cualquier nivel en el campo de las Ciencias de la Salud.
Datos
Como mencionamos antes realizamos análisis descriptivos de datos, debe quedar claro de qué tipo es cada una de las variables que tenemos. Café Café Azul Café Café Verde Café Verde Verde Café Café Café Café.
Estad´ıstica descriptiva univariante
Frecuencias absolutas y relativas
Representaci´ on gr´ afica
En este tipo de gráfico se muestra una barra vertical (u horizontal si se desea) para cada una de las categorías de la variable altura proporcional a su frecuencia, ya sea absoluta o relativa. Use un gráfico de barras para representar la variable de color de ojos en el Ejemplo 1.3.
Estad´ıstica descriptiva univariante
- Tabulaci´ on de variables cuantitativas
- Medidas de centralizaci´ on
- Medidas de orden o posici´ on
- Medidas de dispersi´ on
- Valores at´ıpicos (outliers)
- Representaci´ on gr´ afica
- Medidas de forma (idea a nivel gr´ afico)
Si el número de datos de la muestra es impar, será el valor central de la muestra ordenada (muestra en la que las unidades experimentales aparecen ordenadas según el valor que toman). El percentil en el p% es el valor que satisface que el p% de las observaciones de la muestra son inferiores a él (y por tanto el resto son superiores a él).
Estad´ıstica descriptiva bivariante
Dos variables cualitativas
Resume en una tabla de contingencia y mediante una representación gráfica la relación entre las variables Sexo y Brucelosis de un estudio sobre salud porcina (datos originales no mostrados). En la tabla de contingencia, simplemente contamos cuántas veces ocurrió cada combinación de ambas variables.
Una variable cualitativa y otra cuantitativa
Dos variables cuantitativas
Ejercicios Cap´ ıtulo 1
Como hemos comentado, la función de distribución de una variable resume la probabilidad de que la variable tome algún valor (o rango de valores). Así, la región que encierra la función de distribución entre a y b coincide con la probabilidad (o la frecuencia relativa que esperaríamos observar) de que la variable tome valores entre a y b.
Variables aleatorias y distribuci´ on Normal 35
La distribuci´ on Normal
- Distribuci´ on Normal Est´ andar (N (0, 1))
- Aritm´ etica de variables normales
Por otro lado, los valores de probabilidad en la tabla de distribución normal estándar parecen estabilizarse a medida que aumentamos el valor de z. Cualquier variable X que siga una distribución N (µ, σ) se puede transformar fácilmente en N (0, 1) simplemente restando la media (µ) de todos sus valores y dividiendo por la desviación estándar t (σ).
Ejercicios Cap´ ıtulo 2
Calcule un intervalo centrado que contenga el 99% de los valores de peso de los gorilas durante un año. Encuentre un intervalo con el 90 % de los pesos más altos (omita el 10 % de los pesos más bajos).
Introducci´ on a la Inferencia estad´ ıstica 55
Muestreo y muestra aleatoria
Supongamos también que la población de estudio (Labrador Retrievers) consiste en: 60% mujeres-40% hombres. Si tuviéramos que seleccionar al azar en nuestra muestra de n = 50 perros más o menos perros mayores de los que hay proporcionalmente en la población, podríamos obtener un peso promedio de nuestra muestra que podría estar por encima o por debajo, respectivamente. . , el nivel medio de la población (a esto nos gustaría acercarnos).
Estad´ısticos, estimadores y par´ ametros
Así, dado que la variable edad tiene cierta influencia sobre la variable de interés (peso), si quisiéramos controlar su efecto de confusión, realizaríamos un muestreo sistemático que consistiría en: 1.- Ordenar la población en función de la variable de confusión, es decir, de menor a mayor; 2.- Por ejemplo, si la población total es de 500 perros y queremos seleccionar 50, debemos sacar un perro de cada 10; 3.- De los 10 primeros perros seleccionamos al azar uno, y de ese perro seleccionamos uno de cada 10. Así al final la muestra serían 50 perros de todas las edades en aproximadamente la misma proporción que en la población. Esta es la teoría, solo para hacernos una idea, ya que en la mayoría de los casos en veterinaria no es posible llevar un censo de toda la población para realizar fielmente dichos tipos de muestreo).
Consistencia, insesgadez y precisi´ on
Variaci´ on entre muestras
Distribuci´ on de estad´ısticos en el muestreo
- Error est´ andar de la media muestral
- Error est´ andar de un porcentaje
Comportamiento de la media muestral (de tamaño 50) de una variable con media 10 y desviación estándar 1,5. Se supone que el peso de los gorilas de 5 años sigue una distribución normal con media µ = 10 Kg y desviación estándar σ=2 Kg.
Intervalo de confianza
Intervalo de Confianza para el Porcentaje de Población P : Usaremos la distribución muestral del estadístico bP. Intervalo de confianza para la media poblacional µ: Usaremos la distribución muestral del estadístico x.
Distribuci´ on t-Student
En la siguiente figura, presentamos conjuntamente una distribución de Student con 30 grados de libertad y la distribución normal estándar. A continuación reproducimos una tabla de la distribución t de la misma forma que lo hicimos para la distribución normal estándar.
Intervalo de confianza para una media
- Intervalo de confianza para una media: desviaci´ on t´ıpica poblacional conocida
- Intervalo de confianza para una media: desviaci´ on t´ıpica poblacional desconocida . 69
Encuentre un intervalo de confianza del 95% para el peso medio de los gorilas machos adultos. Además de una estimación puntual de este porcentaje, es interesante obtener un intervalo de confianza del 95% para este parámetro poblacional (P.
C´ alculo del tama˜ no muestral para obtener un error de estimaci´ on prefijado
- Tama˜ no muestral necesario para la estimaci´ on de una media poblacional con un
- Tama˜ no muestral necesario para la estimaci´ on de un porcentaje poblacional con un
Tamaño de muestra necesario para estimar un porcentaje poblacional con un error dado. Calcule el tamaño de muestra requerido para realizar la estimación bajo los requisitos anteriores.
Ejercicios Cap´ ıtulo 4
En principio, no rechazaremos H0 (le damos el beneficio de la duda) y tendremos que evaluar si los datos nos aportan suficiente evidencia contra la hipótesis nula. Por el contrario, aquellos contrastes en los que la hipótesis nula es de la forma < o >.
Introducci´ on a los contrastes de hip´ otesis 79
Mec´ anica de los contrastes de hip´ otesis
Específicamente, la prueba de una o dos colas nos dirá si tomar una o ambas colas de la distribución (respectivamente) como la región de rechazo de la hipótesis nula. A partir de los valores de la región de pivote y rechazo calculados en los ejemplos anteriores, se completa la prueba de hipótesis correspondiente.
Resoluci´ on de contrastes mediante el c´ alculo del P-valor
Como hemos definido el valor P, necesitaremos calcular el valor de significación más bajo para que el pivote caiga en la región de rechazo. A medida que aumentamos el valor de significancia, la extensión de la región de rechazo crecerá hacia el centro de la distribución.
Contrastes para una media
Resolver la prueba anterior por el método de la región de rechazo, para el nivel de significancia α=0.05. El valor de significancia (0.05) nos dice qué tan grande debe ser la región de rechazo.
Contrastes para un porcentaje
Dado que el punto pivote (-0,86) queda fuera de la región de rechazo, no podemos rechazar la hipótesis nula. Por lo tanto, el valor P nuevamente nos brinda información que la prueba que usa la región de rechazo no proporcionó.
Errores de tipo I y tipo II
Ejercicios Cap´ ıtulo 5
Enuncie y resuelva la prueba de hipótesis apropiada utilizando la técnica del valor p y explique sus conclusiones. Enuncie y resuelva la prueba de hipótesis adecuada utilizando la técnica de regiones de aceptación-rechazo y explique sus conclusiones.
Comparaci´ on de dos grupos 101
Comparaci´ on de dos varianzas
- Distribuci´ on F de Snedecor
- Resoluci´ on del contraste de hip´ otesis
Una vez introducida la distribución F, para resolver la prueba de hipótesis propuesta necesitamos la distribución muestral de un estadístico conocido bajo la hipótesis nula. Se supone que esta variable sigue una distribución normal en ambas poblaciones (Operado por la técnica 1 y Operador por la técnica 2).
Comparaci´ on de dos medias
- Muestras independientes. Varianzas poblacionales conocidas e iguales
- Muestras independientes. Varianzas poblacionales desconocidas pero pudi´ endose
- Muestras independientes. Varianzas poblacionales desconocidas y no pudi´ endose
- Muestras dependientes o pareadas
Dado que el valor de nuestro punto de pivote es 1,42, no podemos rechazar la hipótesis nula. Dado que el valor de nuestro punto de pivote es 0,88, no podemos rechazar la hipótesis nula.
Ejercicios Cap´ ıtulo 6
Calcule un intervalo de confianza del 99% para la diferencia en las medias de las dos poblaciones (masculina y femenina) y vea si se llega a las mismas conclusiones que en el ejemplo anterior. En el capítulo anterior, estudiamos la comparación de los promedios de dos poblaciones.
An´ alisis de la varianza 119
Contraste de hip´ otesis
- Datos
- Idea intuitiva del funcionamiento del contraste
- Resoluci´ on del contraste de hip´ otesis
Para resolver este contraste se utiliza el estadístico F, que bajo la hipótesis nula sigue una distribución F de Snedecor con k − 1 y n − k grados de libertad. Mientras que un resultado en el que no pudiéramos rechazar la hipótesis nula indicaría que no tenemos evidencia para concluir que existen diferencias significativas entre las medias.
Hip´ otesis necesarias para la aplicaci´ on del ANOVA
- Muestreo aleatorio
- Normalidad
La solución a esta prueba de hipótesis se basa en la comparación de dos varianzas (llamadas varianza entre grupos y varianza dentro de los grupos), que, bajo la hipótesis nula de igualdad de medias, deberían ser iguales. Así, podemos asumir esta hipótesis como verdadera (como en el caso anterior, al menos estamos seguros de que si no es verdadera, no se desvía mucho de ella).
Ejercicios Cap´ ıtulo 7
Llamamos a esta distribución de la respuesta, que ignora el valor de otras variables, la distribución marginal de la variable. En esta tabla, cada fila y cada columna representan las categorías de cada una de las dos variables que resumimos, y en cada celda de la tabla de contingencia tenemos el número de veces que hemos observado la correspondiente combinación de ambas variables en nuestra muestra.
Test Chi-cuadrado 131
Valores Observados y Valores Esperados
En la medida en que los valores observados sean similares a los valores esperados, esto indicaría independencia de las variables. Y por el contrario, en la medida en que los valores observados se alejen de los valores esperados, apuntaría a una dependencia de las variables.
Distribuci´ on Chi-cuadrado
Test de independencia de dos variables categ´ oricas χ 2
Eij denotará el valor esperado en la celda (i, j) de la tabla de contingencia bajo la hipótesis nula, es decir, el valor que esperaríamos en esa celda si las variables fueran independientes. Por tanto, podemos concluir que, como intuimos cuando analizamos los valores de la tabla contingente, existe una correlación significativa entre las variables endometritis y la genética de la vaca.
Ejercicios Cap´ ıtulo 8
Predecir los valores de uno de ellos a través de los valores del otro. A medida que aumentan los valores de una de las variables, aumentan los valores de las demás.
Regresi´ on lineal simple 141
Test de independencia lineal para el coeficiente de correlaci´ on lineal (ρ)
A partir de los datos del ejemplo con el que ilustramos este tema, nos preguntamos si existe una relación lineal significativa entre la edad y la talla de los gorilas de 3 a 9 meses de edad (consideraremos, como es habitual, un nivel de significancia de α = 0, 05 El P-valor asociado a este pivote, en esta distribución y en un contraste bilateral es < 0,001, por lo que se rechaza la hipótesis nula (independencia lineal entre las variables) y podemos concluir que existe una relación lineal significativa entre Edad y altura de los gorilas entre 3 y 9 meses.
Coeficiente de determinaci´ on
Sabemos que para este problema el coeficiente de correlación lineal muestral toma el valor de r = 0.88 y que el valor de n en este caso es 14 ya que tenemos 14 pares de valores (o datos de 14 individuos).
El modelo de regresi´ on lineal
- Test de independencia lineal para el coeficiente de regresi´ on (B)
A continuación, calcularemos la estimación de la línea de regresión lineal que nos permitirá estimar la altura de los gorilas en función de su edad. Si la pendiente de la línea de regresión poblacional fuera 0, esto indicaría la ausencia de una relación lineal entre las variables (aumentar la variable independiente no tendría efecto sobre la variable dependiente).
Ejercicios Cap´ ıtulo 9
Explique si las conclusiones que obtiene son equivalentes a las obtenidas por la prueba de independencia del coeficiente de correlación lineal. Con base en la prueba de independencia sobre el coeficiente de correlación lineal, determina si la relación entre las dos variables es significativa.