EN VETERINARIA

¿Para qué sirve la estadística en el campo de las Ciencias de la Salud? La Estadística es muy útil para tu formación a cualquier nivel en el campo de las Ciencias de la Salud.

Datos

Como mencionamos antes realizamos análisis descriptivos de datos, debe quedar claro de qué tipo es cada una de las variables que tenemos. Café Café Azul Café Café Verde Café Verde Verde Café Café Café Café.

Estad´ıstica descriptiva univariante

Frecuencias absolutas y relativas

Representaci´ on gr´ afica

En este tipo de gráfico se muestra una barra vertical (u horizontal si se desea) para cada una de las categorías de la variable altura proporcional a su frecuencia, ya sea absoluta o relativa. Use un gráfico de barras para representar la variable de color de ojos en el Ejemplo 1.3.

Estad´ıstica descriptiva univariante

Tabulaci´ on de variables cuantitativas
Medidas de centralizaci´ on
Medidas de orden o posici´ on
Medidas de dispersi´ on
Valores at´ıpicos (outliers)
Representaci´ on gr´ afica
Medidas de forma (idea a nivel gr´ afico)

Si el número de datos de la muestra es impar, será el valor central de la muestra ordenada (muestra en la que las unidades experimentales aparecen ordenadas según el valor que toman). El percentil en el p% es el valor que satisface que el p% de las observaciones de la muestra son inferiores a él (y por tanto el resto son superiores a él).

Estad´ıstica descriptiva bivariante

Dos variables cualitativas

Resume en una tabla de contingencia y mediante una representación gráfica la relación entre las variables Sexo y Brucelosis de un estudio sobre salud porcina (datos originales no mostrados). En la tabla de contingencia, simplemente contamos cuántas veces ocurrió cada combinación de ambas variables.

Una variable cualitativa y otra cuantitativa

Dos variables cuantitativas

Ejercicios Cap´ ıtulo 1

Como hemos comentado, la función de distribución de una variable resume la probabilidad de que la variable tome algún valor (o rango de valores). Así, la región que encierra la función de distribución entre a y b coincide con la probabilidad (o la frecuencia relativa que esperaríamos observar) de que la variable tome valores entre a y b.

Variables aleatorias y distribuci´ on Normal 35

La distribuci´ on Normal

Distribuci´ on Normal Est´ andar (N (0, 1))
Aritm´ etica de variables normales

Por otro lado, los valores de probabilidad en la tabla de distribución normal estándar parecen estabilizarse a medida que aumentamos el valor de z. Cualquier variable X que siga una distribución N (µ, σ) se puede transformar fácilmente en N (0, 1) simplemente restando la media (µ) de todos sus valores y dividiendo por la desviación estándar t (σ).

Ejercicios Cap´ ıtulo 2

Calcule un intervalo centrado que contenga el 99% de los valores de peso de los gorilas durante un año. Encuentre un intervalo con el 90 % de los pesos más altos (omita el 10 % de los pesos más bajos).

Introducci´ on a la Inferencia estad´ ıstica 55

Muestreo y muestra aleatoria

Supongamos también que la población de estudio (Labrador Retrievers) consiste en: 60% mujeres-40% hombres. Si tuviéramos que seleccionar al azar en nuestra muestra de n = 50 perros más o menos perros mayores de los que hay proporcionalmente en la población, podríamos obtener un peso promedio de nuestra muestra que podría estar por encima o por debajo, respectivamente. . , el nivel medio de la población (a esto nos gustaría acercarnos).

Estad´ısticos, estimadores y par´ ametros

Así, dado que la variable edad tiene cierta influencia sobre la variable de interés (peso), si quisiéramos controlar su efecto de confusión, realizaríamos un muestreo sistemático que consistiría en: 1.- Ordenar la población en función de la variable de confusión, es decir, de menor a mayor; 2.- Por ejemplo, si la población total es de 500 perros y queremos seleccionar 50, debemos sacar un perro de cada 10; 3.- De los 10 primeros perros seleccionamos al azar uno, y de ese perro seleccionamos uno de cada 10. Así al final la muestra serían 50 perros de todas las edades en aproximadamente la misma proporción que en la población. Esta es la teoría, solo para hacernos una idea, ya que en la mayoría de los casos en veterinaria no es posible llevar un censo de toda la población para realizar fielmente dichos tipos de muestreo).

Consistencia, insesgadez y precisi´ on

Variaci´ on entre muestras

Distribuci´ on de estad´ısticos en el muestreo

Error est´ andar de la media muestral
Error est´ andar de un porcentaje

Comportamiento de la media muestral (de tamaño 50) de una variable con media 10 y desviación estándar 1,5. Se supone que el peso de los gorilas de 5 años sigue una distribución normal con media µ = 10 Kg y desviación estándar σ=2 Kg.

Intervalo de confianza

Intervalo de Confianza para el Porcentaje de Población P : Usaremos la distribución muestral del estadístico bP. Intervalo de confianza para la media poblacional µ: Usaremos la distribución muestral del estadístico x.

Distribuci´ on t-Student

En la siguiente figura, presentamos conjuntamente una distribución de Student con 30 grados de libertad y la distribución normal estándar. A continuación reproducimos una tabla de la distribución t de la misma forma que lo hicimos para la distribución normal estándar.

Intervalo de confianza para una media

Intervalo de confianza para una media: desviaci´ on t´ıpica poblacional conocida
Intervalo de confianza para una media: desviaci´ on t´ıpica poblacional desconocida . 69

Encuentre un intervalo de confianza del 95% para el peso medio de los gorilas machos adultos. Además de una estimación puntual de este porcentaje, es interesante obtener un intervalo de confianza del 95% para este parámetro poblacional (P.

C´ alculo del tama˜ no muestral para obtener un error de estimaci´ on prefijado

Tama˜ no muestral necesario para la estimaci´ on de una media poblacional con un
Tama˜ no muestral necesario para la estimaci´ on de un porcentaje poblacional con un

Tamaño de muestra necesario para estimar un porcentaje poblacional con un error dado. Calcule el tamaño de muestra requerido para realizar la estimación bajo los requisitos anteriores.

Ejercicios Cap´ ıtulo 4

En principio, no rechazaremos H0 (le damos el beneficio de la duda) y tendremos que evaluar si los datos nos aportan suficiente evidencia contra la hipótesis nula. Por el contrario, aquellos contrastes en los que la hipótesis nula es de la forma < o >.

Introducci´ on a los contrastes de hip´ otesis 79

Mec´ anica de los contrastes de hip´ otesis

Específicamente, la prueba de una o dos colas nos dirá si tomar una o ambas colas de la distribución (respectivamente) como la región de rechazo de la hipótesis nula. A partir de los valores de la región de pivote y rechazo calculados en los ejemplos anteriores, se completa la prueba de hipótesis correspondiente.

Resoluci´ on de contrastes mediante el c´ alculo del P-valor

Como hemos definido el valor P, necesitaremos calcular el valor de significación más bajo para que el pivote caiga en la región de rechazo. A medida que aumentamos el valor de significancia, la extensión de la región de rechazo crecerá hacia el centro de la distribución.

Contrastes para una media

Resolver la prueba anterior por el método de la región de rechazo, para el nivel de significancia α=0.05. El valor de significancia (0.05) nos dice qué tan grande debe ser la región de rechazo.

Contrastes para un porcentaje

Dado que el punto pivote (-0,86) queda fuera de la región de rechazo, no podemos rechazar la hipótesis nula. Por lo tanto, el valor P nuevamente nos brinda información que la prueba que usa la región de rechazo no proporcionó.

Errores de tipo I y tipo II

Ejercicios Cap´ ıtulo 5

Enuncie y resuelva la prueba de hipótesis apropiada utilizando la técnica del valor p y explique sus conclusiones. Enuncie y resuelva la prueba de hipótesis adecuada utilizando la técnica de regiones de aceptación-rechazo y explique sus conclusiones.

Comparaci´ on de dos grupos 101

Comparaci´ on de dos varianzas

Distribuci´ on F de Snedecor
Resoluci´ on del contraste de hip´ otesis

Una vez introducida la distribución F, para resolver la prueba de hipótesis propuesta necesitamos la distribución muestral de un estadístico conocido bajo la hipótesis nula. Se supone que esta variable sigue una distribución normal en ambas poblaciones (Operado por la técnica 1 y Operador por la técnica 2).

Comparaci´ on de dos medias

Muestras independientes. Varianzas poblacionales conocidas e iguales
Muestras independientes. Varianzas poblacionales desconocidas pero pudi´ endose
Muestras independientes. Varianzas poblacionales desconocidas y no pudi´ endose
Muestras dependientes o pareadas

Dado que el valor de nuestro punto de pivote es 1,42, no podemos rechazar la hipótesis nula. Dado que el valor de nuestro punto de pivote es 0,88, no podemos rechazar la hipótesis nula.

Ejercicios Cap´ ıtulo 6

Calcule un intervalo de confianza del 99% para la diferencia en las medias de las dos poblaciones (masculina y femenina) y vea si se llega a las mismas conclusiones que en el ejemplo anterior. En el capítulo anterior, estudiamos la comparación de los promedios de dos poblaciones.

An´ alisis de la varianza 119

Contraste de hip´ otesis

Datos
Idea intuitiva del funcionamiento del contraste
Resoluci´ on del contraste de hip´ otesis

Para resolver este contraste se utiliza el estadístico F, que bajo la hipótesis nula sigue una distribución F de Snedecor con k − 1 y n − k grados de libertad. Mientras que un resultado en el que no pudiéramos rechazar la hipótesis nula indicaría que no tenemos evidencia para concluir que existen diferencias significativas entre las medias.

Hip´ otesis necesarias para la aplicaci´ on del ANOVA

Muestreo aleatorio
Normalidad

La solución a esta prueba de hipótesis se basa en la comparación de dos varianzas (llamadas varianza entre grupos y varianza dentro de los grupos), que, bajo la hipótesis nula de igualdad de medias, deberían ser iguales. Así, podemos asumir esta hipótesis como verdadera (como en el caso anterior, al menos estamos seguros de que si no es verdadera, no se desvía mucho de ella).

Ejercicios Cap´ ıtulo 7

Llamamos a esta distribución de la respuesta, que ignora el valor de otras variables, la distribución marginal de la variable. En esta tabla, cada fila y cada columna representan las categorías de cada una de las dos variables que resumimos, y en cada celda de la tabla de contingencia tenemos el número de veces que hemos observado la correspondiente combinación de ambas variables en nuestra muestra.

Test Chi-cuadrado 131

Valores Observados y Valores Esperados

En la medida en que los valores observados sean similares a los valores esperados, esto indicaría independencia de las variables. Y por el contrario, en la medida en que los valores observados se alejen de los valores esperados, apuntaría a una dependencia de las variables.

Distribuci´ on Chi-cuadrado

Test de independencia de dos variables categ´ oricas χ 2

Eij denotará el valor esperado en la celda (i, j) de la tabla de contingencia bajo la hipótesis nula, es decir, el valor que esperaríamos en esa celda si las variables fueran independientes. Por tanto, podemos concluir que, como intuimos cuando analizamos los valores de la tabla contingente, existe una correlación significativa entre las variables endometritis y la genética de la vaca.

Ejercicios Cap´ ıtulo 8

Predecir los valores de uno de ellos a través de los valores del otro. A medida que aumentan los valores de una de las variables, aumentan los valores de las demás.

Regresi´ on lineal simple 141

Test de independencia lineal para el coeficiente de correlaci´ on lineal (ρ)

A partir de los datos del ejemplo con el que ilustramos este tema, nos preguntamos si existe una relación lineal significativa entre la edad y la talla de los gorilas de 3 a 9 meses de edad (consideraremos, como es habitual, un nivel de significancia de α = 0, 05 El P-valor asociado a este pivote, en esta distribución y en un contraste bilateral es < 0,001, por lo que se rechaza la hipótesis nula (independencia lineal entre las variables) y podemos concluir que existe una relación lineal significativa entre Edad y altura de los gorilas entre 3 y 9 meses.

Coeficiente de determinaci´ on

Sabemos que para este problema el coeficiente de correlación lineal muestral toma el valor de r = 0.88 y que el valor de n en este caso es 14 ya que tenemos 14 pares de valores (o datos de 14 individuos).

El modelo de regresi´ on lineal

Test de independencia lineal para el coeficiente de regresi´ on (B)

A continuación, calcularemos la estimación de la línea de regresión lineal que nos permitirá estimar la altura de los gorilas en función de su edad. Si la pendiente de la línea de regresión poblacional fuera 0, esto indicaría la ausencia de una relación lineal entre las variables (aumentar la variable independiente no tendría efecto sobre la variable dependiente).

Ejercicios Cap´ ıtulo 9

Explique si las conclusiones que obtiene son equivalentes a las obtenidas por la prueba de independencia del coeficiente de correlación lineal. Con base en la prueba de independencia sobre el coeficiente de correlación lineal, determina si la relación entre las dos variables es significativa.