De esta forma, se estudiarán las principales distribuciones de probabilidad discretas y continuas utilizadas en la mayoría de cursos de estadística de la UOC. 3. Calcular intervalos de confianza y realizar pruebas de hipótesis (de una y dos colas) para la media poblacional (μ) con varianza poblacional conocida (σ2). 4. Calcule intervalos de confianza y realice contrastes de hipótesis (unilateral y bilateral) para la media poblacional (μ) con varianza poblacional desconocida (σ2).
6.Calcular intervalos de confianza y realizar pruebas de hipótesis (unilaterales y bilaterales) para la proporción poblacional (π). 7.Calcular intervalos de confianza y realizar pruebas de hipótesis (unilaterales y bilaterales) para la diferencia entre medias poblacionales (μ1yμ2) con varianzas conocidas (σ21 y σ22). 8.Calcular intervalos de confianza y realizar pruebas de hipótesis (unilaterales y bilaterales) para la diferencia de medias poblacionales (µ1y µ2) con varianzas desconocidas pero iguales (σ2).
9. Calcule intervalos de confianza y realice contrastes de hipótesis (unilateral y bilateral) para el índice de varianza poblacional (σ21yσ22). 10. Calcule los intervalos de confianza y realice pruebas de hipótesis (unilateral y bilateral) para la diferencia en los tamaños de población (π1 y π2).
Distribuciones de probabilidad
Introducción
Distribuciones de probabilidad discretas
- Distribución binomial
- Distribución geométrica
- Distribución hipergeométrica
- Distribución de Poisson
Esto no es más que la probabilidad de que en 5 intentos nuestro jugador no acierte un triple. Aparecerá el siguiente cuadro de diálogo, donde tenemos que introducir los valores - nosotros mismos o la probabilidad de éxito - en el(los) valor(es) de la variable. Eso es lo que decimos formalmente.
Si queremos saber la probabilidad de que anote el primer triple dentro de los 6 primeros tiros a canasta haremos el siguiente cálculo. La interpretación del gráfico resultante es muy intuitiva: muestra, en el eje horizontal, el número de fallos hasta realizar el primer triple, y en el eje vertical, la probabilidad asociada. El primer valor coincide con p = 0,3, que es la probabilidad de acertar un triple, y a partir de ahí disminuye a cero a medida que aumenta el número de intentos.
Como podemos ver, la probabilidad de que los 3 temas que estudiaste aparezcan en el examen es de 26,9. La probabilidad máxima es P(X=2)=0.485, es decir, estudiaste dos de los tres temas.
Distribuciones de probabilidad continuas
- Distribución uniforme
- Distribución exponencial
- Distribución normal
- Distribución t de Student
- Teorema del límite central
Recuerde que estamos buscando la probabilidad que permanece en la cola izquierda, P(X<5), y debemos especificar eso también en el diálogo. Es importante volver a insistir en que cuando trabajamos con distribuciones continuas, P(X Esta opción está disponible en el diálogo anterior donde teníamos que especificar la cola de la distribución que nos interesa. Formalmente, tiene un único parámetro θ=λ >0 y se define para valores no negativos de la variable aleatoria. Tomando el gráfico anterior, vemos que si trazamos una línea vertical en la media aritmética (3.5), el 50% de la masa probabilística permanece en las dos partes de la distribución. Un ejemplo importante en el estudio de la distribución normal es la distribución de la media muestral de una variable aleatoria. Se utiliza, entre otras cosas, en los casos en los que desconocemos la dispersión de la variable que estamos analizando. Entonces la distribución muestral de la media ya no es la distribución normal que era cuando conocíamos el verdadero valor de la desviación (σ). El teorema del límite central (CLT) establece que si una muestra es lo suficientemente grande (n > 30), la distribución de la media muestral seguirá aproximadamente una distribución normal, independientemente de la distribución de la variable de interés. Además, la media será la misma que la de la variable de interés y la desviación estándar de la media muestral se aproximará al error estándar. Volvamos al ejemplo del caso de la distribución binomial, la del jugador de baloncesto que acertó triples. Lo primero que hay que tener en cuenta es que no es necesario introducir el valor de la varianza en el espacio de desviación estándar; Primero debemos calcularlo sacando la raíz cuadrada: es decir. Considerando la variable aleatoria dicotómica Y, cuando el tamaño de la muestra n es grande, la distribución de la proporción Y será aproximadamente una distribución normal cuyos parámetros E(Y)=pyVar(Y)=p(1−p)/n son. Como antes, debemos enfatizar que no es necesario introducir el valor de la varianza en el espacio de desviación estándar, es decir, debe introducirse. Además, cabe señalar que el resultado de esta probabilidad es exactamente el mismo que el resultado calculado en el ejemplo anterior. Esto tiene mucho sentido, ya que una distribución de Bernoulli no es más que un caso específico de la distribución binomial. Lo que estamos haciendo es no rechazarlo con la información que tenemos y el nivel de confianza que nos dan. Queremos preguntarnos si el peso medio de la clase se corresponde con el del colegio, que es, supongamos, µ0 =70. La principal diferencia es que no es necesario aportar ningún valor µ0, sino encontrar esos dos valores de la variable aleatoria (en este caso la media poblacional µ) que dejan el porcentaje α en dos colas, que es el nivel de significancia. Esto nos dice que el estadístico se encuentra en la región de aceptación y no en la región crítica, por lo que no rechazamos H0. A diferencia del caso anterior, ahora sí conocemos el parámetro de varianza poblacional (con desviación estándar σ). Es importante resaltar cómo el IC y el CH son dos caras de una misma moneda: si la proporción π = 0,6 estuviera fuera de este rango, habríamos rechazado H0. En esta sección implementaremos la inferencia con CH y CI basados en la distribución χ2. Supongamos que queremos sacar conclusiones sobre el parámetro σ2, por lo que queremos calcular un intervalo de confianza del 95% para este parámetro. Estos valores marcan los límites dentro de los cuales la estadística cae en la región de no rechazo de H0. Para calcular los valores del intervalo para el parámetro σ2, necesitaremos calcular los extremos del intervalo para la expresión anterior. En este caso, necesitamos utilizar un contraste basado en la distribución normal y no en la distribución t de Student. Observamos que en este caso el IC es mucho más preciso, es decir, el intervalo es más estrecho porque conocemos los datos de la población y utilizamos la distribución normal en lugar de la distribución t de Student. El objetivo de la prueba es comprobar si la frecuencia cardíaca media antes y después del experimento es estadísticamente diferente. Debido a que este intervalo no contiene el valor cero, la frecuencia cardíaca promedio de los individuos al final del experimento es estadísticamente diferente del promedio registrado al principio. Además, debido a que los valores de IC son positivos, podemos decir que la frecuencia cardíaca promedio aumentó estadísticamente con el fármaco. Esta sección incluye inferencias basadas en la distribución F de Snedecor que se realiza para evaluar si las varianzas de dos muestras son iguales o no. La prueba F se basa en la relación de la varianza muestral, por lo que la estadística toma la siguiente forma.Inferencia estadística