• No se han encontrado resultados

Diseño de experimentos

N/A
N/A
Protected

Academic year: 2021

Share "Diseño de experimentos"

Copied!
14
0
0

Texto completo

(1)

11.1

Diseño de experimentos

(continúa)

En esta lección

aprenderás a identificar y diseñar un experimento, un estudio observacional y una encuesta

aprenderás a distinguir entre causalidad y asociación

Carrie tiene la teoría de que los estudiantes llegan tarde a la escuela porque toman el desayuno. Por lo tanto espera junto a la puerta a la hora de su primera clase y pregunta a cada estudiante que llega tarde si tomó el desayuno antes de salir para la escuela. Halla que el porcentaje de estudiantes que llegaron tarde a la primera clase y que tomaron el desayuno es de 66.7% y concluye que dos tercios de los estudiantes que llegaron tarde a la escuela llegaron tarde porque tomaron el desayuno.

Éste es un estudio anecdótico, un estudio en el cual los datos se reúnen desde una muestra conveniente para el investigador. Éste no es un tipo de estudio preciso o científico, pero se usa frecuentemente. En la página 618 de tu libro de texto hay un cuadro que describe tres modos mejores para reunir datos de muestra para estudio. Lee este cuadro y después estudia el diagrama que muestra las etapas de un estudio experimental.

Investigación: Diseñar un estudio

Completa la investigación en tu libro por tu cuenta. Después compara tus diseños de estudio con las siguientes respuestas de muestra.

Experimento

Para un experimento, debes pedir voluntarios de varias clases de matemáticas diferentes. En cada clase, asigna la mitad de los voluntarios al Grupo 1 y la otra mitad, al Grupo 2. Pídeles a todos los voluntarios que escriban cuánto tiempo se toman para completar sus tareas de matemáticas cada noche durante dos semanas. Para la primera semana, pide a los estudiantes del Grupo 1 que escuchen música mientras hacen las tareas de matemáticas. Pide a los del Grupo 2 que no escuchen música. Durante la segunda semana, haz que los dos grupos cambien de papel. Estudio observacional

Realizar un estudio observacional que no tenga una muestra sesgada es complicado. Por ejemplo, puedes observar a los estudiantes que están en la biblioteca o en el centro de estudio y darte cuenta de si están escuchando música o no y de cuánto tiempo les lleva completar las tareas. Sin embargo, esto puede ser una muestra sesgada porque es más probable que los estudiantes que estudian en casa escuchen música. Y en muchas escuelas no están permitidos los reproductores de música, lo que haría imposible realizar un estudio observacional. En cambio, puedes distribuir un cuestionario que no revele el propósito del estudio. Puedes poner los tiempos con intervalos de 10 minutos en un lado y una lista de actividades en la parte superior como, escuchar música, hablar por teléfono, chatear y así sucesivamente. Después pide a los estudiantes que seleccionen las actividades que hacen durante cada periodo de tiempo.

(2)

Lección 11.1 • Diseño de experimentos (continuación)

Encuesta

Distribuye las encuestas a los estudiantes de varias clases de matemáticas. Pídeles que registren la cantidad de tiempo que les lleva completar sus tareas de matemáticas durante una semana. Pregúntales si escuchan música mientras hacen sus tareas de matemáticas.

Lee atentamente el texto después de la investigación que explica la diferencia entre causalidad y asociación.

Cualquiera que realice un estudio debe tener mucho cuidado con los sesgos. Elegir los sujetos al azar, representar correctamente los subgrupos de la población y revisar independientemente el modo en que se realizará un experimento, un estudio observacional o una encuesta puede reducir los sesgos. Debes saber cómo se reúnen los datos y qué sesgos o errores puede haber antes de aceptar la conclusión de un estudio.

Analiza el Ejemplo A y el Ejemplo B en tu libro. Después lee el siguiente ejemplo.

EJEMPLO Ángela tiene la teoría de que los hermanos menores aprenden a leer más rápido que sus hermanos mayores. Para comprobar su teoría, realiza una encuesta entre sus compañeros de clase. En la encuesta, hace las siguientes preguntas:

1. ¿Qué edad tenías cuando aprendiste a leer?

2. ¿Qué edad tenían tus hermanos cuando aprendieron a leer? 3. En tu familia, ¿eres el hermano menor, mayor o del medio?

Describe los problemas de la metodología de Ángela. ¿Qué tipo de estudio funcionaría bien para validar o rebatir la teoría de Ángela?

Solución

El problema principal del plan de Ángela es que es probable que los estudiantes

no puedan dar una información precisa de cuántos años tenían cuando

aprendieron a leer, o cuántos años tenían sus hermanos. Los estudiantes tendrían que confiar en sus recuerdos (posiblemente poco precisos) y los recuerdos de sus padres y de sus hermanos, que también podrían ser inexactos.

Un estudio observacional a gran escala funcionaría bien para probar la teoría de Ángela. Se puede preguntar a los maestros de escuelas preescolares

y primarias sobre las edades en las que sus estudiantes aprenden a leer. Después los investigadores podrían pedir a los padres de los estudiantes involucrados en el estudio que informen sobre el orden en el que nacieron.

(3)

(continúa)

Distribuciones de probabilidad

En esta lección

dibujarás la gráfica de la distribución de probabilidad de una variable aleatoria continua

● hallarás probabilidades al hallar o aproximar las áreas bajo una curva de distribución de probabilidad

extenderás las definiciones de moda, mediana y media a distribuciones de probabilidad

En tiempos electorales, a menudo las estaciones de televisión, los diarios y las revistas realizan encuestas. Al encuestar una pequeña muestra de votantes, esperan obtener información sobre cómo se siente la población completa de votantes acerca de cierto candidato o ciertas cuestiones. En capítulos anteriores aprendiste algunas estadísticas —por ejemplo, la media, la mediana y la desviación estándar— que se pueden usar para describir una muestra. Los números correspondientes que describen a la población completa se llaman parámetros. Cuánto más grande sea la muestra, más cerca estarán sus estadísticas a los parámetros.

En el capítulo anterior, trabajaste con variables aleatorias discretas. Los datos tenían valores enteros, por ejemplo, 10 caras o 3 cruces. En ocasiones, los datos pueden tomar cualquier valor real dentro de un intervalo. Esto se representa con una variable aleatoria continua. Por ejemplo, la altura de una persona elegida al azar es una variable aleatoria continua. Una persona podría tener una altura de 165 cm o de 166 cm, pero cualquier medida entre tales mediciones enteras también es posible (por ejemplo, 165.25 cm ó 165.67897 cm).

Investigación: Longitud de lápices

La investigación en tu libro te pide que reúnas datos sobre las longitudes de los lápices de todos tus compañeros de clase. Los siguientes resultados se basan en tales datos de muestra. (Las longitudes están en centímetros.)

{16.9, 18.7, 11.3, 13.8, 15.2, 17.0, 16.5, 16.6, 11.8, 17.2, 15.5, 15.7, 17.0, 11.4, 16.5, 16.0, 13.4, 15.7, 15.5, 14.1, 12.3, 13.8, 15.5, 15.7, 10.7, 15.6, 12.1, 14.4, 16.5, 17.9, 8.2, 17.8, 17.6, 14.1, 16.7, 14.6, 12.3, 10.0, 13.2, 14.3}

Crea un histograma de estos datos con columnas que

8 10

Longitud de los lápices (cm)

Númer o de lápic es 2 0 12 14 16 18 20 4 6 8 10

representan incrementos de 1 cm. El histograma debe parecerse al de la derecha.

Divide el número de lápices de cada columna por el número total de lápices. Debes obtener los siguientes resultados: 8–9: 0.025 9–10: 0 10–11: 0.05 11–12: 0.075 12–13: 0.075 13–14: 0.1 14–15: 0.125 15–16: 0.2 16–17: 0.175 17–18: 0.15 18–19: 0.025

Haz un segundo histograma usando estos nuevos valores como los valores y. Tu histograma debe parecerse al que presentamos en la página siguiente. Esta gráfica tiene la misma forma que la anterior, pero la escala vertical es diferente.

(4)

Lección 11.2 • Distribuciones de probabilidad (continuación)

La altura de cada barra representa la fracción de lápices

8 10 F rac ción de lápic es 0.05 0 12 14 16 18 20 0.10 0.15 0.20 0.25

Longitud de los lápices (cm)

con longitudes dentro del intervalo dado. Como el ancho de cada barra es 1, el área de cada barra también representa la fracción de lápices dentro del intervalo. Dado que se consideraron todos los lápices, el área total de todas las barras debe ser 1. Puedes verificar esto sumando las áreas. Observa que el área de cada cuadrado de la cuadrícula es 0.025. Imagina que reúnes y mides cada vez más lápices y dibujas un histograma usando la fracción de lápices como la altura de la columna. Dibuja un histograma con tantas longitudes de lápices como desees. Asegúrate de poder justificar la forma de tu histograma.

Imagina que haces una encuesta completa y precisa de

8 10 F rac ción de lápic es 0.05 0 12 14 16 18 20 0.10 0.15 0.20 0.25

Longitud de los lápices (cm)

todos los lápices del mundo. Supón que la distribución de longitudes sea aproximadamente la misma que la de la muestra anterior. Además, supón que utilices un número infinito de columnas muy delgadas. (Cada ancho de columna representa una fracción infinitamente pequeña de un centímetro.) Para aproximar esta gráfica, dibuja una curva lisa sobre la parte superior de tu histograma. Haz que el área entre la curva y el eje horizontal sea

aproximadamente la misma que el área del histograma. Intenta asegurararte de que el área extra encerrada por la curva por encima del histograma sea igual al área cortada en las esquinas de las columnas, como en la curva de lo derecha.

Usa tu curva para estimar las áreas descritas en el Paso 7 de tu libro. Las siguientes estimaciones se basan en la curva de la derecha.

a. Aproximadamente 0.025 b. Aproximadamente 3(0.025), ó 0.075

c. Aproximadamente 32.5(0.025), ó 0.8125 d. 0

El segundo histograma que hiciste en la investigación, que muestra la fracción de lápices en cada columna, se llama histograma de frecuencias relativas. La curva lisa que dibujaste se aproxima a la distribución de probabilidad de una variable aleatoria continua para el conjunto infinito de mediciones.

Las áreas que hallaste son las probabilidades de que la longitud de un lápiz elegido al azar satisfaga la condición dada. Si x representa la variable aleatoria continua que da las longitudes de los lápices en centímetros, entonces puedes escribir estas áreas como:

P (x  10) P (11  x  12) P (x  12.5) P (x  11)

En una distribución de probabilidad continua, la probabilidad de tener cualquier resultado sencillo, tal como la probabilidad de que la longitud de un lápiz sea 11 cm, es el área de un segmento de recta, es decir, 0. Teóricamente es posible que un lápiz tenga 11 cm de longitud, pero la probabilidad de escoger un resultado entre un número infinito de ellos es 0. Lee el Ejemplo A en tu libro que ilustra cómo las áreas representan las probabilidades para una variable aleatoria continua.

Después del Ejemplo A, tu libro define la moda, la mediana y la media de una distribución de probabilidad. Estas definiciones, aunque son un tanto diferentes, están relacionadas con las definiciones que aprendiste anteriormente. Léelas atentamente. Después aplica las nuevas definiciones resolviendo el Ejemplo B.

(5)

Distribuciones normales

(continúa)

11.3

En esta lección

● aprenderás que la gráfica de una distribución binomial es una curva con forma de campana, llamada curva normal

aprenderás la ecuación de una distribución normal con media  y desviación estándar 

usarás las funciones de una calculadora para representar gráficamente una curva normal y hallar áreas debajo de una porción de la curva

descubrirás la regla 68-95-99.7 para determinar la probabilidad de que un valor de datos esté dentro de una, dos o tres desviaciones estándar de la media

En el Capítulo 10, estudiaste la distribución binomial para variables aleatorias discretas. En general, si un experimento tiene dos resultados, éxito y fracaso, con una probabilidad de éxito p y una probabilidad de fracaso q, entonces la probabilidad de x éxitos en n ensayos es P (x)  nCx pxqnx. Observa que

q  1  p, por lo tanto esto es equivalente a P (x)  nCx px(1  p)nx. En esta lección, descubrirás propiedades de esta distribución de probabilidad.

A medida que n se hace cada vez más grande, la distribución binomial se ve cada vez más continua hasta que adquiere la apariencia de la curva en forma de campana que se muestra a la derecha. Las distribuciones de poblaciones grandes a menudo tienen esta forma. Una curva con forma de campana se llama curva normal y una distribución con esta forma se llama distribución normal.

Las fórmulas que has aprendido para la media de la muestra, x, y la desviación estándar, s, son estimados para los valores en la población. Cuando hallas la media y la desviación estándar de la totalidad de una población, éstas se llaman media poblacional, , y desviación poblacional estándar, . Estos símbolos son las letras griegas “mi” y “sigma”.

A partir de la página 634, tu libro analiza la ecuación de la gráfica de la

distribución normal. Lee ese texto y analiza el ejemplo. En el ejemplo, representa gráficamente la ecuación general de la curva normal, escribe la ecuación de una distribución normal estándar con media  y desviación estándar , y después determina si una curva normal se ajusta bien a una distribución binomial dada. La ecuación general de una distribución normal también se da en el recuadro “The Normal Distribution” (La distribución normal) en la página 637.

Puede resultar tedioso ingresar la ecuación de la distribución normal en una calculadora. Por suerte, la mayoría de las calculadoras dan la ecuación como una función preconfigurada. Sólo tienes que proporcionar la media y la desviación estándar. (Consulta Calculator Note 11B para aprender cómo representar una distribución normal en tu calculadora.)

Este capítulo usa la notación n (x, media, desviación estándar) para representar una distribución normal. Por ejemplo, n (x, 2.6, 1.5) representa una distribución normal con media 2.6 y desviación estándar 1.5. La función distribución normal estándar,

(6)

Lección 11.3 • Distribuciones normales (continuación)

es decir, la función de la distribución normal con media 0 y desviación estándar 1, se denota simplemente como n (x). La notación N (inferior, superior, media,

desviación estándar) se usa para representar el área debajo de una parte de la

curva normal. Por ejemplo, N (2, 3, 2.6, 1.5) representa el área entre x  2 y x  3 debajo de la curva de distribución normal con media 2.6 y desviación estándar 1.5. (Consulta Calculator Note 11C para aprender cómo hallar estas áreas en tu calculadora.)

Investigación: La curva normal

Resuelve la investigación en tu libro por tu cuenta. Después verifica tus resultados con los siguientes.

Paso 1 Tus datos variarán. Sin embargo, tus resultados de los Pasos 1 al 3 de tus datos deben ser muy similares a los que se muestran a continuación.

Paso 2 Para los datos de la muestra representados a continuación, ___ 337500  67.4% de los valores de los datos están dentro de una desviación estándar de la media.

Paso 3 479___ 500  95.8% de los datos están dentro de dos variaciones estándar de la media, y ___ 499500  99.8% dentro de tres desviaciones estándar de la media.

Paso 4 La regla “68-95-99.7” establece que en una muestra aleatoria aproximadamente el 68% de los valores están dentro de la desviación estándar de la media para la curva, aproximadamente 95% está dentro de dos variaciones estándar y aproximadamente 99.7% está dentro de tres variaciones estándar. Paso 5 Crea tu propio conjunto de datos y una tabla similar a la

que usaste para los Pasos 1, 2 y 3 de esta investigación. Analiza los porcentajes de datos que están a una, dos y tres desviaciones estándar de la media.

Paso 6 Las probabilidades deben seguir muy de cerca la regla de 68-95-99.7. Casi todos los datos deben estar dentro de las tres desviaciones estándar de la media.

En los puntos que están a una desviación estándar de

␴

Curvatura hacia abajo

Curvatura hacia arriba

Curvatura hacia arriba

la media, la curva normal cambia de una curvatura hacia abajo a una curvatura hacia arriba. Estos puntos se llaman puntos de inflexión. Puedes estimar la desviación estándar de una distribución normal ubicando los puntos de inflexión de su gráfica.

(7)

Valores z e intervalos de confianza

(continúa)

11.4

En esta lección

● aplicarás la regla 68-95-99.7

aprenderás cómo transformar los valores x de una distribución normal en valores z

calcularás intervalos de confianza

Saber cómo un valor de una muestra se relaciona con el valor medio no te dice si el valor es típico. Por ejemplo, decir que el peso de un perro terrier escocés es de 4 lb por encima de la media no te dice si esta medida es un evento raro o un evento común. Si supieras cuántas desviaciones estándar tiene el peso del perro de la media, podrías evaluar mejor si tal peso es común o no.

Investigación: Seguimiento de la puntuación

Lee la investigación en tu libro y saca tu propia conclusión antes de leer la siguiente solución posible.

Una medida posible es la distancia de la puntuación de cada estudiante desde la media. La puntuación de Andrés fue 86  74  12 puntos sobre la media, mientras que la de Imani fue 84  75  9 puntos sobre la media. Sin embargo, calcular la distancia desde la media en números de variaciones estándar dará una mejor medida de cómo le fue a cada estudiante comparado con otros estudiantes que presentaron el examen.

La puntuación de Andrés de 86 fue 86  74______ 9  _ 43 , ó aproximadamente 1.33

desviaciones estándar sobre la media. La puntuación de Imani de 84 fue 84  75______ 6  3_ 2 , ó 1.5 desviaciones estándar sobre la media. La puntuación de Andrés pudo ser más alta, pero Imani lo hizo mejor con relación al resto de su clase.

En una distribución normal, el valor z, o puntuación z, de x es el número de desviaciones estándar de x desde la media. Como aprendiste en la Lección 11.3, la probabilidad de que una nueva medida tenga un valor z entre 1 y 1 es 68%, la probabilidad de que tenga un valor z entre 2 y 2 es 95% y la probabilidad de que tenga un valor z entre 3 y 3 es 99.7%.

Puedes pensar en los valores z de x como la imagen de x de una transformación que traslada y dilata la distribución normal, para convertirla en la distribución normal estándar n (x) con media   0 y desviación estándar   1. La transformación de valores x en valores z se llama estandarización de la variable y se puede calcular con la ecuación z  x  , donde  y  son la media y la desviación estándar de la distribución

normal de x. Analiza el Ejemplo A en tu libro, que ilustra la estandarización de la variable. Observa que, cuando se usa un proceso de tanteos en la parte c, debes probar solamente los intervalos que son simétricos con respecto a la media.

No hay modo de saber con certeza la cercanía entre la media de la población normalmente distribuida y la media de una muestra. Sin embargo, puedes describir el nivel de confianza que tienes de que la media de la población esté dentro de un intervalo dado, centrada en la media de la muestra. Un intervalo de confianza p % es un intervalo alrededor de la media de la muestra, x, en el que puedes tener p % de confianza de que la media de la población, , esté allí.

(8)

Lección 11.4 • Valores z e intervalos de confianza (continuación)

Específicamente, si z es el número de desviaciones estándar desde la media, dentro de la cual está el p % de los datos normalmente distribuidos, entonces el intervalo de confianza p % de una muestra de tamaño n es:

x  z

n    x  zn El valor de ___  z __

n se llama margen de error. En muchas situaciones reales, no

conocerás la desviación estándar de la población. Sin embargo, si el tamaño de la muestra es lo suficientemente grande, por lo general n  30, puedes usar la desviación estándar de la muestra, s, en lugar de .

La regla 68-95-99.7 te dice qué valores z debes usar si quieres tener una confianza de 68%, 95% ó 99.7%. En el Ejemplo B de tu libro, los intervalos de confianza se calculan utilizando distintos métodos. Analiza ese ejemplo y después intenta resolver el problema en el siguiente ejemplo.

EJEMPLO El gerente de control de calidad de una empresa que empaca cereal sacó una muestra aleatoria de 30 cajas del cereal Morning Crunch de las líneas de producción y pesó el contenido de cada caja. El peso medio de la muestra fue de 9.8 onzas y la desviación estándar fue de 0.42 onzas.

a. Halla los intervalos de confianza de 68% y 90%.

b. La etiqueta de la caja de Morning Crunch dice que el peso es de 10 onzas. ¿Crees que el gerente de control de calidad debe informar que hay un problema con el peso de las cajas? Explica tu respuesta.

Solución

a. Usando la desviación estándar de la muestra en lugar de , el intervalo de

confianza de 68% es:



9.8  1(0.42) 30 , 9.8  1(0.42)  30



, o aproximadamente (9.72, 9.88)

El gerente de control de calidad tiene una confianza de 68% de que el peso medio está entre 9.72 y 9.88 onzas.

Como lo hallaste en el Ejemplo B, parte c, el valor z correspondiente a un intervalo de confianza de 90% es 1.645, por lo tanto el intervalo de confianza de 90% es:



9.8  1.645(0.42) 30 , 9.8  1.645(0.42)  30



, o aproximadamente (9.67, 9.93) El gerente de control de calidad tiene una confianza de 90% de que el peso de

la población media está entre 9.67 y 9.93 onzas.

b. De acuerdo con la respuesta a la parte a, el gerente de control de calidad puede tener una certeza del 90% de que la población media (es decir, el peso medio de todas las cajas producidas) está dentro del intervalo (9.67, 9.93). Dado que el intervalo no incluye la cifra de 10 onzas, que es el peso declarado en la caja, el gerente debe informar que hay problemas con el peso.

(9)

Datos bivariados y correlación

(continúa)

11.5

En esta lección

determinarás si dos variables están correlacionadas

usarás el coeficiente de correlación para determinar la fuerza de una correlación

Muchos problemas estadísticos de la vida real implican predecir las asociaciones entre dos variables. Por ejemplo, los investigadores desearían determinar si hay una asociación entre el número de miligramos de vitamina C que consume una persona y el número de resfriados que tiene. El proceso de reunir datos de dos variables posiblemente relacionadas se llama muestreo bivariado.

Una asociación entre variables se llama correlación. En esta lección te centrarás en determinar si hay una asociación lineal entre variables y la fuerza de tal asociación. La medida estadística de asociación lineal más usada es el coeficiente de correlación.

Investigación: Búsqueda de conexiones

Paso 1 Observa la encuesta del Paso 1 de la investigación en tu libro.

Paso 2 Enumera al menos dos pares de variables que crees que tendrán una

correlación positiva (a medida que una aumenta, la otra tiende a aumentar).

Una posibilidad podría ser el número de minutos que se pasa haciendo las tareas (pregunta 1) y el número de clases (pregunta 5).

Ahora, enumera al menos dos pares de variables que tendrían una correlación

negativa (mientras una aumenta, la otra tiende a disminuir). Una posibilidad es

el número de clases (pregunta 5) y el tiempo que se pasa en platicar con amigos, llamarles por teléfono, mandarles mensajes de e-mail o escribirles (pregunta 2). Finalmente, enumera dos pares de variables que tendrían una correlación débil. Una posibilidad sería el tiempo que pasa comunicándose con amigos (pregunta 2) y el tiempo de ir a dormir (pregunta 4).

Paso 3 La tabla en la página siguiente muestra los resultados obtenidos en una clase. Ingresa los datos en cinco listas de la calculadora u hojas de cálculo. Ingresa los puntos correspondientes a cada par de listas y halla los coeficientes de correlación de cada par. (Consulta Calculator Note 11E.) Éstos son los coeficientes de correlación y las gráficas de las relaciones mencionadas en el Paso 2. Sin embargo, debes hacer gráficas y hallar los coeficientes de correlación de todos los pares posibles.

5 vs. 1

5 vs. 2

4 vs. 2

(10)

Lección 11.5 • Datos bivariados y correlación (continuación)

(continúa)

Debes hacer las siguientes observaciones:

● Las gráficas crecientes tienen coeficientes de correlación positivos y las gráficas decrecientes tienen coeficientes de correlación negativos.

● Cuanto más fuerte sea la correlación, más cerca estará el coeficiente de correlación a 1. Las correlaciones débiles tienen coeficientes de correlación cercanos a 0.

Estudiante Pregunta 1 Pregunta 2 Pregunta 3 Pregunta 4 Pregunta 5

1 0 120 60 100 3 2 20 120 90 200 4 3 80 65 80 140 6 4 55 20 220 260 5 5 10 20 155 200 4 6 15 0 145 200 4 7 90 10 80 150 6 8 215 10 0 60 6 9 100 0 140 150 6 10 60 30 120 105 5 11 65 0 120 150 6 12 10 60 300 360 4 13 120 0 0 45 6 14 30 45 285 90 4 15 40 60 150 190 4 16 0 85 150 75 3 17 0 180 30 30 4 18 80 0 0 0 6 19 90 20 0 0 6 20 45 10 180 285 5 21 10 120 0 90 4 22 40 30 100 115 5 23 0 0 360 60 5 24 30 50 45 90 5 25 60 20 30 90 6 26 45 20 30 45 5 27 20 105 20 60 4 28 0 90 0 120 4 29 50 40 0 90 5 30 40 10 0 45 4

(11)

Menciona los pares que no están correlacionados y que tú pensabas que deberían estarlo. Éstas son algunas cosas que podrías mencionar: Las correlaciones entre el tiempo que pasa haciendo las tareas y el número de clases, y entre el tiempo que pasa mirando televisión y la hora de acostarse, son relativamente fuertes y positivas. Las correlaciones entre el tiempo que pasa platicando con amigos y el número de clases, y entre el tiempo que pasa haciendo las tareas y el tiempo que pasa platicando con amigos, son relativamente fuertes y negativas. Los otros pares de variables parecen no estar correlacionados. Estos datos se reunieron de una muestra pequeña que no fue muy aleatoria, por lo tanto es posible que no sean buenos para predecir los resultados de la escuela completa.

El texto que aparece entre la investigación y el Ejemplo A en tu libro ofrece información sobre el coeficiente de correlación y sobre cómo se derivó su fórmula. Este texto también explica que en la estadística, las variables x e y a menudo se llaman variables de explicación y de respuesta. Lee este texto y después analiza el Ejemplo A, que muestra cómo calcular el coeficiente de correlación usando la fórmula.

Es muy importante no confundir la correlación con la causalidad. El hecho de que dos variables estén fuertemente correlacionadas no significa que un cambio en una variable cause un cambio en la otra. El Ejemplo B ilustra este punto. Lee ese ejemplo atentamente.

(12)
(13)

La recta de mínimos cuadrados

(continúa)

11.6

En esta lección

aprenderás cómo ajustar la recta de mínimos cuadrados a un conjunto de datos

● descubrirás cómo la recta de mínimos cuadrados adquirió su nombre

usarás el error cuadrático medio para comparar una recta de mínimos cuadrados con una recta mediana-mediana

En el Capítulo 3, aprendiste cómo ajustar una recta a los datos y a hacer predicciones. En esta lección, aprenderás sobre la recta de ajuste usada más comunmente, llamada recta de mínimos cuadrados. La ecuación de la recta de mínimos cuadrados es

zy  rzx , donde r es el coeficiente de correlación, y zx y zy son los valores z para x e y, respectivamente. En la práctica, deseas que la ecuación represente la relación entre

x e y, no entre sus valores z. Usando la definición del valor z, puedes volver a escribir

la ecuación como: y s y y   r



x s x x 



ó yˆ  y  r



s __ s y x



(x  x)

Para hallar más detalles sobre la recta de mínimos cuadrados, lee el texto que precede el Ejemplo A en tu libro. Después lee el Ejemplo A, que ilustra cómo hallar la recta de mínimos cuadrados para un conjunto de datos dado.

Investigación: Tiempo de giro

Si puedes, usa datos de tus compañeros de clase. De lo contrario, usa los siguientes datos de muestra para responder los Pasos 2 a 5. Después, compara tus respuestas con las siguientes.

Paso 1 Los datos de muestra están en la siguiente tabla. Moneda Tiempo de giro (s)

25¢ 10.69, 12.26, 13.56, 9.71

10¢ 8.38, 7.47, 8.87, 7.37

5¢ 15.48, 13.88, 12.19, 12.54

1¢ 9.6, 11.39, 8.25, 6.78

Paso 2 El espesor y el peso parecen ser factores que afectan el tiempo de giro de las monedas.

Paso 3 Usando la tabla en tu libro, compara el tiempo de giros con las variables de peso, diámetro, espesor, área y volumen. Usa tu calculadora u otra tecnología para hallar el coeficiente de correlación y la ecuación de la recta de mínimos cuadrados. Recuerda que puedes hallar la recta de mínimos cuadrados usando la ecuación yˆ  y  r



__ s s yx



(x  x). Al comparar el tiempo

de giro y el espesor usando los datos de muestra, da r  0.840 y la recta de mínimos cuadrados yˆ  5.19  9.525x. La recta de mínimos cuadrados y los datos que comparan el tiempo de giro y el espesor se muestran a continuación.

(14)

Lección 11.6 • La recta de mínimos cuadrados (continuación)

Paso 4 Resuelve para el tiempo de giro reemplazando el espesor por x en la ecuación para la recta de mínimos cuadrados y resolviendo para el tiempo de giro.

y  5.19  9.525(2.00) y  13.86 segundos

El dólar debe girar durante aproximadamente 14 segundos.

Paso 5 Responde a las preguntas por tu cuenta antes de leer los siguientes ejemplos de respuesta.

a. El promedio es más estable que un valor simple. Un giro muy bueno o uno muy malo pueden cambiar todo.

b. Cualquier orden sistemático hace que los datos se vean afectados por otros factores. Por ejemplo, la persona que gira las monedas puede mejorar su técnica con cada giro. Los factores que no se puedan controlar deben hacerse aleatorios. Como no puedes hacer los 16 giros al mismo tiempo, los ordenas al azar.

c. En un experimento se debe tratar de controlar cada factor, excepto el factor bajo consideración (las características de la moneda). Distintas personas pueden usar técnicas diferentes para hacer giros y tomar el tiempo; usar un solo disco y un solo cronómetro da un mejor control de este factor.

d. Para elegir tu modelo, debes mirar el coeficiente de correlación y cualquier patrón en los residuos.

e. En un estudio observacional no podrás saber si el tiempo de giro más largo se debió a la moneda, al lanzador, al cronómetro o a otras condiciones; por lo tanto no se puede sacar ninguna conclusión de causalidad. En un experimento bien diseñado, puedes concluir que las distintas monedas tienen características que “causan” diferentes tiempos de giro.

Puedes medir la precisión de una recta de mínimos cuadrados al calcular el error cuadrático medio, tal como lo hiciste para la recta mediana-mediana en el Capítulo 3. El Ejemplo B en tu libro se ajusta tanto una recta de mínimos cuadrados como una recta mediana-mediana a un conjunto de datos y determina cuál es el mejor ajuste al calcular el error cuadrático medio. Analiza ese ejemplo y después lee el resto de la lección.

A menudo la recta de mínimos cuadrados se llama “recta de mejor ajuste” porque tiene la más pequeña suma de cuadrados de los errores entre los puntos de datos y las predicciones de la recta. Sin embargo, debido a que pone un mismo énfasis en cada punto, la recta de mínimos cuadrados puede verse afectada por los valores extremos. Cuando ajustes una recta a los datos, siempre resulta una buena idea verificar la recta visualmente. En ocasiones, la recta mediana-mediana u otra recta es un mejor ajuste que la recta de mínimos cuadrados.

Referencias

Documento similar

6 Para la pervivencia de la tradición clásica y la mitología en la poesía machadiana, véase: Lasso de la Vega, José, “El mito clásico en la literatura española

Habiendo organizado un movimiento revolucionario en Valencia a principios de 1929 y persistido en las reuniones conspirativo-constitucionalistas desde entonces —cierto que a aquellas

• La ecuación en su forma simétrica nos indica que la recta corta al plano en x = 1.67 y en y = -12.5. •

This section provides guidance with examples on encoding medicinal product packaging information, together with the relationship between Pack Size, Package Item (container)

Package Item (Container) Type : Vial (100000073563) Quantity Operator: equal to (100000000049) Package Item (Container) Quantity : 1 Material : Glass type I (200000003204)

d) que haya «identidad de órgano» (con identidad de Sala y Sección); e) que haya alteridad, es decir, que las sentencias aportadas sean de persona distinta a la recurrente, e) que

De hecho, este sometimiento periódico al voto, esta decisión periódica de los electores sobre la gestión ha sido uno de los componentes teóricos más interesantes de la

Talla media y desviación estándar de candelilla para el área con distribución potencial (General) y entre los tipos de vegetación, tipo de suelo y pendiente del terreno en el norte