Propagación de errores
3.1 Error de medición
Una geóloga pesa una roca en una balanza. Toma cinco mediciones y obtiene los siguientes datos (en gramos):
251.3 252.5 250.8 251.1 250.4
Todas las mediciones son diferentes y es probable que ninguna sea igual a la masa real de la roca. A la diferencia entre un valor medido y el valor real se le llama erroren el valor medi- do. Cualquier procedimiento de medición tiene muchas fuentes de error. Por ejemplo, supon- 157
ga que las mediciones de la roca se leían en una marca en una escala. Si la balanza no estaba calibrada adecuadamente, cada medición estará lejos de su valor real en cierta cantidad fija. Por tanto, una calibración imperfecta aporta errores de la misma magnitud en cada medición. La interpolación entre las marcas de graduación de la escala es otra fuente de error. La mag- nitud del error debida a la interpolación quizá varíe entre mediciones y es probable que sea benéfico para algunas mediciones y negativo para otras. Es razonable suponer que a largo pla- zo el promedio de los errores por interpolación será igual a cero.
En general, se puede pensar que el error de una medición lo integran el error sistemá- tico, o sesgo,y el error aleatorio. El primero representa la parte del error que es igual para cada medición; el segundo varía entre mediciones y, en promedio, será igual a cero en el lar- go plazo. Algunas fuentes de error contribuyen con ambos tipos de error, el sesgo y el error aleatorio. Por ejemplo, considere el error de paralaje. Este último constituye la diferencia en la posición evidente de la marca cuando se observa desde ángulos diferentes. La magnitud de este tipo de error en cualquier medición especial depende de la posición del observador con respecto a la escala. Como consecuencia de que la posición variará un poco entre lecturas, el paralaje contribuye al error aleatorio. Si el observador tiende a apoyarse en algo de un lado en vez de otro, el paralaje también contribuirá al sesgo.
Cualquier medición se puede considerar como la suma del valor real más las contribu- ciones de cada uno de los dos componentes del error:
Valor medido Valor real sesgo error aleatorio (3.1) Puesto que parte del error es aleatorio, es adecuado utilizar un modelo estadístico para estu- diar los errores de medición. Se modela cada valor medido como una variable aleatoria, to- mada de una población de mediciones posibles. La media mde la población representa esa parte de la medición que es igual para toda medición. Por tanto,mes la suma del valor real más el sesgo. La desviación estándar sde la población representa la desviación estándar del error aleatorio. Ésta representa la variación debida al hecho de que cada medición tiene un va- lor diferente por su error aleatorio. Intuitivamente,sconstituye el tamaño de un error aleato- rio estándar.
Se tiene interés en dos aspectos del proceso de medición. El primero es su exactitud. Ésta la determina el sesgo, que es la diferencia entre la media mde la medición y el valor real de esta última. Entre más pequeño sea el sesgo, más exacto será el proceso de medición. Si la media mes igual al valor real, el sesgo será igual a 0; en esta tesitura, al proceso de medición se le llama no sesgado.
El otro aspecto del proceso de medición de interés es la precisión. Ésta constituye el grado con que tienden a coincidir las mediciones repetidas de la misma cantidad. Si las me- diciones repetidas resultan cercanas entre sí todo el tiempo, la precisión es alta. Si son muy dispersas, la precisión es baja. Por tanto, la precisión se determina mediante la desviación es- tándar sdel proceso de medición. Entre más pequeño sea el valor de s, más preciso será aquél. Con frecuencia ingenieros y científicos se refieren a scomo incertidumbre aleatoria
o incertidumbre estadísticadel proceso de medición. A sse le llamará en forma más sim- ple incertidumbre.
Cuando se notifica un valor medido, es importante reportar una estimación aproximada del sesgo y de la incertidumbre de éste, con la finalidad de describir la exactitud y la preci- sión de la medición. Generalmente es más fácil estimar la incertidumbre que el sesgo. Las fi- guras 3.1 y 3.2 ilustran el porqué de lo anterior. La figura 3.1 muestra un experimento
hipotético que implica mediciones repetidas, en condiciones diferentes, donde se considera al sesgo y la incertidumbre. Los conjuntos de mediciones en las figuras 3.1ay bestán bastante cer- canos, indicando que la incertidumbre es pequeña. Por su parte, los que corresponden a las fi- guras 3.1ay cse encuentran centrados cerca del valor real, indicando que el sesgo es pequeño.
FIGURA 3.1 a) Tanto el sesgo como la incertidumbre son pequeños. b) El sesgo es gran- de; la incertidumbre es pequeña. c) El sesgo es pequeño; la incertidumbre es grande. d) Tanto el sesgo como la incertidumbre son grandes.
Por supuesto, en la vida real no se conoce el valor real que se está midiendo. Por tanto, los dibujos de las mediciones que se muestran en la figura 3.1 se parecerían a la figura 3.2 (p. 160). Se puede determinar que los conjuntos de mediciones en las figuras 3.2ay btienen in- certidumbre más pequeña. Pero sin información adicional acerca del valor real, no se puede calcular el sesgo.
Se concluye de las figuras 3.1 y 3.2 que la incertidumbre se puede calcular de las me- diciones repetidas, pero para estimar el sesgo, se debe tener información adicional acerca del valor real. Se puede obtener esta información adicional, por ejemplo, midiendo repetida- mente una cantidad usual cuyo valor real se conoce y estimar al sesgo como la diferencia en- tre el promedio de las mediciones y el valor real conocido. Otra manera para calcular el sesgo sería comparar el promedio de gran número de mediciones con otra hecha con un proceso más elaborado para el que se sabe que el sesgo es despreciable. La estimación del sesgo es esen- cialmente el proceso de calibración, para el cual se necesita información externa al dispositi- vo de medición.
Resumen
Un valor medido representa una variable aleatoria con media my desviación están- dar s.
El sesgo en el proceso de medición constituye la diferencia entre la media de las mediciones y el valor real:
Sesgo m valor real
La incertidumbre en el proceso de medición es la desviación estándar s. Entre más pequeño sea el sesgo, más exacto será el proceso de medición. Entre más pequeña sea la incertidumbre, más preciso será el proceso de medición.
Valor real a) c) b) d) Valor real Valor real Valor real
Se sabe que una muestra de laboratorio de gas tiene una concentración de monóxido de car- bono (CO) de 50 partes por millón (ppm). Se utiliza un espectrómetro para tomar cinco me- diciones independientes de esta concentración. Las cinco mediciones, en ppm, son 51, 47, 53, 53 y 48. Estime el sesgo y la incertidumbre en una medición del espectrómetro.
Solución
Se consideran las cinco mediciones como una muestra aleatoria de la población de mediciones posibles. El sesgo es igual a la media de esta población menos el valor real de 50. La incerti- dumbre representa la desviación estándar de la población. No se conoce la media ni la des- viación estándar de la población, pero éstas se pueden aproximar con la media y la desviación estándar de la muestra. La media de las cinco mediciones es 50.4. Por tanto, se estima que el sesgo es de 50.4 50 0.4 ppm. La desviación estándar de las cinco mediciones es 2.8 ppm. Por consecuencia, se estima que la incertidumbre en cada medición es de 2.8 ppm.
Ahora se utiliza un espectrómetro diferente para medir la concentración de CO en otra mues- tra de gas. La concentración real de esta muestra es desconocida. Se hacen cinco mediciones (en ppm). Éstas son 62, 63, 61, 62 y 59. Estime la incertidumbre en una medición de este es- pectrómetro. ¿Se puede estimar el sesgo?
Solución
La incertidumbre en una sola medición se estima con la desviación estándar de la muestra, que es 1.5 ppm. La media de la muestra es 61.4 ppm, pero para estimar el sesgo se tendría que restar la concentración real de la media. Debido a que no se conoce la concentración real, no se puede estimar el sesgo.
En la práctica, las estimaciones aproximadas de la incertidumbre son a veces muy apro- ximadas. En los ejemplos 3.1 y 3.2 se sugiere estimar la incertidumbre scon la desviación estándar de la muestra de cinco mediciones. Las estimaciones que se basan en muestras pe- queñas parecidas a esta en ocasiones están muy equivocadas. Cuando es posible, es mejor es- timar la incertidumbre con base en muestras grandes. Sin embargo, una estimación de una muestra pequeña es mejor que ninguna.
a)
c)
b)
d)
FIGURA 3.2Se puede estimar la incertidumbre del conjunto de mediciones repetidas, pero si no se co- noce el valor real no es posible calcular el sesgo.
3.1
Ejemplo
3.2
Un ejemplo importante de la estimación de sesgo es la calibración de balanzas en su- permercados y otros establecimientos comerciales para asegurar que no pesan sistemática- mente de más o de menos los artículos. A este procedimiento le sigue una serie de comparaciones con patrones externos, comenzando en el ámbito jurisdiccional y terminando cerca de París, Francia, donde se localiza el patrón mundial final para el peso (técnicamente la masa). Éste es el prototipo internacional del kilogramo, un cilindro de platino-iridio cuya masa es por definición exactamente 1 kg. Una réplica del kilogramo se localiza en el Labora- torio Nacional de Normas y Tecnología, en Washington, el cual sirve de patrón para todas las mediciones de peso en Estados Unidos. El uso de esta réplica, en vez del kilogramo, introdu- ce un sesgo en cada medición de peso en ese país. Comparando la réplica de Estados Unidos con el kilogramo, el sesgo se ha estimado en 1.9 × 108kg. Es decir, la réplica que se en- cuentra en Estados Unidos parece más ligera que el kilogramo en aproximadamente 19 par- tes en mil millones. Por esta razón, todas las mediciones de peso que se hacen en el Laboratorio Nacional de Normas y Tecnología se ajustan hacia arriba en 19 partes en mil mi- llones para compensar. Observe que este factor de ajuste no se podía haber calculado pesan- do repetidamente la réplica; se requirió comparar con un patrón externo.
De ahora en adelante, a menos que se indique lo contrario, se supondrá que este sesgo se ha reducido a un nivel despreciable. Se describirán las mediciones en la forma
Valor medido s (3.2)
donde srepresenta la incertidumbre en el proceso que produjo el valor medido.
La expresión (3.2) tiene la forma a b, donde ay bson números. Es importante dar- se cuenta que las expresiones que contienen el símbolo pueden tener muchos significados. El significado aquí es que aes un valor medido y bconstituye la incertidumbre en a. Algu- nas personas usan a bpara indicar que bes el valor máximo para el error, o que bes un múltiplo de la incertidumbre, generalmente dos o tres veces la incertidumbre. Se presentará incluso otro significado en el capítulo 5, donde se usará la notación a bpara denotar un in-
tervalo de confianza, que es un intervalo que se calcula de tal forma para que probablemente
contenga al valor real. Siempre que se encuentre con el símbolo se debe asegurar que se comprende el contexto en el cual se utiliza.
Resumen
Sean Xl, . . . ,Xnmediciones independientes, todas se hacen con el mismo proceso en
la misma cantidad.
La desviación estándar sde la muestra se puede utilizar para estimar la incertidumbre. Las estimaciones de la incertidumbre con frecuencia son muy aproximadas, espe- cialmente cuando se basan en muestras pequeñas.
Si se conoce el valor real, la media de la muestra—X se puede utilizar para estimar el sesgo: Sesgo ≈—X, valor real.
Si el valor real no se conoce, el sesgo no se puede estimar a partir de las medicio- nes repetidas.
1. Se mide cuatro veces el punto de ebullición del agua. Los resultados son 110.01°C, 110.02°C, 109.99°C y 110.01°C. ¿Cuál de los siguientes enunciados describe mejor este pro- ceso de medición?
i. Exacto, pero no preciso.
ii. Preciso, pero no exacto.
iii. Ni exacto ni preciso.
iv. Tanto exacto como preciso.
2. Se usan dos aparatos para medir el punto de fusión del p-