• No se han encontrado resultados

Probabilidad frecuentista

N/A
N/A
Protected

Academic year: 2020

Share "Probabilidad frecuentista"

Copied!
7
0
0

Texto completo

(1)

Probabilidad Frecuentista

1.

El principio de regularidad de las frecuencias

relativas

El primer intento de formalizar las ideas y conceptos de probabilidad, surge de la experiencia y pr´actica directa de ciertos fen´omenos y experimen-tos aleatorios, como los juegos de azar, y de la comprobaci´on del principio emp´ırico deregularidad estad´ıstica de las frecuencias relativasde los eventos asociados a dichos fen´omenos.

Ejemplo 1:Consideremos una urna compuesta de 4 bolas blancas y 2 rojas. Un experimento consiste en elegir de esta urna una bola al azar (es decir, sin preferencia por color o posici´on de la bola, ni de ninguna otra especie). Si repetimos un n´umero grande de veces este experimento, ¿cu´al es la frecuencia con la cual se obtiene una bola blanca?

Para responder, hagamos espec´ıficamente 6 series de 100 repeticiones del experimento cada una. Registramos los resultados en un cuadro como el que sigue1:

Repeticiones N´umero Repeticiones N´umero

× de bolas Frec. acumuladas de bolas Frec.

serie blancas Rel. numeradas blancas Rel.

1-100 69 0.690 1-100 69 0.690

101-200 70 0.700 1-200 139 0.695

201-300 59 0.590 1-300 198 0.660

301-400 63 0.630 1-400 261 0.653

401-500 76 0.760 1-500 337 0.674

501-600 64 0.640 1-600 401 0.668

Seg´un el cuadro anterior, en cada una de las 6 series de 100 repeticio-nes del experimento, se obtuvo en promedio 66.8 bolas blancas, es decir, el 66.8 %, y las frecuencias relativas en cada serie fluctua al rededor de 0.6.

(2)

Note adem´as que, en cuanto a las repeticiones contabilizadas acumula-tivamente, las frecuencias relativas de elecci´on de bola blanca, son notaria-mente m´as estables alrededor de 0.6 (ver gr´aficos abajo).

Deducimos entonces que las frecuencias relativas de elecci´on de bola blanca, son m´as estables y pr´oximas a la fracci´on 0.6, cuanto m´as grande sea el n´umero de repeticiones del experimento.

100 200 300 400 500 600 0,3

0,6 1

b b

b b

b

b

Figura 1: Frecuencias relativas×series.

100 200 300 400 500 600 0,3

0,6 1

b b

b b b b

Figura 2: Frecuencias relativas acumuladas.

Ejemplo 2: En un hospital de cierta ciudad, durante el primer cuarto del a˜no, se registraron los siguientes nacimientos2

Enero 145 ni˜nos 135 ni˜nas 270 en total Febrero 142 ni˜nos 136 ni˜nas 278 en total Marzo 152 ni˜nas 140 ni˜nas 292 en total.

Seg´un estos datos, las frecuencias relativas de nacimiento de ni˜nos por cada mes est´an dadas por el cuadro:

2

(3)

Enero 145/

2700,518

Febrero 142/2780,511

Marzo 152/2920,520.

En promedio, en los tres meses se obtuvo una frecuencia relativa de casi 0.516, o bien, del 51.6 %, de nacimientos de ni˜nos.

En general, podemos afirmar el siguiente principio emp´ırico:

Principio de Regularidad de las Frecuencias Relativas.Supongamos que cierto experimento o fen´omeno aleatorio particular puede ser repetido u observado tantas veces como se quiera, y siempre bajo las mismas condiciones. Consideremos cualquier evento asociado a este experiemento. Se cuemplen entonces los siguientes hechos:

Si repetimos u observamos un n´umero grande de veces el experimento, entonces la frecuencia relativa de ocurrencia del evento que estamos estudiando, tiende a estabilizarce sobre un rango de varaci´on peque˜na a mayor n´umero de repeticiones (observaciones).

Si realizamos muchas series de un n´umero grande de repeticiones u observaciones del experimento, entonces esta misma frecuencia relativa en cada serie, tiende a mantenerse aproximadamente constante.

Debemos aclarar que este principio no es “absoluto”, en el sentido de que pueden existir desviaciones emp´ıricas entre distintas series de repeticiones del experimento, aun cuando ello ocurra muy raramente.

2.

Probabilidad frecuentista

Si entendemos laprobabilidadcomo una medida decerteza, es decir, como un n´umero que mide la “facilidad” con que un determinado evento ocurre, entonces la primera interpretaci´on objetiva de probabilidad est´a basada en el principio de regularidad de las frecuencias relativas.

Por ejemplo, en el caso espec´ıfico del primer ejemplo de la secci´on ante-rior, la probabilidad de que en cualquiera de las 600 extracciones se obtenga bola blanca es 0,668, o en t´erminos de porcentajes, del 66.8 %. Note que ´esta es una raz´on cercana a4/6, la cual corresponde exactamente a la proporci´on

de bolas blancas en relaci´on al total de bolas contenidas en la urna.

En cuanto al segundo ejemplo, tenemos que en el primer cuarto del a˜no, la probabilidad de que nazca un ni˜no en este hospital es de 0.516, o bien,

(4)

Generalmente, llamamos esta interpretaci´on de probabilidad como pro-babilidad frecuentista(oemp´ıricao estad´ıstica).

Veamos una situaci´on m´as compleja.

Ejemplo 3: Hacia 1827, el bot´anico escoc´es Robert Brown, descubri´o que las part´ıculas microsc´opicas de polen suspendidas en un l´ıquido en reposo, exhib´ıan un movimiento vibratorio e irregular sin causa aparente. Veraqu´ı una observaci´on real de este movimiento. Aunque ya hab´ıa sido observado y discutido algunos a˜nos antes por Jan Ingenhousz, este fen´omeno se conoce desde las observaciones de Brown comoMovimiento Browniano.

El Movimiento Browniano fue estudiado por cient´ıficos de diversas ´areas en los a˜nos posteriores. Fue Albert Einstein, hacia los primeros a˜nos del siglo XX, quien propuso la explicaci´on de que dicho movimiento se debe a que los ´atomos que forman las particulas de agua, en continuo movimiento por agitaci´on t´ermica, chocan con las part´ıculas de polen. En aquella ´epoca, la teor´ıa at´omica de la materia aun estaba ciernes, y Einstein vio en este fen´omeno la combrobaci´on fehaciente de la existencia de los ´atomos.

El propio Einstein propuso una teor´ıa probabil´ıstica de este fen´omeno. Actualmente, el Movimiento Browniano es quiz´a el fen´omeno aleatorio m´as importante y estudiado en el ´area de probabilidad, debido a la diversidad de fen´omenos que est´an emparentados con ´este, que van desde fen´omenos naturales y biol´ogicos, hasta financieros, econ´omicos y sociales.

Algunos a˜nos despu´es de los estudios de Einstein, el qu´ımico sueco Theo-dor Svedberg (Nobel de qu´ımica en 1926), con el fin de probar algunas de las teor´ıas de Einstein, realiz´o una serie de experimentos consistentes en obser-var el n´umero de particulas de polen suspendidas en una fracci´on peque˜na determinada de todo el volumen de agua en estudio. Comprob´o que dicho n´umero var´ıa (fluct´ua) alej´andose siempre del valor promedio.

Espec´ıficamente, Svedberg realiz´o 518 observaciones, cada una bajo las mismas condiciones iniciales. En 112 casos observ´o que la fracci´on de vo-lumen de agua en estudio, no conten´ıa part´ıculas; en 168 casos hab´ıa una sola part´ıcula; en 130 casos hab´ıa dos; tres part´ıculas en 69 casos; en 32 casos hab´ıa cuatro part´ıculas; cinco part´ıculas en 5 casos; seis en un caso; y finalmente siete en 1 caso. La proporci´on del n´umero de particulas est´a dada entonces por el cuadro de la figura 3 de la p´agina suguiente.

(5)

Figura 3: Tomado deAn elementary introduction.... Gnedenko y Khinchin. pp 5.

Enunciamos as´ı el principio de probabilidad frecuentista.

Probabilidad Frecuentista

Supongamos que podemos repetir u observar un experimentos aleatorio dado cualquier n´umero de veces, y siempre bajo las mismas condiciones. Fijemos nuestro inter´es en alg´un evento asociado con este experimento. Si en un n´umero grande nde repeticiones del experimento, rn representa el n´umero de veces con que ocurre dicho evento espec´ıfico, definimos la probabilidadfrecuentista(oestad´ıstica) de que ocurra el evento en cuesti´on en cualquiera de lasnrepeticiones, como la proporci´on.

rn n.

Seg´un el principio de regularidad de las frecuencias relativas, si tomamos valores de n sucesivamente crecientes, entonces la sucesi´on de cocientes de frecuencias relativasrn/

n, tiende a mantenerse relativamente constante. Por lo que la probabilidad frecuentista es m´as acertada cuanto m´as grande sea el n´umero de repeticiones u observaciones realizadas.

Algunas objeciones:

Desde luego, este modelo es cuestionable al menos desde el punto de vista rigorista de las matem´aticas contempor´aneas. Enlistamos a continuaci´on s´olo dos objeciones.

1. Para un n´umero n espec´ıfico, el cociente rn

(6)

2. Es un modeloa posteriori. Despu´es de repetir u observar muchas veces un evento, cualquier medida de certeza que obtengamos, solo es aplica-ble a esa serie espec´ıfica de repeticiones. Esto es, solo podemos calcular probabilidades una vez que el fen´omeno se ha realizado. Obviamente, matem´aticamente hablando, es preferible un modelo a priori, el cual permita hacerpredicciones(en alg´un sentido) sobre las consecuencias o resultados de un fen´omeno o experimento aleatorio.

3. Se justifica en un principio emp´ırico, sin modelo matem´atico formal. Aunque ciertamente es posible hacer predicciones (en alg´un sentido) sobre las consecuencias o resultados de un fen´omeno o experimento aleatorio. ¿C´omo explicar dentro de un modelo matem´atico te´orico y formal este principio emp´ırico?

Estas cuestiones no son nada triviales, y de hecho se trata del principal problema en el cual se centr´o buena parte de esfuerzos posteriores en el ´area, ocupando los trabajos de probabilistas pioneros como Bernoulli, Laplace, De Moivre y de otros.

3.

Ley de los grandes n´

umeros

Consideremos alg´un evento asociado a un experimento o fen´omeno alea-torio susceptible de repetirse u orservarse cualquier cantidad de veces, siem-pre bajo las mismas condiciones iniciales. Para n repeticiones, sea rn el n´umero de veces en que ocurre dicho evento espec´ıfico. Con el sustento del principio de regularidad de las frecuencias relativas, parece factible suponer que existe alg´un n´umerop [0,1] hipot´etico, tal que para valores grandes de n,

rn n ≈p.

En otras palabras, si nos permitimos hacer un uso un tanto abusivo de la notaci´on, lo que queremos decir es que

l´ım n→∞

rn n =p,

para alg´un pen [0,1]. De alg´un modo, parace cre´ıble asumir que el n´umero p es la “probabilidad real” del evento que nos interesa. Hemos descrito, en t´erminos muy generales, laley de los grandes n´umeros.

Por ejemplo, en el ejemplo 1, ya hemos dicho que la probabilidad (fre-cuentista) de que en cualquiera de las 600 extracciones se obtenga bola blanca es 0,668. Una raz´on cercana a 4/

(7)

a la proporci´on de bolas blancas en relaci´on al total de bolas contenidas en la urna. Podr´ıamos realizar nuevamente 600 repeticiones y ver´ıamos que, aunque la frecuencia relativa exacta difiere de la obtenida en la primera tan-da, es tambi´en cercana a la proporci´on 4/6, de bolas blancas sobre el total

de bolas. De alguna forma, este comportamiento regular de las frecuencias relativas, nos asegura que nuestra medida de “certeza” de que la extracci´on sea bola blanca, es cercana a la proporci´on 4/6.

As´ı, por ejemplo, podemos decir que la probabilidad(a secas) de obtener una bola blanca, extra´ıda al azar de una urna compuesta de cuatro blancas y dos rojas, es4/6. En general, intuir el valor depno es siempre tan sencillo

Referencias

Documento similar

El n´ umero de ecuaciones de restricci´on que deben introducirse por cada tipo de par cinem´atico se deduce f´acilmente por el n´ umero de grados de libertad de movimiento relativo

La distribuci´on de Poisson describe la probabilidad de que ocurra un suceso aleatorio k veces en un intervalo de tiempo fijo si sabemos que este suceso se repite en promedio un

La gr´ afica 4.6 muestra un ejemplo en que un n´ umero de ´epocas fijo permite al algoritmo encontrar una soluci´ on mejor: Se puede observar como limitando el n´ umero de ´epocas

La conclusi´ on fue que para un n´ umero peque˜ no de par´ ametros (del orden de la decena), el m´ etodo simplex es hasta 4 veces m´ as r´ apido, obteniendo unos valores del m´

a) hay un total de 93 compuestos (193 fragmentos) en disposición cabeza- cabeza y un total de 308 compuestos (477 fragmentos) en disposición cabeza-cola que cumplen

As´ı, definimos el ´ındice de una curva φ alrededor de un punto z como el n´ umero de vueltas completas que el camino da alrededor de z.. Las vueltas realizadas en sentido

Si comparamos los resultados se puede observar como los genes con un mayor n´ umero de SNPs en el conjunto de datos son claramente los que m´ as selecciona, pero cabe destacar una

Podemos apreciar una clara relaci´ on, entre el n´ umero de SNPs involucrados en la primer gen de la pareja, es decir, el n´ umero de cis-EQTL que utilizamos como