SISTEMA INFORMATIKOEN
ERRENDIMENDUAREN
EBALUAZIOA
F. Xabier Albizuri - 2018
[email protected]
go.ehu.eus/ii-siee
Gaiak:
1. Atarikoa: probabilitate teoriaren sarrera
2. Diseinu esperimentala eta datu analisia
3. Probabilitate ereduak eta berritze prozesuak
4. Markov kateak
5. Kola sareak eta sistema informatikoen ereduak
6. Simulazioa eta Petri sareak
Ikasliburak:
1. J.Y. Le Boudec. Performance Evaluation of Computer and Communication Systems. EPFL Press, 2010. Web: perfeval.epfl.ch
2. R. Jain. The Art of Computer Systems Performance Analysis. Wiley, 1991.
3. K. Kant. Introduction to Computer System Performance Evaluation. McGraw-Hill, 1992.
4. S.M. Ross. Introduction to Probability Models, 10th ed. Elsevier, 2009.
5. A. Kumar, D. Manjunath, J. Kuri. Communication Networking: an Analytical Approach. Elsevier, 2004.
6. W.J. Stewart. Probability, Markov Chains, Queues, and Simulation. Princeton University Press, 2009.
7. P.J. Fortier, H.E. Michel. Computer Systems Performance Evaluation and Prediction. Elsevier, 2003.
Aldizkariak:
1. IEEE/ACM Transactions on Networking
2. IEEE Transactions on Parallel and Distributed Systems
3. IEEE Transactions on Computers
4. IEEE Transactions on Multimedia
5. IEEE Journal on Selected Areas in Communications
6. IEEE Transactions on Communications
7. Computer Communications
8. Performance Evaluation
Probabilitate teoriaren sarrera
Experimento aleatorio: un experimento cuyo resultado es indeterminado. Espacio muestral: conjunto Ω = {ω} de todos los posibles resultados del experimento.
Evento: un subconjunto A ⊆ Ω del espacio muestral. Se dice que en un experimento aleatorio ha ocurrido el evento A si el resultado ω ∈ A. Algebra de conjuntos: uni´on de eventos, intersecci´on, eventos disjuntos, complemento de un evento.
Ejemplo
Definir un experimento aleatorio, dar su espacio muestral. Especificar un evento.
Probabilitate teoriaren sarrera
Interpretaci´on intuitiva de la probabilidad: frecuncia de un evento al repetir una y otra vez el experimento aleatorio.
Probabilidades en un espacio muestral, definici´on axiom´atica.
Todo evento A tiene una probabilidad P(A) ∈ R, cumpli´endose:
i. 0 ≤ P(A) ≤ 1 y P(Ω) = 1,
ii. para eventos cualquiera A1, A2, . . . disjuntos entre s´ı,
P (S∞
i =1Ai) =
P∞
Probabilitate teoriaren sarrera
De estos dos axiomas se derivan otras propiedades: P(∅) = 0, para eventos A, B disjuntos P(A ∪ B) = P(A) + P(B), para todo evento tenemos P(A) + P(Ac) = 1, si A ⊆ B entonces
P(A) ≤ P(B), para eventos B1, B2, . . . disjuntos que cumplen
S
i =1Bi = Ω entonces dado un evento A cualquiera tenemos
P(A) =P
i =1P(A ∩ Bi)
Espacios muestrales infinitos, Ω = R: probabilidad como medida de Lebesgue. No todo subconjunto de R es medible. (Paradoja en Q.)
Probabilitate teoriaren sarrera
Variables aleatorias
Una variable aleatoria X asigna un valor X (ω) ∈ R a cada muestra ω ∈ Ω.
Una variable aleatoria es discreta si {X (ω) : ω ∈ Ω} es un conjunto finito o infinito numerable.
Usualmente calculamos probabilidades de eventos relativos a variables aleatorias (en particular cuando Ω = R).
Ejemplo
Probabilitate teoriaren sarrera
Dada una variable aleatoria X y b ∈ R, un evento:
{X ≤ b} = {ω : X (ω) ≤ b}
Funci´on de distribuci´on F (x ) de una variable aleatoria X :
F (x ) = P{X ≤ x }
para x ∈ R. La funci´on F (x ) es no decreciente,
l´ımx →∞F (x ) = F (∞) = 1 y l´ımx →−∞F (x ) = F (−∞) = 0
Conocida la funci´on de distribuci´on, calculamos:
Probabilitate teoriaren sarrera
Si X es una variable aleatoria discreta, se define la funci´on de masa de probabilidad:
p(x ) = P {X = x }
para x ∈ R, P
xp(x ) = 1
Si la variable aleatoria X es no discreta y F (x ) es una funci´on derivable, se dice que X es una variable aleatoria continua, siendo f (x ) = F0(x ) la funci´on de densidad de probabilidad. TenemosR f (x) dx = 1 (y P{X = x} = 0)
Ejemplo
Probabilitate teoriaren sarrera
Se denomina distribuci´on de probabilidad de una variable aleatoria X a la especificaci´on de la funci´on de masa de probabilidad si X es discreta o de la densidad de probabilidad si X es continua (en general especificaci´on de la medida de Lebesgue dF (x ) de la variable aleatoria).
A la funci´on de distribuci´on F (x ) tambi´en se le denomina funci´on de distribuci´on acumulativa (CDF en ingl´es), diferenci´andolo del concepto anterior.
Probabilitate teoriaren sarrera
Independencia entre variables aleatorias
Se dice que dos variables aleatorias X e Y definidas sobre el mismo espacio muestral son independientes si para todo A, B ⊆ R:
P {X ∈ A, Y ∈ B} = P {X ∈ A} P {Y ∈ B}
Se generaliza para m´as de dos variables.
Formularemos el concepto de independencia mediante probabilidades condicionadas.
Probabilitate teoriaren sarrera
Probabilidad condicional del evento A dado el evento B:
P(A|B) = P(A ∩ B) P(B)
(Dado un evento B con P(B) > 0 las probabilidades
condicionales P(A|B) proporcionan nuevas probabilidades para los eventos A sobre el espacio muestral Ω.)
Teorema de la probabilidad total: dados uno eventos B1, B2, . . .
disjuntos y que verifican S
iBi = Ω, para cualquier evento A,
P(A) =X
i
Probabilitate teoriaren sarrera
Formulaci´on de la independencia de variables aleatorias:
P {X ∈ A|Y ∈ B} = P {X ∈ A}
Simetr´ıa de la definici´on.
Ejemplo
Probabilitate teoriaren sarrera
Esperanza matem´atica
Esperanza de una variable aleataroia X discreta:
E [X ] = X
x
x P{X = x }
Variable continua con densidad de probabilidad f (x ):
E [X ] = Z ∞
−∞
x f (x ) dx
En general, se escribe E [X ] =R x dF (x) integral de Lebesque respecto de la distribuci´on F (x ) de una variable aleatoria.
Probabilitate teoriaren sarrera
Ejemplo
Esperanza de la variable aleatoria geom´etrica.
Dada una variable aleatoria X y una funci´on g , tenemos una nueva variable aleatoria g (X ), de forma que g (X )(ω) = g (X (ω)). Esperanzas para X discreta y continua:
E [g (X )] =X x g (x )P{X = x } E [g (X )] = Z ∞ −∞ g (x ) f (x ) dx
Probabilitate teoriaren sarrera
Varias variables aleatorias sobre un espacio muestral: medida de probabilidad dF (x , y )
Linearidad de la esperanza: E [aX + bY ] = aE [X ] + bE [Y ]
Varianza de una variable aleatoria:
Var(X ) = E [(X − µ)2]
siendo µ = E [X ]. Tenemos: Var(X ) = E [X2] − (E [X ])2
Propiedad. Si X e Y son independientes, entonces:
Probabilitate teoriaren sarrera
Coeficiente de variaci´on de una variable aleatoria:
CV(X ) = pVar(X ) E [X ]
donde E [X ] > 0.
Demostrar que representa la varianza (su ra´ız cuadrada) normalizada: CV(aX ) = CV(X )
Probabilitate teoriaren sarrera
Esperanza condicionada de la variable aleatoria X dado Y = y :
E [X |Y = y ] =X x x P{X = x |Y = y } E [X |Y = y ] = Z ∞ −∞ x f (x |y ) dx
Medida de probabilidad condicionada dF (x |y )
La esperanza condicionada E [X |Y ] es una variable aleatoria, funci´on de la variable aleatoria Y .
Probabilitate teoriaren sarrera
Propiedad. (a) Para variables aleatorias X e Y :
E [E [X |Y ]] = E [X ]
(b) Para un evento A y una variable aleatoria Y :
E [P(A|Y )] = P(A)
La probabilidad condicionada P(A|Y ) es una variable aleatoria que es funci´on de Y .
Ejemplo
Sarrera
Diseinu esperimentala eta datu analisia
Sistema informatikoen errendimendua ebaluatzeko teknika nagusiak hauek dira:
I Neurketa I Simulazioa
I Modelaketa analitikoa
Neurketan eta simulazioan teknika estatistikoak behar dira esperimentuak diseinatzeko, datuak biltzeko eta datuak analizatzeko.
Oro har, simulazioaren bidez aztertzen dira, analisi matematikoa onartzen ez duten sistema konplexuak.
Sarrera
Diseinu esperimentala eta datu analisia
Neurketa
Sistema errealarekin egiten da esperimentua. Errendimendu parametroak neurtzen dira hardware bidez, software bidez edo metodo hibridoak erabiliz.
Esperimentazioan kontrolatu ezin diren faktoreak izaten dira, ondorioz:
I neurketen analisi estatistikoa egin behar da, I aukeratu behar dira sarrera eta irteera egokiak
Sarrera
Diseinu esperimentala eta datu analisia
Simulazioa
Sistemaren funtzionamendua adierazten duen programa bat lantzen da eta exekutatzen da. Hau egin behar da simulazioan:
I sistemaren funtzionamenduaren eredu formala eraiki, I kargaren adierazpen (eredu) bat zehaztu, edo aztarna
(traza) batez hornitu simulazioaren exekuzioa. Simulazioa egiteko kontu hauek aztertu behar dira:
I modelatu nahi den sisteman begiratuko den xehetasun maila,
I emaitzen analisi estatistikoaren antolaketa, I esperimentuaren diseinua, egingarria izan dadin.
Sarrera
Diseinu esperimentala eta datu analisia
Simulazio teknikak
Gertaera diskretuzko simulazioa: gertaera bat jazotzen den bakoitzean sistemaren egoera eguneratzen da. Simulatzaileak etorkizuneko gertaeren zerrenda erabiltzen du eta zerrenda hau eguneratzen da gertaerak sekuentzialki prozesatuz.
Gertaera diskretuen adibideak: bezero bat itxarote-lerrora iristea, baliabide baten jabe egitea, zerbitzu batekin amaitzea, eta abar.
Ez dira gertaera diskretuzko simulazioak, denbora-parametroa uniformeki diskretizatuz (0, δ, 2δ, 3δ . . . ) egiten diren
Sarrera
Diseinu esperimentala eta datu analisia
Gertaerak honela sailkatzen dira: I barnekoak eta kanpokoak,
I deterministak eta ez-deterministak.
Simulazioan gertaera ez-deterministen sorkuntza egiteko aukerak:
I aztarna bati jarraituz, aurretik sistema erreala neurtu behar da (zerbitzari bat, router bat), xehetasun osoa gordetzen da gertaeren sorkuntzan,
I probabilitate banaketa bati jarraituz (ausazko aldagaiak simulatzen dituzten algoritmoen bidez), honela kargaren edo zerbitzuaren eredu trinkoa eta errepikagarria dugu, parametro aldagarriak izan ohi dituen eredua.
Sarrera
Diseinu esperimentala eta datu analisia
Simulazioaren gertaerak probabilitate banaketa bati jarraituz sortzeko, emandako banaketaren arabera ausazko zenbakiak sortzen dituzten algoritmoak erabili behar dira.
Algoritmo hauek berez deterministak dira, hasierako haziaz (zenbaki bat) hornitu behar dira. Baina itxura estatistiko ausazkoa eskatzen zaio algoritmoari: simulazioan lortzen den histograma begiratzen da, sortzen diren balioen arteko korrelazioa, eta abar.
Datu analisia
Diseinu esperimentala eta datu analisia
Sistema baten errendimendua ebaluatzeko esperimentazioak ezaugarri hauek ditu:
I Sistemaren kargak eta zerbitzuak ez-deterministak izan ohi dira, eta zehaztu ezinezkoak diren faktoreak egon daitezke. Ausazko emaitzak lortzen dira simulazioan. I Errendimendu parametroak estimatzeko hainbat behaketa
Datu analisia
Diseinu esperimentala eta datu analisia
Esperimentazioan egiten diren galderak:
1. Nola estimatu errendimendu parametroaren batez besteko balioa behaketa batzuetatik?
2. Behaketa kopuru handiagoak estimazio fidagarriagoa ematen du?
3. Nola karakterizatuko dugu estimazio errorea behaketa kopuruaren funtzio bezala?
4. Nola egin behar dira esperimentuak errorearen karakterizazioa fidagarria izateko?
Datu analisia
Diseinu esperimentala eta datu analisia
Sistemaren errendimendu parametroa X izango da.
Probabilitate eredu hau dugu oinarrian: X ausazko aldagaia da, F (x ) banaketa funtzioa duena, batezbestekoa s da eta bariantza σ2. Aldagaiaren banaketa ez dugu ezagutzen, beraz
s eta σ2 ere ez. Esperimentazioaren helburua, X aldagaiaren
batezbestekoa s eta bariantza σ2 estimatzea da.
X parametroaren behaketa esperimentalak dira X1, X2, . . . , Xn,
oro har elkarren artean ez-independenteak.
Sistemaren i -garren behaketa da Xi, ausazko aldagai bat: bere
batezbestekoa s da eta bariantza σ2. Hau da, X aldagaiaren banaketa bera du behaketa bakoitzak.
Datu analisia
Diseinu esperimentala eta datu analisia
Hau da s parametroaren, X aldagaiaren batezbestekoaren, estimatzailea: X = 1 n n X i =1 Xi
X ere ausazko aldagaia da.
X estimatzailea alboragabea da:
Datu analisia
Diseinu esperimentala eta datu analisia
X estimatzaile fidagarriagoa da behaketa kopurua handitzen den heinean: Var(X ) = E h X − s2 i = = E 1 n n X i =1 (Xi − s) !2 = = σ 2 n + 2 n2 X i X j >i Cov(Xi, Xj) Frogatu formula
Datu analisia
Diseinu esperimentala eta datu analisia
I Behaketak independenteak badira, hau da,
Cov(Xi, Xj) = 0 edozein behaketa bikoterekin, orduan
bariantza txikiagotzen da behaketa kopurua handituz, Var(X ) → 0, n → ∞.
I Baldintza ahulagoa da beste hau (behaketak
independenteak ez direnean begiratuko genuke): baldin Cov(Xi, Xj) = 0 behaketen tartea gutxienez m denean,
j ≥ i + m, orduan bariantza txikiagotzen da behaketa kopurua handituz, Var(X ) → 0, n → ∞.
Datu analisia
Diseinu esperimentala eta datu analisia
X estimatzailea ausazko aldagaia izanik, esperimentuan
tartezko estimazioa egiten da: X emaitzaren inguruko tarte bat lortzen da, s barruan izango duena probabilitate zehatz
batekin. Tartezko estimazioa egiteko, X aldagaiaren bariantza estimatu behar da.
Lehenik, hau da σ2 parametroaren, X aldagaiaren bariantzaren, estimatzailea: δX2 = 1 n − 1 n X i =1 (Xi − X )2 non X = 1/nP iXi
Datu analisia
Diseinu esperimentala eta datu analisia
Estimatzailearen itxaropena σ2− 2 n(n−1) P i P j >iCov(Xi, Xj)
da, beraz behaketa independenteak ditugunean δX2 estimatzaile alboragabea da, E [δ2
X] = σ2.
X aldagaiaren bariantza σ2/n da behaketa independenteekin, ondorioz hau da X aldagaiaren bariantzaren estimatzailea behaketa independenteak baditugu:
δ2X = δ
2 X
n
Datu analisia
Diseinu esperimentala eta datu analisia
Balio estimatuaren errore marjina, probabilitate zehatz bati dagokiona, kalkulatzeko, X = 1/nP
iXi aldagaiaren
probabilitate banaketa jakin behar dugu. X ausazko aldagaia normalizatuko dugu: Y = (X − s)√n/σ
Limite zentralaren teoremak hau dio: X1, . . . , Xn ausazko
aldagai independenteak badira eta probabilitate banaketa bera badute (edozein banaketa), orduan Y aldagaia N (0, 1)
banaketa normalerantz doa, n → ∞ doanean.
Bestalde, n finiturako eta Y = (X − s)√n/δX idatziz, baldin
X1, . . . , Xn aldagai independenteek N (s, σ) banaketa
normalari jarraitzen badiote, orduan Y aldagaiak t-banaketa estandarrari, n − 1 askatasun gradukoari, jarraitzen dio.
Datu analisia
Diseinu esperimentala eta datu analisia
t-banaketa estandarraren taula
df \ α 0.10 0.05 0.025 1 3.077684 6.313752 12.70620 2 1.885618 2.919986 4.30265 3 1.637744 2.353363 3.18245 4 1.533206 2.131847 2.77645 5 1.475884 2.015048 2.57058 6 1.439756 1.943180 2.44691 7 1.414924 1.894579 2.36462 8 1.396815 1.859548 2.30600 9 1.383029 1.833113 2.26216 10 1.372184 1.812461 2.22814 inf 1.281552 1.644854 1.95996
Datu analisia
Diseinu esperimentala eta datu analisia
df \ α 0.01 0.005 1 31.82052 63.65674 2 6.96456 9.92484 3 4.54070 5.84091 4 3.74695 4.60409 5 3.36493 4.03214 6 3.14267 3.70743 7 2.99795 3.49948 8 2.89646 3.35539 9 2.82144 3.24984 10 2.76377 3.16927 inf 2.32635 2.57583
Datu analisia
Diseinu esperimentala eta datu analisia
Esperimentuetan tartezko estimazioa honela egiten da. Izan bedi x , esperimentuan X estimatzaileak eman duen balioa:
1. konfiantza tartea definitzen da, x ± e
2. konfiantza maila kalkulatuko da,
P = 1 − 2α = Pr(|X − s| < e)
Alderantziz, tartezko estimazioa honela ere egiten dugu: konfiantza maila zehatz bat eskatuz, honi dagokion konfiantza tartea kalkulatuko da. Konfiantza mailaren ohiko balioak: P = 0,90, 0,95, 0,99 (α = 0,05, 0,025, 0,005)
Datu analisia
Diseinu esperimentala eta datu analisia
X aldagaiaren ordez aldagai normalizatua erabiltzen da kalkuluetan: Y = √ n δX (X − s) Horrela: e0 = √ n δX e P = 1 − 2α = Pr(|Y | < e0)
Isatsen probabilitateak dira hauek (banaketa simetrikoarekin): Pr(Y > e0) = Pr(Y < −e0) = α
Datu analisia
Diseinu esperimentala eta datu analisia
Y aldagai normalizatuaren probabilitate banaketa emanik, konfiantza maila bati konfiantza tarte bat dagokio. Konfiantza maila handiagoak eskatzen du konfiantza tartea zabaltzea, eta alderantziz, konfiantza tarte estuagoak konfiantza maila txikiagoa ekartzen du.
Y aldagaiaren banaketa eta bereziki e0 = e√n/δX balioa izanik
n kopuruaren menpekoak, n behaketa kopuru beharrezkoa determinatuko dugu P = 1 − 2α konfiantza mailarako eta ±e konfiantza tarterako, banaketa hauetako baten bidez:
I t-banaketa n − 1 askatasun graduarekin,
I banaketa normal estandarra, n → ∞ doanean (banaketa hau ez dago n kopuruaren menpean, bai ordea e0).
Datu analisia
Diseinu esperimentala eta datu analisia
Urrats hauek egingo ditugu P konfiantza maila (gutxienez) eta ±e konfiantza tartea (gehienez) lortzeko behar adina behaketa eginez:
1. Egin n behaketa (kopuru arbitrarioa hasieran), s eta σ2
estimatu X eta δ2
X kalkulatuz. Konfiantza maila eta tartea
betetzen badira amaitu dugu, bestela jarraitu.
2. Determinatu n behaketa kopuru berria (handiagoa) konfiantza maila eta tartea betetzeko aurreko estimazioak erabiliz. Joan lehenengo urratsera, behaketa gehigarriak egin eta estimazio berriak kalkulatu.
Honela lortuko dugu X parametroaren batezbestekoaren x estimazioa, P konfiantza mailarekin ±e tartean.
Datu analisia
Diseinu esperimentala eta datu analisia
Adibidea
Errendimendu parametro bat estimatzeko bost behaketa esperimental egin dira, balio hauek bilduz: 3,07, 3,24, 3,14, 3,11, 3,07
1. Kalkulatu konfiantza maila ±0,1 tarterako.
2. Konfiantza tarte horrekin, determinatu behaketa kopuru beharrezkoa konfiantza maila 99 % baino handiagoa izateko.
Datu analisia
Diseinu esperimentala eta datu analisia
Parametro bat (X aldagaiaren batezbestekoa) estimatzeko gogoratu:
I Xi behaketak independenteak izan behar dira, baldintza
honek garrantzia du,
I behaketa kopurua oso handia denean, estimatzaileari dagokion Y aldagai normalizatuarekin banaketa normala erabiliko genuke (limite zentralaren teorema), baina oro har t-banaketa erabiliko dugu (Xi behaketek banaketa
normala dutela suposatuz).
Puntu gehigarria litzateke X aldagaiaren bariantzaren estimazioan dugun konfiantza tartea eta maila aztertzea.
Datu analisia
Diseinu esperimentala eta datu analisia
Bariantza gutxitzeko teknikak bariantza gutxitzeko erabiltzen dira behaketa kopurua finkaturik. Teknika hauekin estimazio hobea lortzen da, edo bestela kostu txikiagoa duen
esperimentua egin daiteke. Kontrol aldagaiaren metodoa aztertuko dugu. Izan bitez X eta Y sistema baten
esperimentazioan behatzen diren ausazko aldagaiak, estimatu behar den parametroa s = E [X ] da. Kontrol aldagaia hau da, non ν = E [Y ]:
Xc = X − a (Y − ν)
Frogatu E [Xc] = E [X ] = s dela.
Xc adagaiaren behaketak erabiliko ditugu s parametroa
estimatzeko baldin Var(Xc) < Var(X ) betetzen bada a
Datu analisia
Diseinu esperimentala eta datu analisia
Propietatea. Xc aldagaiaren bariantza a = Cov(X , Y )/Var(Y )
koefizienteak minimizatzen du eta bariantzaren minimoa Var(Xc) = (1 − ρ2XY) Var(X ) da, non X eta Y aldagaien
korrelazio koefizientea den ρXY. Beraz X eta Y
independenteak ez badira (0 < |ρ| ≤ 1), Var(Xc) < Var(X ).
Frogatu
Normalean Cov(X , Y ) esperimentalki estimatuko dugu, X eta Y aldagaien behaketak erabiliz. Ondoren Xc kontrol
aldagaiaren balioak lortuko ditugu, s batezbestekoaren eta bariantzaren estimazioak kalkulatuz, hortik tartezko estimazioa dugu. Arazoa Cov(X , Y ) parametroaren estimazioarekin: E [Xc,i] = s da? Xc,i behaketak independenteak dira?
Azkenik, ν = E [Y ] eta Var(Y ) ezezagunak izanez gero, beste esperimentu batekin estimatuko genituzke.
Esperimentu edo simulazioen antolaketa
Diseinu esperimentala eta datu analisia
Errendimendu parametroetan mota hauek bereiziko ditugu: I (A) Simulazio edo esperimentu batek, ausazko osagaia
izan dezakeen X parametroaren balio bakarra ematen du, ondo definitua. Adibideak: programa baten exekuzio denbora konputagailu batean, web leku baten atzipen denbora.
I (B) Balio batzuen sekuentzia ematen duen simulazioa edo esperimentua egin behar da, oro har elkarren artean independenteak izango ez diren behaketa batzuk, hauen batezbestekoarekin estimatuko da X . Adibidea: switch baten buffer-eko pakete kopurua. Nola antolatu simulazioa edo esperimentua, lortzen diren X1, . . . , Xn
Esperimentu edo simulazioen antolaketa
Diseinu esperimentala eta datu analisia
Errepika independenteen metodoa
Hemen n simulazio edo esperimentu independente egiten dira.
(A) motako parametroekin erabiltzeko metodoa da.
Simulazio bakoitzean hazia aldatu behar da era egoki batean (adibidez erloju batekin) ausazko zenbakiak sortzeko, edo beste aukera da simulazioetako ausazko zenbaki guztiak elkarren segidan sortzea.
Esperimentu edo simulazioen antolaketa
Diseinu esperimentala eta datu analisia
Exekuzio bakarraren metodoa
(B) motako parametroekin erabiltzen da.
Simulazio (edo esperimentu) bakarra exekutatzen da, m × n luzerakoa, n sorta edo tartez osatutakoa, bakoitza m
tamainakoa. Simulazioan egiten diren behaketak honela antolatzen dira:
X11, . . . , X1m, . . . , Xi 1, . . . , Xim, . . . , Xn1, . . . , Xnm
Xi = 1/mPmj =1Xij definitzen da, i . sortako m behaketen
batezbestekoa, i = 1, . . . , n sortetan.
Esperimentu edo simulazioen antolaketa
Diseinu esperimentala eta datu analisia
X aldagaiaren Xt, t = 1, . . . , u, behaketa sekuentzia emanik, k
periodoko autokobariantza honela definitzen da:
R(k) = 1 u − k u−k X t=1 (Xt− X )(Xt+k − X )
Eta autokorrelazio koefizientea da R(k)/R(0) zatidura. (R(0), X aldagaiaren bariantzaren estimatzaile alboratua da) Baldintza hau betetzen bada:
|R(k)/R(0)| 1
Xt eta Xs behaketa independentetzat hartzen dira |t − s| ≥ k
Esperimentu edo simulazioen antolaketa
Diseinu esperimentala eta datu analisia
X aldagaiaren simulazioan Xij behaketak antolatuz m
tamainako n sorta edo tartetan, guztira m × n behaketa, eta i = 1, . . . , n sorta bakoitzean Xi = 1/m
Pm
j =1Xij
batezbestekoa hartuz, Xi sekuentzia berri honen
autokobariantza hau da:
R(1) = 1 n − 1 n−1 X i =1 (Xi − X )(Xi +1 − X ) non X = 1/nPn i =1Xi
Eta autokorrelazio koefizientea:
Esperimentu edo simulazioen antolaketa
Diseinu esperimentala eta datu analisia
Behaketa independenteen hipotesia egingo dugu baldintza hau betetzen denean:
|R(1)/R(0)| 1
Adibidez |R(1)/R(0)| < 0,02 bada. Behaketa independenteak lortzeko m handia aukeratuko dugu. Balio ohikoak dira hauek: n ∝ 10, m ∝ 100.
Metodo honek bi aldaera ditu:
I NB (nonoverlapping batch), teilakatu gabeko sortak, goian azaldu den bezala.
I OB (overlapping batch), sorta teilakatuak. Behaketak sorta teilakatutan antolatzeko aukera desberdinak daude. Metodo eraginkorragoa izan daiteke.
Esperimentu edo simulazioen antolaketa
Diseinu esperimentala eta datu analisia
Metodo birsortzaileak
Prozesu estokastiko bat dugu: {X (t); t ≥ 0} sekuentzia non X (t) sistema jakin baten egoera den, denbora-parametroaren funtzioa den ausazko aldagaia (denbora jarraitua da, bestalde X aldagaiak ez dauka sistema osoa deskribatu beharrik).
Prozesua birsortzailea da baldin existitzen bada berritze egoera bat non sistema probabilistikoki berritzen den behin eta berriz.
Zikloa deitzen zaio prozesuaren gauzatzeari ondoz ondoko bi berritzeren artean. Zikloaren iraupenak itxaropen finitua izango du eta berritzeak amaiera gabe gertatuko dira.
Esperimentu edo simulazioen antolaketa
Diseinu esperimentala eta datu analisia
Errendimendu parametroaren balioa, ziklo batean X (t) aldagaiaren batezbestekoak duen itxaropena da. Ziklo guztietan itxaropen bera dugu, berritze prozesua denez.
Errendimendu parametroa esperimentalki estimatzen denean, zikloetan Xij behaketak biltzen dira (tamaina desberdineko
sortak oro har), ziklo bakoitzean Xi batezbestekoa kalkulatuz,
i = 1, . . . , n. Prozesu birsortzaile baten esperimentazioan Xi
aldagaiak independenteak dira.
Sistema konplexuetan oro har ziklo luzeak ditugu, egoerak sistema osoa deskribatzen badu, eta metodo birsortzailea ezinezkoa izan daiteke.
Selecci´
on de entradas: dise˜
nos factoriales
Diseinu esperimentala eta datu analisia
Estudio del efecto conjunto en el rendimiento de un sistema de los distintos par´ametros o factores de entrada (inputs)
multivaluados: k entradas controlables, cada uno con n valores diferentes.
Se dise˜na un experimento factorial: realizar las nk combinaciones posibles del experimento. Puede ser impracticable.
Modos de simplificar la experimentaci´on:
I mantener constantes los factores menos importantes, I considerar independientes factores que interaccionan
Selecci´
on de entradas: dise˜
nos factoriales
Diseinu esperimentala eta datu analisia
Selecci´on de factores importantes
Asignar dos valores a cada factor: 0 bajo (m´ınimo), 1 alto (m´aximo). Vector de factores:
c = (c1, . . . , ck)
donde cada ci ∈ {0, 1}
X (c) valor del par´ametro de rendimiento para un vector de entrada c.
Selecci´
on de entradas: dise˜
nos factoriales
Diseinu esperimentala eta datu analisia
Efecto principal o de primer orden del factor i -´esimo:
ei = 1 2k−1 " X c : ci=1 X (c) − X c : ci=0 X (c) #
Hip´otesis de monotonicidad, del mismo signo, de X (c) funci´on de ci, para todo c.
Valor promedio del rendimiento:
X = 1 2k
X
c
Selecci´
on de entradas: dise˜
nos factoriales
Diseinu esperimentala eta datu analisia
Si |ei| X el factor i -´esimo no es importante. Se fija para la
entrada i -´esima un valor intermedio entre el m´ınimo y el m´aximo establecidos para el dise˜no factorial 2k.
Si ei es significativo frente a X la entrada i -´esima es un factor
importante.
Se definir´a un dise˜no factorial seleccionando los factores importantes.
Selecci´
on de entradas: dise˜
nos factoriales
Diseinu esperimentala eta datu analisia
Interacci´on entre factores importantes
Efecto de primer orden del factor i -´esimo fijando el factor j con un valor x ∈ {0, 1}: eij(x ) = 1 2k−2 X c : ci=1,cj=x X (c) − X c : ci=0,cj=x X (c)
Efecto de orden superior, interacci´on entre los factores i y j :
eij =
eij(1) − eij(0) 2 = eji
Selecci´
on de entradas: dise˜
nos factoriales
Diseinu esperimentala eta datu analisia
Si |eij| X : interacci´on d´ebil entre factores i y j , factores
independientes.
Si eij significativo frente a X : factores dependientes.
Criterios en el dise˜no experimental
I Para cada factor importante que no interacciona con otros factores importantes: estudiar el rendimiento para sus n valores, fijando valores intermedios para los otros factores. I Para p factores importantes que interaccionan entre si:
experimentar con np combinaciones siendo n los valores
Selecci´
on de entradas: dise˜
nos factoriales
Diseinu esperimentala eta datu analisia
Dise˜no factorial fraccional
Se eliminan algunas de las 2k combinaciones iniciales de
factores. Se sigue con el estudio de factores principales y sus interacciones.
Selecci´
on del sistema ´
optimo
Diseinu esperimentala eta datu analisia
Problema de optimizaci´on: de un conjunto de sistemas, seleccionar un sistema de acuerdo con un criterio de rendimiento, usualmente minimizando o maximizando un par´ametro de rendimiento (o una funci´on de varios).
Soluci´on trivial con estimaciones no aleatorias de los par´ametros de rendimiento.
Formulaci´on estad´ıstica del problema de optimizaci´on para estimaciones estad´ısticas de los par´ametros.
Erregresio analisia
Diseinu esperimentala eta datu analisia
Sistemaren errendimendua aztertzen denean, sarrera parametro kontrolagarriak bi motakoak izaten dira:
I kualitatiboak, I kuantitatboak.
Sarrera kuantitatiboekin interesgarria da interpolazio eta estrapolazio teknikak erabiltzea errendimendu parametroen estimazioan.
Erregresio analisia
Diseinu esperimentala eta datu analisia
Formulazio orokorra
Izan bedi Y errendimendu parametroa, sistema baten irteera, ausazko aldagaia (jarraitua) izango da eta x sarreraren (aldagai errealaren) funtzioa, bere batezbestekoa izanik y = f (x ).
Hipotesia: f funtzioa ezaguna da baina ez bere α1, . . . , αk
parametroen balioak,
y = f (x ; α1, . . . , αk)
Sarreraren balio batzuk x1, . . . , xn emanik, irteeraren
Y1, . . . , Yn behaketak egingo ditugu: x -en gaineko y -ren
erregresioa kalkulatzeko problema, esperimentuaren emaitzetatik α1, . . . , αk parametroak estimatzea da.
Erregresio analisia
Diseinu esperimentala eta datu analisia
Behaketek ausazko errorea dute (ezezaguna), εi = Yi − f (xi).
Ondorengo metodoan begiratuko dugu behaketaren eta estimazioaren arteko errorea, Yi − ˆf (xi).
Karratu txikienen metodoa: minimizatu errore koadratikoen batura f funtzioko parametroen ˆα1, . . . , ˆαk estimazioekin,
QE = n X i =1 h Yi − ˆf (xi) i2
Y1, . . . , Yn behatu diren irteera balioak dira, eta
ˆ
f (x1), . . . , ˆf (xn) balioak, f (x ; ˆα1, . . . , ˆαk) funtzioarekin
estimatu diren irteera balioak, x1, . . . , xn sarrera balioetarako.
QE minimizatzen duten ˆα1, . . . , ˆαk estimazioekin dugu x -en
Erregresio analisia
Diseinu esperimentala eta datu analisia
Gauss-Markov-en teorema
Karratu txikienen metodoak ematen dituen ˆα1, . . . , ˆαk
estimatzaileak alboragabeak dira eta bariantza minimoa dute baldintza hauek betetzen badira:
1. f (x ) linela da α1, . . . , αk parametroetan,
f (x ) = α1g1(x ) + . . . + αkgk(x )
2. Behatu diren Yi balioen erroreek ez dute alborapenik, hau
da, E [εi] = 0
Erregresio analisia
Diseinu esperimentala eta datu analisia
Beraz, teoremaren baldintzak betetzen badira, karratu txikienen metodoa erabiliz:
I Estimatzaileak alboragabeak dira, hau da, E [ ˆαi] = αi.
I Var( ˆαi) bariantza minimoa da, parametroak estimatzeko
erabil litezkeen metodo guztien artean.
Esango dugu karratu txikienen metodoa hoberena dela f (x ) funtzioaren parametroak estimatzeko, funtzioa α1, . . . , αk
Erregresio analisia
Diseinu esperimentala eta datu analisia
QE funtzioa, ˆαj estimatzaileen funtzio ganbila da. Bere
minimo globala kalkulatuko dugu, ˆαj, j = 1, . . . , k,
aldagaietarako deribatu eta zeroarekin berdinduz:
n
X
i =1
gj(xi) [Yi − ˆα1g1(xi) − . . . − ˆαkgk(xi)] = 0
Ekuazio sistemaren adierazpen matriziala:
Π ˆα = θ
Π matrizeak k × k tamaina du, θ bektorea da (zutabe bektorea), eta ˆα ekuazio sistemako ezezagunen bektorea.
Erregresio analisia
Diseinu esperimentala eta datu analisia
Adibidea
Funtzio honekin, x -en gaineko y -ren erregresioa kalkulatu:
f (x ) = α1+ α2x + α3x2
Sarrera jakin batzuk emanik, xi, i = 1, . . . , n, hauei dagozkien
Yi behaketak bildurik, deduzitu ˆα1, ˆα2, ˆα3 estimatzaileen
Erregresio analisia
Diseinu esperimentala eta datu analisia
Erregresio lineala
Orain Y irteera aldagaiaren y batezbestekoa x sarreraren funtzio lineala da:
y = α + β x
QE errore koadratikoa, α eta β parametroen estimatzaileen
funtzio ganbila, minimizatuz:
ˆ β = n X i =1 (xi − x) Yi / n X i =1 (xi − x)2 ˆ α = Y − ˆβ x non x =Pn i =1xi/n, Y = Pn i =1Yi/n
Erregresio analisia
Diseinu esperimentala eta datu analisia
Y aldagaiaren y = α + βx batezbestekoaren estimatzailea hau da:
ˆ
Y = ˆα + ˆβ x = Y + ˆβ (x − x ) ˆ
Y estimatzailearen bariantza aztertuko dugu. Y eta ˆβ ausazko aldagai independenteak dira, beraz:
Var( ˆY ) = Var(Y ) + (x − x )2Var( ˆβ)
Y1, . . . , Yn behaketak independenteak izanik, hau deduzitzen
da: Var( ˆY ) = σ2 1 n + (x − x )2 Pn i =1(xi − x)2
Erregresio analisia
Diseinu esperimentala eta datu analisia
Var( ˆY ) bariantza x -en funtzioa da, honelakoa: bere balio minimoa σ2/n da, sarrera x = x denean, n-rekin txikiagotuz
doa, gehikuntza koadratikoa du |x − x | > 0 denean. Y aldagaiaren eta honen behaketen σ2 bariantzaren estimatzaile alboragabea hau da:
δ2 = 1 n − 2 n X i =1 (Yi − ˆYi)2 = QE n − 2
non ˆYi = ˆf (xi) = ˆα + ˆβxi. Eta Var( ˆY ) estimatzeko:
ν2 = δ2 1 n + (x − x )2 Pn i =1(xi − x)2
Erregresio analisia
Diseinu esperimentala eta datu analisia
Behaketa esperimentalak egin ondoren, sarrera konkretu bat x emanik (ez du izan behar behaketetako xi bat), irteeraren
(batezbestekoaren) estimazioa ˆY = ˆα + ˆβx da eta honen konfiantza tartea eta maila lortu nahi ditugu.
Konfiantza tartea eta maila kalkulatzeko orain ( ˆY − y )/ν aldagai normalizatua hartuko dugu, non x finkatuta dagoen. Hemen y = f (x ) = α + βx dugu eta ˆY -ren desbiderapen estandarraren estimazioa da ν, emandako x -erako.
Aldagai normalizatu honek t-banaketa du, n − 2 askatasun gradukoa. (Hipotesia: Yi − f (xi) behaketa erroreek banaketa
normala dute.)
Erregresio analisia
Diseinu esperimentala eta datu analisia
Eredu orokorraren egokitasuna
Irizpide erraz bat dugu, x -en gaineko y -ren erregresioan, y = f (x ; α1, . . . , αk) ereduaren egokitasuna kuantifikatzeko.
Lehenik, batezbestekoaren inguruko aldakuntza totala:
QT = n
X
i =1
(Yi − Y )2
Errore koadratikoaren minimoa:
QE = n
X
i =1
Erregresio analisia
Diseinu esperimentala eta datu analisia
Hau da irizpidea:
QE/ QT → 0
Errorearen jatorriak hauek izaten dira:
I neurketan akats handiak egitea, neurketa kopuru txikiegia hartzea,
I eredu desegokia erabiltzea, gehiegizko sinplifikazioak egitea eredua definitzeko hipotesietan.
Bestalde, irizpide honekin kontuan izan behar da gehiegizko doikuntzaren arazoa (overfitting).
Erregresio analisia
Diseinu esperimentala eta datu analisia
Zenbait kontu
Erregresio funtzioren linealizazioa aztertuko dugu, erregresio funtzioa parametroetan lineala ez denean.
Adibidea: f (x ) = aebx funtzioa linealizatu logaritmoa hartuz.
Karratu txikienen metodoarekin, Gauss-Markov-en teoremaren hipotesian, behatutako g (Yi) balio berrien ausazko errorean ez
dago alborapenik?
Erregresio analisia
Diseinu esperimentala eta datu analisia
Adibidea
Aztertuko dugu zerbitzari baten erantzun-denbora, bezero aktiboen kopuruaren funtzio bezala. Taulako datu
esperimentalekin y = axb ereduaren parametroak estimatu.
Lortu bezero kopuruaren maximoa, erantzun-denbora izan dadin 3 segundo baino txikiagoa ehuneko 95aren konfiantza mailarekin.
x 2 4 6 8 10 12
y 0,09 0,25 0,45 0,60 0,85 1,45 x 14 16 18 20 22 y 1,80 2,15 2,55 3,00 3,40
Erregresio analisia
Diseinu esperimentala eta datu analisia
Erregresio anizkoitza
y = f (u, v , w , . . . ; α1, α2, . . .)
Karratu txikienak, Gauss-Markov teorema.
Eredua konplexuagoa egiten da. Behar den behaketa kopurua oso handia da.
Sarrera
Probabilitate ereduak eta berritze prozesuak
Konputagailu sistema eta komunikazio sareetarako eredu probabilistikoek bi oinarri hauek dituzte:
I Berritze teoria: prozesu birsortzaileak. I Markov kateak.
Sistemak analizatu eta errendimendua ebaluatzeko bidea eskaintzen dute eredu hauek.
Eredu esponentzialek, hauen oroimengabetasunak, analisi matematikoa errazten du.
Sarrera
Probabilitate ereduak eta berritze prozesuak
Adibidea. IQ pakete-kommutagailurako (Input-Queueing Packet Switch) eredu probabilistikoa:
Input Output i2 j3 g2 h2 d1 e1 f1 a1 b3 c4 × × × × × c × × × j b × g h i × × × d e a f × × 4 3 2 1 4 3 2 1 4 × 4 Switch T = 0 6 5 4 3 2 1 Time
Sarrera
Probabilitate ereduak eta berritze prozesuak
Eredu hau Markov kate bat da eta egoeren limiteko
probabilitateak kalkulatzen dira. Kommutagailuaren erabilera, sarrera/irteera kopuruaren arabera:
N Erabilera 1 1,00 2 0,75 3 0,68 4 0,65
Analisi asintotikoa eginez frogatzen da erabilera 2 −√2 = 0,59 limiterantz doala N → ∞ badoa.
Eredu esponentzialak
Probabilitate ereduak eta berritze prozesuak
Izan bedi X ausazko aldagaia, balioak [0, ∞) tartean hartuz banaketa funtzio hau duena:
F (x ) = 1 − e−λx
Banaketa esponentziala deitzen zaio, λ > 0 parametroduna. X ausazko aldagai jarraitua da, deribatuz probabilitate dentsitatea dugu: f (x ) = λe−λx
Frogatu ondorengoa: E [X ] = 1 λ Var(X ) = 1 λ2 CV(X ) = 1
Eredu esponentzialak
Probabilitate ereduak eta berritze prozesuak
Esango dugu X ausazko aldagaia oroimengabea dela baldin edozein s, t ≥ 0 baliorako:
P{X > s + t | X > s} = P{X > t}
Oroimengabetasunaren interpretazioa.
Frogatu formulazio baliokidea dela hau:
P{X > s + t} = P{X > s} · P{X > t}
Propietatea. Banaketa esponetziala duen ausazko aldagaia oroimengabea da.
Eredu esponentzialak
Probabilitate ereduak eta berritze prozesuak
Ausazko aldagai oroimengabeak:
I banaketa esponentziala (aldagai jarraitua) I banaketa geometrikoa (aldagai diskretua)
Adibidea
Aldagai oroimengabe bati dagozkion probabilitate batzuk kalkulatu.
Eredu esponentzialak
Probabilitate ereduak eta berritze prozesuak
X1 eta X2 ausazko aldagaien minimoa definituko dugu:
X = min(X1, X2)
X (ω) = min{X1(ω), X2(ω)} izango da edozein ω laginerako.
Propietatea. X1 eta X2 ausazko aldagai esponentzialak badira,
λ1 eta λ2 parametrodunak hurrenez hurren, eta aldagai
independenteak badira, orduan X = min(X1, X2) ausazko
aldagaia esponentziala da eta λ1 + λ2 parametroa du.
Eredu esponentzialak
Probabilitate ereduak eta berritze prozesuak
Beraz, X1 eta X2 esponentzialak eta independenteak badira,
minimoaren itxaropena, X = min(X1, X2) ausazko aldagaiaren
itxaropena, hau da:
E [X ] = 1 λ1+ λ2
Eredu esponentzialak
Probabilitate ereduak eta berritze prozesuak
Propietatea. X1 eta X2 ausazko aldagai esponentzialak badira,
λ1 eta λ2 parametrodunak, eta aldagai independenteak badira,
orduan: P{X1 < X2} = λ1 λ1+ λ2 Antzera, P{X2 < X1} = λ2/(λ1 + λ2) Frogatu Adibidea
Eredu esponentzialak
Probabilitate ereduak eta berritze prozesuak
Erlang-en n etapako banaketa adarkatua
Izan bitez X1, X2,. . . ,Xn ausazko aldagai esponentzialak eta
independenteak. X ausazko aldagaia definituko dugu:
X = X1 p = q1 probabilitatearekin X1+ X2 p = (1 − q1)q2 probabilitatearekin · · · · X1+ . . . + Xn p = (1 − q1) . . . (1 − qn−1)
Adierazi banaketa honen definizioa grafiko baten bidez. Banaketa esponentziala orokortzen du, CV(X ) 6= 1 duten ausazko aldagaietarako. Ez da banaketa esponentziala baina eredu markovtarrak definitzeko aukera ematen du etapak kontsideratuz.
Eredu esponentzialak
Probabilitate ereduak eta berritze prozesuak
Propietatea. Edozein aldakuntza koefiziente emanik, CV ≥ 1/√n, non n osokoren bat den, orduan existitzen da Erlang-en n etapako banaketa adarkatua CV(X ) = CV izanik. Bereziki, λ1 = . . . = λn = λ eta q1 = . . . = qn−1 = 0 hartuz,
orduan CV(X ) = 1/√n dugu. Frogatu
Adibidea
Aztertu ausazko aldagai hipo-esponentzialak, CV(X ) < 1, eta hiper-esponentzialak, CV(X ) > 1.
Berritze prozesuak
Probabilitate ereduak eta berritze prozesuak
Berritze prozesua deitzen zaio X1, X2, . . . ausazko aldagai
ez-negatiboen sekuentziari, baldin independenteak badira eta probabilitate banaketa bera badute. Aldagai hauen itxaropen komuna adieraziko dugu m = E [Xn] idatziz, n = 1, 2, . . ., eta
0 < m < ∞ izango da. Berritze arteko denborak bezala interpretatuko ditugu: Xn ausazko aldagaia, (n − 1)-garren
berritzetik n-garren berritzea arte igaro den denbora da. Berritze denborak ere definituko ditugu:
Tn= n X i =1 Xi , n = 1, 2, . . . Adibidea
Berritze prozesuak
Probabilitate ereduak eta berritze prozesuak
N(t) ausazko aldagaia definituko dugu t ≥ 0 bakoitzerako, t denbora arte izandako berritzeen kopurua bezala: N(t) = n baldin Tn ≤ t < Tn+1 (hasieran N(t) = 0 da, t < T1).
Propietatea. Berritze prozesuan (limite hau existitzen da):
limt→∞
N(t) t =
1 m
Definizioz, berritze tasa da 1/m, denbora unitateko berritze kopurua, m = E [Xn] izanik.
Berritze prozesuak
Probabilitate ereduak eta berritze prozesuak
Prozesu estokastikoa, ausazko gertaera diskretuen denborazko sekuentzia litzateke.
Formalki, prozesu estokastikoa definitzen da lagin espazio baten gaineko ausazko aldagaien bilduma bezala:
I {X (t), t ≥ 0} denbora jarraituko prozesu estokastikoaren denbora parametroak balio errealak hartzen ditu,
t ∈ R, ∀t ≥ 0
I {Xn, n = 0, 1, . . .} denbora diskretuko prozesu
estokastikoaren denbora indizeak osoko balioak hartzen ditu, n ∈ Z, ∀n ≥ 0
Esango dugu, hurrenez hurren, prozesu estokastikoa X (t) egoeran dela t denboran edo Xn egoeran dela n denboran.
Berritze prozesuak
Probabilitate ereduak eta berritze prozesuak
Denbora jarraituko prozesu estokastiko mota bat kontaketa prozesua da, {N(t), t ≥ 0}, non N(t) aldagaia, t denbora arte izan diren gertaeren kopurua den.
Kontaketa prozesuan, gertaeren arteko denborek berritze prozesua definitzen dute baldin independenteak badira eta probabilitate banaketa bera badute (berritzeak lirateke gertaerak).
Adibidea
Poisson prozesuak
Probabilitate ereduak eta berritze prozesuak
Poisson prozesua deitzen zaio {N(t), t ≥ 0} kontaketa prozesuari baldin etorrera (gertaera) arteko denborak
esponetzialak badira eta berritze prozesua definitzen badute.
X1, X2, . . . aldagaien itxaropen komuna m = 1/λ bezala
idazten da, non λ etorrera tasa (berritze tasa) den, hori da etorrera arteko denbora esponetzialen parametroa.
Esango dugu Poisson prozesua oroimengabea dela: s unea emanik, hurrengo etorrera arte igaroko den X denbora
(banaketa esponetziala du λ parametrokoa) independentea da {N(t), 0 ≤ t ≤ s} aldagai bildumatik, s unearen aurreko historiatik.
Poisson prozesuak
Probabilitate ereduak eta berritze prozesuak
Poisson prozesuaren oroimengabetasunaren ondorioak dira bi propietate hauek.
I Gehikuntza independenteak: bi tarte disjuntu hartuz, t1 < t2 ≤ t3 < t4, orduan N(t2) − N(t1) eta
N(t4) − N(t3) etorrera kopuruak ausazko aldagai
independenteak dira.
I Gehikuntza geldikorrak: N(s + t) − N(s) etorrera kopuruaren probabilitate banaketa ez dago s denboraren menpean, inbariantea da denbora tartea desplazatuz, banaketa soilik tartearen iraupenaren (t) funtzioa da.
Adibidea
Kontaketa prozesuetan aztertu gehikuntzak independenteak eta geldikorrak diren.
Poisson prozesuak
Probabilitate ereduak eta berritze prozesuak
Propietatea. Izan bedi {N(t), t ≥ 0} Poisson prozesua, λ etorrera tasa duena. Hau da t iraupeneko denbora tartean etorrera kopurua k = 0, 1, 2, . . . izateko probabilitatea:
P{N(s + t) − N(s) = k} = P{N(t) = k} = e
−λt(λt)k
k!
N(s + t) − N(s) ausazko aldagaiaren itxaropena eta bariantza (gehikuntza geldikorrak ditugu) hauek dira:
E [N(t)] = λt
(bagenekien limt→∞N(t)/t = λ dela)
Poisson prozesuak
Probabilitate ereduak eta berritze prozesuak
Adibidea
Poisson prozesu batean probabilitateak kalkulatu.
Poisson prozesuan X1, X2, . . . etorrera arteko denborak ausazko
aldagai independenteak dira eta λ (etorrera tasa) parametroko banaketa esponentziala dute. Bestalde, hau da n-garren etorrera denbora:
Tn= X1+ X2+ . . . + Xn
Lehenik, T1, T2, . . . etorrera denborak ez dira ausazko aldagai
Poisson prozesuak
Probabilitate ereduak eta berritze prozesuak
Tn etorrera denborak Erlang-en n etapako banaketa du:
Erlang-en banaketa adarkatu gabea, etapa guztiak parametro berdinarekin. Hauek dira beraz batezbestekoa eta bariantza:
E [Tn] = n λ Var(Tn) = n λ2 Adibidea
Prozesu birsortzaileak
Probabilitate ereduak eta berritze prozesuak
{X (t), t ≥ 0} denbora jarraituko prozesu estokastikoa,
prozesu birsortzailea dela esaten da baldin berritze prozesu bat badu elkartuta non berritze bakoitzarekin prozesu
estokastikoak aurrera jarraitzen duen hasieratik abiatuko balitz bezala, hau da, hasieran eta berritze bakoitzean, T0, T1, T2. . .
denboretan, {X (t), t ≥ s | Tn = s} ondorengo prozesuak
probabilitate egitura bera du, aurreko historiatik
independentea dena. Ondoz ondoko bi berritzek prozesu birsortzailearen zikloa mugatzen dute.
Adibidea
Prozesu birsortzaileak
Probabilitate ereduak eta berritze prozesuak
Denbora jarraituko prozesu estokastikoan, j egoera bakoitzerako, proportzio hauek definituko ditugu:
I prozesua j egoeran dagoen denbora proportzioa, T denbora batean, hau da, T (j )/T zatikia, non T (j ), prozesua hasieratik T arte j egoeran egon den denbora totala den,
I prozesua j egoeran izateko probabilitatea, t une jakin batean, P{X (t) = j } bezala adieraziko duguna.
Propietatea. Baldin {X (t), t ≥ 0} prozesu birsortzailea bada eta berritze arteko denborak ausazko aldagai jarraituak badira, orduan, edozein j egoerarako, existitzen dira eta berdinak dira, egoeraren denbora proportzioa eta probabilitatea, denboraren limitean:
Prozesu birsortzaileak
Probabilitate ereduak eta berritze prozesuak
Pj = limt→∞P{X (t) = j } = limT →∞T (j )/T
Egoeren limiteko probabilitateak balantza ekuazioen bidez kalkulatzen dira.
Esango dugu s unean i egoeratik j egoerarako trantsizioa gertatu dela baldin X (s − ) = i bada, → 0, eta X (s) = j ; esango dugu gainera j egoerarako bisita gertatu dela.
T denbora baterako, kalkulatuko ditugu ni →j/T trantsizio
tasa eta ni/T bisita tasa. Prozesu birsortzailean existitzen dira
Prozesu birsortzaileak
Probabilitate ereduak eta berritze prozesuak
Hauek dira prozesu birsortzailearen balantza ekuazioak:
j egoerarako bisita tasa = = P
i i egoeratik j egoerarako trantsizio tasa
j egoera bakoitzerako.
Ekuazio hauetatik lortuko ditugu egoeren Pj probabilitateak
Etorrerak dituen sistema birsortzailea
Probabilitate ereduak eta berritze prozesuak
Izan bedi {N(t), t ≥ 0} kontaketa prozesua, R1, R2, . . . sari
sekuentziari elkartutakoa: R(t) =PN(t)
i =1 Ri da t denborako sari
metatua. Sariak ausazko aldagaiak dira, probabilitate banaketa bera dutenak (eta E [Ri] < ∞).
Gainera, izan bedi {X (t), t ≥ 0} prozesu birsortzailea non X (t) sistemako bezero kopurua den: bezeroak sistemara λ tasaren arabera etortzen dira, bezero bakoitza sisteman ausazko denbora bat egoten da, i -garren bezeroak Ri saria
ematen dio sistemari eta gero sistematik irteten da. Prozesu birsortzailearen ziklo batean emandako sariak independenteak dira aurreko zikloetako sarietatik.
Etorrerak dituen sistema birsortzailea
Probabilitate ereduak eta berritze prozesuak
Etorrerak dituen sistema birsortzailea deskribatu ondoren, honelako sistema batean erabilgarria den irabazi tasa definituko dugu: G = limT →∞R(T )/T
Kostu ekuazioa dugu irabazi tasarako:
G = λ E [Ri]
Frogatu
Ekuazio honetan kostuaren egitura zehaztuz hainbat lege ondorioztatzen dira.
Etorrerak dituen sistema birsortzailea
Probabilitate ereduak eta berritze prozesuak
Little-ren legea
L = λ W
I W da bezeroak sisteman egoten diren denboraren batezbestekoa
I L da sisteman dauden bezeroen kopuruaren batezbestekoa Frogatu
Etorrerak dituen sistema birsortzailea
Probabilitate ereduak eta berritze prozesuak
Orain, etorrerak dituen sistema birsortzaile bereziagoa kontsideratuko dugu, zerbitzua duena: bezeroa sisteman dagoen bitartean, denboraren zati bat zerbitzuaren zain dago, eta denboraren beste zatia zerbitzua jasotzen.
Sistemak zerbitzari bat edo gehiago izango ditu. Denborako une bakoitzean zerbitzaria geldirik egondo da edo bestela bezero bat zerbitzatzen.
Etorrerak dituen sistema birsortzailea
Probabilitate ereduak eta berritze prozesuak
Erabilera legea. Zerbitzari bakarra duen sisteman:
U = λ S
I S da bezeroen zerbitzu denboraren batezbestekoa I U da sistema bezeroei zerbitzua ematen ari den denbora
zatikia Frogatu
Sistemaren erabilera deitzen zaio U balioari; U = 1 − P0 da,
non P0 = limt→∞P{X (t) = 0} (baldin sistema bezeroak
Etorrerak dituen sistema birsortzailea
Probabilitate ereduak eta berritze prozesuak
Geroago erabiliko den emaitza tekniko bat aipatuko dugu. Orain X (t) sistema baten egoera izango da (ez da nahitaez bezero kopurua).
Etorrera teorema (PASTA)
Bezeroak sistemara Poisson prozesuaren arabera iristen badira eta {X (t), t ≥ 0} prozesu birsotzailea bada, berritze arteko denbora jarraituak dituena, orduan Aj = Pj dugu edozein j
egoerarako, definizio hauekin:
I Aj da sistema j egoeran izateko probabilitatea bezero bat sisteman sartu aurreko une zehatzean,
Etorrerak dituen sistema birsortzailea
Probabilitate ereduak eta berritze prozesuak
M/M/1 itxarote-lerroa
Hau da itxarote-lerroaren eredu errazena:
I Poisson prozesuaren araberako etorrerak (M) I zerbitzu denbora esponentziala (M)
I zerbitzari bakarra (1)
X (t) ausazko aldagaiak adieraziko du itxarote-lerroan t unean dauden bezeroen kopurua: lehenengo iritsi dena zerbitzua jasotzen izango da eta besteak itxaroten. Izan bedi λ etorrera tasa eta µ zerbitzu esponentzialen parametroa: baldin λ < µ bada, orduan {X (t), t ≥ 0} prozesu birsortzailea da.
Kontsidera dezakegu prozesua berritzen dela itxarote-lerroa hutsik geratzen den bakoitzean.
Etorrerak dituen sistema birsortzailea
Probabilitate ereduak eta berritze prozesuak
Batez besteko balioaren analisiak (MVA) formula hauek ematen dizkigu: W = 1 µ − λ L = λ µ − λ U = λ µ Frogatu
Prozesu estokastiko honetan egoerek dituzten probabilitateak lortzeko, balantza ekuazioak idatzi behar dira, ez da nahikoa MVA analisia.
Etorrerak dituen sistema birsortzailea
Probabilitate ereduak eta berritze prozesuak
Adibidea
Denbora diskretuko Markov kateak
Markov kateak
Prozesu estokastikoaren probabilitate egitura zehaztuko dugu, ereduaren analisia egin eta egoeren probabilitateak kalkulatu ahal izateko.
Oroimengabetasun propietate bat, Markov propietatea, betetzen duten probabilitate eredu errazak definituko ditugu. Propietate honek prozesu estokastikoaren analisia egiteko aukera ematen du (antzekoa gertatzen da Poisson prozesuak edo banaketa esponetzialak aztertzen direnean).
Denbora diskretuko Markov kateak
Markov kateak
Izan bedi {Xn, n = 0, 1, . . .} denbora diskretuko prozesu
estokastikoa. Prozesua n denboran j egoeran badago, Xn= j
idatziko dugu. Egoera multzoa zenbakigarria da, finitua ala infinitua: 0, 1, 2 . . . egoerak ditugu.
Prozesu estokastiko hori Markov katea da baldin, edozein n denbora eta j egoerarako, hau betetzen bada:
P{Xn+1 = j | X0, . . . , Xn−1, Xn} = P{Xn+1 = j | Xn}
Honela interpretatuko genuke definizioa: Xn egoera emanik,
Xn+1 egoera independentea da X0,. . . , Xn−1 egoeretatik, hau
da, egungo egoera jakinik, hurrengo egoera independentea da iraganeko egoeretatik.
Denbora diskretuko Markov kateak
Markov kateak
Prozesu estokastikoa i egoeran izanik, pauso batean j egoerara trantsizioa egiteko probabilitateari, trantsizio probabilitatea deitzen zaio:
P{Xn+1 = j | Xn = i } = Pij
Probabilitate baldintzatu hau ez da izango n denboraren menpekoa. Trantsizio matrizea dugu, probabilitateak lerro eta zutabeetan i eta j egoeren arabera idatziz:
P = P00 P01 P02 · · · P10 P11 P12 · · · P20 P21 P22 · · · .. . ... ... . ..
Denbora diskretuko Markov kateak
Markov kateak
P matrizearen sarrerak ez-negatiboak dira eta lerro bakoitzean P
j Pij = 1 betetzen da: i egoera bakoitzerako, j egoera
desberdinetarako trantsizio probabilitateen batura 1 da.
Matrizearen diagonaleko Pii sarrerak, egoera batetik egoera
bererako trantsizio probabilitateak dira.
Adibidea
Denbora diskretuko Markov kateak
Markov kateak
Pauso bateko Pij trantsizio probabilitateek Markov katearen
probabilitate egitura guztiz zehazten dute (hasierako egoera emanik). Orain, n pausoko trantsizio probabilitateak lortzea nahi dugu.
Propietatea. Pauso bateko trantsizio probabilitateak jakinik:
P{Xm+n = j | Xm = i } = (Pn)ij
Frogatu
Pijn idatziko dugu probabilitate baldintzatu hau adierazteko: prozesu estokastikoa i egoeran izanik, n pausotan j egoerara trantsizioa egiteko probabilitatea; Pn matrizeko (i , j ) sarreran
Denbora diskretuko Markov kateak
Markov kateak
Hasierako egoera finkatu ordez, n = 0 denboran i egoera desberdinentarako probabilitateak ezagutzen baditugu,
αi = P{X0 = i }
orduan n denboran edozein j egoerarako ondorengo probabilitate ez-baldintzatua kalkulatuko dugu.
Propietatea P{Xn = j } = X i αiPijn Frogatu Adibidea
Egoerak sailkatzea
Markov kateak
Egoerak sailkatuko ditugu, prozesu estokastikoak denboran zehar izango duen bilakaera aztertzeko.
Prozesua i egoeratik abiatu bada, Ti ausazko aldagaiak
adieraziko du prozesua i egoerara noiz itzuliko den; Ti = ∞
idatziko dugu inoiz ez bada itzultzen.
Prozesua hasierako i egoerara noizbait itzultzeko probabilitatea definituko dugu:
Egoerak sailkatzea
Markov kateak
Esango dugu i egoera:
I errepikaria dela baldin fi = 1, hau da, i egoeratik abiatuz
prozesua beti itzultzen da (1 probabilitatearekin) hasierako egoerara,
I iragankorra dela baldin fi < 1, hau da, i egoeratik abiatuz
badugu probabilitate positibo bat (1 − fi) prozesua
hasierako egoerara inoiz ez itzultzeko.
Bereizketa hau egiten da i egoera errepikaria denean: errepikari positiboa da baldin E [Ti| X0 = i ] < ∞ eta errepikari nulua da
Egoerak sailkatzea
Markov kateak
Izan bedi Ni prozesu estokastikoak i hasierako egoerara egingo
dituen bisiten kopurua. Baldin:
I hasierako egoera errepikaria bada Ni = ∞ izango da,
I hasierako egoera iragankorra bada Ni < ∞ izango da,
banaketa geometrikoa du Ni ausazko aldagaiak kasu
Egoerak sailkatzea
Markov kateak
Egoerak periodikotasunaren arabera ere sailkatuko ditugu: I Esango dugu i egoera errepikariak d ≥ 2 periodoa duela,
baldin Piin= 0 bada periodoaren multiploa ez den edozein n osokorako, d izanik propietate hori betezen duen osoko handiena.
I Propietate hori betetzen duen d ≥ 2 osokorik ez bada existitzen, edo egoera iragankorra bada, esango dugu i egoera aperiodikoa dela.
Beraz i egoera periodikoa bada, d periododuna, prozesu estokastikoa i egoeratik abiatuz, i egoerara itzuliko da soilik d , 2d , 3d , . . . denboretan, ez derrigor denbora guzti horietan.
Azkenik, egoera bat ergodikoa dela esaten da errepikari positiboa eta aperiodikoa bada.
Egoerak sailkatzea
Markov kateak
Egoera posible guztien multzoaren partiketa definituko dugu baliokidetasun erlazio baten bidez.
Esango dugu i egoeratik j egoerara hel gaitezkeela, i → j idatziz, existitzen bada n osokoren bat Pijn> 0 izanik. Esango dugu i eta j egoerak komunikatzen direla, i ↔ j idatziz, baldin i → j eta j → i betetzen bada.
Propietatea. Egoeren arteko → erlazioa iragankorra da eta ↔ komunikazio erlazioa baliokidetasun erlazio bat da.
Frogatu
Komunikazio erlazioak induzitutako baliokidetasun klaseak, komunikazio klaseak, egoera multzoaren partiketa bat dira.
Egoerak sailkatzea
Markov kateak
Markov kate bat laburtezina dela esaten da baldin egoera multzoak komunikazio klase bakarra badu, egoera guztiak elkarren artean komunikatzen badira.
Komunikazio klase bat itxia da baldin ezinezkoa bada klasekoa ez den egoera batera heltzea bertako egoeretatik: klase itxiko egoera batera iristen denean prozesu estokastikoa, klasetik ez da irtengo inoiz.
Klase itxiak egoera bakarra badu, honi egoera xurgatzailea deitzen zaio. Bestalde, Markov kate laburtezinean, egoera multzoaren klase bakarra itxia da.
Egoerak sailkatzea
Markov kateak
Propietatea
I Komunikazio klase ez-itxi bateko egoera guztiak iragankorrak dira.
I Egoera kopurua finitua bada, komunikazio klase itxi bateko egoera guztiak errepikariak (positiboak) dira. I Egoera kopurua infinitua bada, klase itxi bateko egoera
guztiak iragankorrak dira edo bestela egoera guztiak errepikariak dira (denak positiboak edo denak nuluak). I Klase batean, egoera guztiak aperiodikoak dira edo
bestela egoera guztiak periodikoak dira, denak periodo berdinekoak.
Egoerak sailkatzea
Markov kateak
Irizpide hau dugu periodikotasuna aztertzeko (baldintza nahikoa da baina ez derrigorrezkoa): baldin Pii > 0 bada
orduan i egoera aperiodikoa da. Bestalde, kontuan izango dugu klase bateko egoera guztiek periodikotasun berdina dutela.
Adibidea
Sailkatu egoerak bi Markov kate hauetan.
Esango dugu Markov kate laburtezin bat aperiodikoa dela egoerak aperiodikoak badira, eta ergodikoa dela egoerak ergodikoak badira.
Limiteko probabilitateak
Markov kateak
Markov katearen Pij trantsizio probabilitateak jakinik, denbora
diskretuko prozesu estokastiko honetan, egoera bakoitzaren limiteko probabilitatea kalkulatu nahi dugu:
πj = limn→∞P{Xn = j }
Markov kate laburtezinak kontsideratuko ditugu: egoera kopurua finitua bada, egoerak errepikariak (positiboak) dira; infinitua bada, egoerak errepikariak (positiboak edo nuluak) dira edo bestela iragankorrak.
Limiteko probabilitateak
Markov kateak
Hauek dira Markov kate laburtezinerako balantza ekuazioak, normalizazio ekuazioa ere gehituz:
πj = X i πiPij , j = 0, 1, . . . X j πj = 1
Egoera kopurua finitua bada, egoerak errepikariak (positiboak) dira eta balantza ekuazioek soluzioa dute, π = (π0, π1, . . .),
soluzio bakarra eta positiboa.
Limiteko probabilitateak
Markov kateak
Egoerak aperiodikoak badira, egoeren limiteko probabilitateak ditugu, prozesuaren hasierako egoeraren menpean ez
daudenak: πj = limn→∞Pijn. Egoerak periodikoak badira,
denbora proportzioak dira πj hauek.
Egoera kopurua infinitua bada, balantza ekuazioek
(normalizazio ekuazioarekin batera) soluzioa dute baldin eta soilik baldin egoerak errepikari positiboak badira (horrela bada, soluzioa bakarra eta positiboa da).
Egoera kopurua infinitua izanik, baldin egoerak iragankorrak edo errepikari nuluak badira, orduan limiteko probabilitateak nuluak dira.
Limiteko probabilitateak
Markov kateak
Ekuazioen adierazpen matriziala hau da:
π = πP π1 = 1 non π = π0 π1 . . . , 1 = 1 1 . . . T eta P trantsizio matrizea den. Adibidea
Baldin π = πP, π1 = 1 ekuazioen soluzioa bada π, banaketa geldikorra deitzen zaio, πsd idazkera erabiliz.
Limiteko probabilitateak
Markov kateak
Propietatea. Hasierako egoera desberdinetarako probabilitateek πsd banaketa geldikorra badute, orduan edozein n denborako
egoera posibleen probabilitateek ere πsd banaketa dute.
Frogatu
Denbora jarraituko Markov kateak
Markov kateak
Markov propietatea betetzen duten denbora jarraituko prozesu estokastikoak aztertuko ditugu.
Izan bedi {X (t), t ≥ 0} denbora jarraituko prozesu
estokastikoa, egoera multzo zenbakigarria duena, finitua ala infinitua. Esango dugu denbora jarraituko Markov katea (DJMK) dela baldin edozein s, t denboretarako eta j egoerarako hau betetzen bada:
P{X (s + t) = j | X (u), u ≤ s} = P{X (s + t) = j | X (s)}
Probabilitate baldintzatu hau ez da s denboraren menpekoa izango, baina oro har t denboraren menpean dago.
Denbora jarraituko Markov kateak
Markov kateak
DJMKaren definizioa honela ulertuko dugu: X (s) egoera jakinik, X (s + t) egoera independentea da u < s denboretako X (u) egoeretatik; hau da, “oraingo egoera” jakinik, edozein “etorkizuneko egoera” independentea da “iraganeko
egoeretatik”.
DJMKaren analisia zailagoa da denbora diskretuko Markov katearen (DDMK) analisia baino, DJMK batean trantsizio probabilitatea t denboraren funtzioa baita (i eta j egoeren menpekoa izateaz gain):