• No se han encontrado resultados

SISTEMA INFORMATIKOEN ERRENDIMENDUAREN EBALUAZIOA

N/A
N/A
Protected

Academic year: 2021

Share "SISTEMA INFORMATIKOEN ERRENDIMENDUAREN EBALUAZIOA"

Copied!
259
0
0

Texto completo

(1)

SISTEMA INFORMATIKOEN

ERRENDIMENDUAREN

EBALUAZIOA

F. Xabier Albizuri - 2018

[email protected]

go.ehu.eus/ii-siee

(2)

Gaiak:

1. Atarikoa: probabilitate teoriaren sarrera

2. Diseinu esperimentala eta datu analisia

3. Probabilitate ereduak eta berritze prozesuak

4. Markov kateak

5. Kola sareak eta sistema informatikoen ereduak

6. Simulazioa eta Petri sareak

(3)

Ikasliburak:

1. J.Y. Le Boudec. Performance Evaluation of Computer and Communication Systems. EPFL Press, 2010. Web: perfeval.epfl.ch

2. R. Jain. The Art of Computer Systems Performance Analysis. Wiley, 1991.

3. K. Kant. Introduction to Computer System Performance Evaluation. McGraw-Hill, 1992.

4. S.M. Ross. Introduction to Probability Models, 10th ed. Elsevier, 2009.

5. A. Kumar, D. Manjunath, J. Kuri. Communication Networking: an Analytical Approach. Elsevier, 2004.

6. W.J. Stewart. Probability, Markov Chains, Queues, and Simulation. Princeton University Press, 2009.

7. P.J. Fortier, H.E. Michel. Computer Systems Performance Evaluation and Prediction. Elsevier, 2003.

(4)

Aldizkariak:

1. IEEE/ACM Transactions on Networking

2. IEEE Transactions on Parallel and Distributed Systems

3. IEEE Transactions on Computers

4. IEEE Transactions on Multimedia

5. IEEE Journal on Selected Areas in Communications

6. IEEE Transactions on Communications

7. Computer Communications

8. Performance Evaluation

(5)

Probabilitate teoriaren sarrera

Experimento aleatorio: un experimento cuyo resultado es indeterminado. Espacio muestral: conjunto Ω = {ω} de todos los posibles resultados del experimento.

Evento: un subconjunto A ⊆ Ω del espacio muestral. Se dice que en un experimento aleatorio ha ocurrido el evento A si el resultado ω ∈ A. Algebra de conjuntos: uni´on de eventos, intersecci´on, eventos disjuntos, complemento de un evento.

Ejemplo

Definir un experimento aleatorio, dar su espacio muestral. Especificar un evento.

(6)

Probabilitate teoriaren sarrera

Interpretaci´on intuitiva de la probabilidad: frecuncia de un evento al repetir una y otra vez el experimento aleatorio.

Probabilidades en un espacio muestral, definici´on axiom´atica.

Todo evento A tiene una probabilidad P(A) ∈ R, cumpli´endose:

i. 0 ≤ P(A) ≤ 1 y P(Ω) = 1,

ii. para eventos cualquiera A1, A2, . . . disjuntos entre s´ı,

P (S∞

i =1Ai) =

P∞

(7)

Probabilitate teoriaren sarrera

De estos dos axiomas se derivan otras propiedades: P(∅) = 0, para eventos A, B disjuntos P(A ∪ B) = P(A) + P(B), para todo evento tenemos P(A) + P(Ac) = 1, si A ⊆ B entonces

P(A) ≤ P(B), para eventos B1, B2, . . . disjuntos que cumplen

S

i =1Bi = Ω entonces dado un evento A cualquiera tenemos

P(A) =P

i =1P(A ∩ Bi)

Espacios muestrales infinitos, Ω = R: probabilidad como medida de Lebesgue. No todo subconjunto de R es medible. (Paradoja en Q.)

(8)

Probabilitate teoriaren sarrera

Variables aleatorias

Una variable aleatoria X asigna un valor X (ω) ∈ R a cada muestra ω ∈ Ω.

Una variable aleatoria es discreta si {X (ω) : ω ∈ Ω} es un conjunto finito o infinito numerable.

Usualmente calculamos probabilidades de eventos relativos a variables aleatorias (en particular cuando Ω = R).

Ejemplo

(9)

Probabilitate teoriaren sarrera

Dada una variable aleatoria X y b ∈ R, un evento:

{X ≤ b} = {ω : X (ω) ≤ b}

Funci´on de distribuci´on F (x ) de una variable aleatoria X :

F (x ) = P{X ≤ x }

para x ∈ R. La funci´on F (x ) es no decreciente,

l´ımx →∞F (x ) = F (∞) = 1 y l´ımx →−∞F (x ) = F (−∞) = 0

Conocida la funci´on de distribuci´on, calculamos:

(10)

Probabilitate teoriaren sarrera

Si X es una variable aleatoria discreta, se define la funci´on de masa de probabilidad:

p(x ) = P {X = x }

para x ∈ R, P

xp(x ) = 1

Si la variable aleatoria X es no discreta y F (x ) es una funci´on derivable, se dice que X es una variable aleatoria continua, siendo f (x ) = F0(x ) la funci´on de densidad de probabilidad. TenemosR f (x) dx = 1 (y P{X = x} = 0)

Ejemplo

(11)

Probabilitate teoriaren sarrera

Se denomina distribuci´on de probabilidad de una variable aleatoria X a la especificaci´on de la funci´on de masa de probabilidad si X es discreta o de la densidad de probabilidad si X es continua (en general especificaci´on de la medida de Lebesgue dF (x ) de la variable aleatoria).

A la funci´on de distribuci´on F (x ) tambi´en se le denomina funci´on de distribuci´on acumulativa (CDF en ingl´es), diferenci´andolo del concepto anterior.

(12)

Probabilitate teoriaren sarrera

Independencia entre variables aleatorias

Se dice que dos variables aleatorias X e Y definidas sobre el mismo espacio muestral son independientes si para todo A, B ⊆ R:

P {X ∈ A, Y ∈ B} = P {X ∈ A} P {Y ∈ B}

Se generaliza para m´as de dos variables.

Formularemos el concepto de independencia mediante probabilidades condicionadas.

(13)

Probabilitate teoriaren sarrera

Probabilidad condicional del evento A dado el evento B:

P(A|B) = P(A ∩ B) P(B)

(Dado un evento B con P(B) > 0 las probabilidades

condicionales P(A|B) proporcionan nuevas probabilidades para los eventos A sobre el espacio muestral Ω.)

Teorema de la probabilidad total: dados uno eventos B1, B2, . . .

disjuntos y que verifican S

iBi = Ω, para cualquier evento A,

P(A) =X

i

(14)

Probabilitate teoriaren sarrera

Formulaci´on de la independencia de variables aleatorias:

P {X ∈ A|Y ∈ B} = P {X ∈ A}

Simetr´ıa de la definici´on.

Ejemplo

(15)

Probabilitate teoriaren sarrera

Esperanza matem´atica

Esperanza de una variable aleataroia X discreta:

E [X ] = X

x

x P{X = x }

Variable continua con densidad de probabilidad f (x ):

E [X ] = Z ∞

−∞

x f (x ) dx

En general, se escribe E [X ] =R x dF (x) integral de Lebesque respecto de la distribuci´on F (x ) de una variable aleatoria.

(16)

Probabilitate teoriaren sarrera

Ejemplo

Esperanza de la variable aleatoria geom´etrica.

Dada una variable aleatoria X y una funci´on g , tenemos una nueva variable aleatoria g (X ), de forma que g (X )(ω) = g (X (ω)). Esperanzas para X discreta y continua:

E [g (X )] =X x g (x )P{X = x } E [g (X )] = Z ∞ −∞ g (x ) f (x ) dx

(17)

Probabilitate teoriaren sarrera

Varias variables aleatorias sobre un espacio muestral: medida de probabilidad dF (x , y )

Linearidad de la esperanza: E [aX + bY ] = aE [X ] + bE [Y ]

Varianza de una variable aleatoria:

Var(X ) = E [(X − µ)2]

siendo µ = E [X ]. Tenemos: Var(X ) = E [X2] − (E [X ])2

Propiedad. Si X e Y son independientes, entonces:

(18)

Probabilitate teoriaren sarrera

Coeficiente de variaci´on de una variable aleatoria:

CV(X ) = pVar(X ) E [X ]

donde E [X ] > 0.

Demostrar que representa la varianza (su ra´ız cuadrada) normalizada: CV(aX ) = CV(X )

(19)

Probabilitate teoriaren sarrera

Esperanza condicionada de la variable aleatoria X dado Y = y :

E [X |Y = y ] =X x x P{X = x |Y = y } E [X |Y = y ] = Z ∞ −∞ x f (x |y ) dx

Medida de probabilidad condicionada dF (x |y )

La esperanza condicionada E [X |Y ] es una variable aleatoria, funci´on de la variable aleatoria Y .

(20)

Probabilitate teoriaren sarrera

Propiedad. (a) Para variables aleatorias X e Y :

E [E [X |Y ]] = E [X ]

(b) Para un evento A y una variable aleatoria Y :

E [P(A|Y )] = P(A)

La probabilidad condicionada P(A|Y ) es una variable aleatoria que es funci´on de Y .

Ejemplo

(21)

Sarrera

Diseinu esperimentala eta datu analisia

Sistema informatikoen errendimendua ebaluatzeko teknika nagusiak hauek dira:

I Neurketa I Simulazioa

I Modelaketa analitikoa

Neurketan eta simulazioan teknika estatistikoak behar dira esperimentuak diseinatzeko, datuak biltzeko eta datuak analizatzeko.

Oro har, simulazioaren bidez aztertzen dira, analisi matematikoa onartzen ez duten sistema konplexuak.

(22)

Sarrera

Diseinu esperimentala eta datu analisia

Neurketa

Sistema errealarekin egiten da esperimentua. Errendimendu parametroak neurtzen dira hardware bidez, software bidez edo metodo hibridoak erabiliz.

Esperimentazioan kontrolatu ezin diren faktoreak izaten dira, ondorioz:

I neurketen analisi estatistikoa egin behar da, I aukeratu behar dira sarrera eta irteera egokiak

(23)

Sarrera

Diseinu esperimentala eta datu analisia

Simulazioa

Sistemaren funtzionamendua adierazten duen programa bat lantzen da eta exekutatzen da. Hau egin behar da simulazioan:

I sistemaren funtzionamenduaren eredu formala eraiki, I kargaren adierazpen (eredu) bat zehaztu, edo aztarna

(traza) batez hornitu simulazioaren exekuzioa. Simulazioa egiteko kontu hauek aztertu behar dira:

I modelatu nahi den sisteman begiratuko den xehetasun maila,

I emaitzen analisi estatistikoaren antolaketa, I esperimentuaren diseinua, egingarria izan dadin.

(24)

Sarrera

Diseinu esperimentala eta datu analisia

Simulazio teknikak

Gertaera diskretuzko simulazioa: gertaera bat jazotzen den bakoitzean sistemaren egoera eguneratzen da. Simulatzaileak etorkizuneko gertaeren zerrenda erabiltzen du eta zerrenda hau eguneratzen da gertaerak sekuentzialki prozesatuz.

Gertaera diskretuen adibideak: bezero bat itxarote-lerrora iristea, baliabide baten jabe egitea, zerbitzu batekin amaitzea, eta abar.

Ez dira gertaera diskretuzko simulazioak, denbora-parametroa uniformeki diskretizatuz (0, δ, 2δ, 3δ . . . ) egiten diren

(25)

Sarrera

Diseinu esperimentala eta datu analisia

Gertaerak honela sailkatzen dira: I barnekoak eta kanpokoak,

I deterministak eta ez-deterministak.

Simulazioan gertaera ez-deterministen sorkuntza egiteko aukerak:

I aztarna bati jarraituz, aurretik sistema erreala neurtu behar da (zerbitzari bat, router bat), xehetasun osoa gordetzen da gertaeren sorkuntzan,

I probabilitate banaketa bati jarraituz (ausazko aldagaiak simulatzen dituzten algoritmoen bidez), honela kargaren edo zerbitzuaren eredu trinkoa eta errepikagarria dugu, parametro aldagarriak izan ohi dituen eredua.

(26)

Sarrera

Diseinu esperimentala eta datu analisia

Simulazioaren gertaerak probabilitate banaketa bati jarraituz sortzeko, emandako banaketaren arabera ausazko zenbakiak sortzen dituzten algoritmoak erabili behar dira.

Algoritmo hauek berez deterministak dira, hasierako haziaz (zenbaki bat) hornitu behar dira. Baina itxura estatistiko ausazkoa eskatzen zaio algoritmoari: simulazioan lortzen den histograma begiratzen da, sortzen diren balioen arteko korrelazioa, eta abar.

(27)

Datu analisia

Diseinu esperimentala eta datu analisia

Sistema baten errendimendua ebaluatzeko esperimentazioak ezaugarri hauek ditu:

I Sistemaren kargak eta zerbitzuak ez-deterministak izan ohi dira, eta zehaztu ezinezkoak diren faktoreak egon daitezke. Ausazko emaitzak lortzen dira simulazioan. I Errendimendu parametroak estimatzeko hainbat behaketa

(28)

Datu analisia

Diseinu esperimentala eta datu analisia

Esperimentazioan egiten diren galderak:

1. Nola estimatu errendimendu parametroaren batez besteko balioa behaketa batzuetatik?

2. Behaketa kopuru handiagoak estimazio fidagarriagoa ematen du?

3. Nola karakterizatuko dugu estimazio errorea behaketa kopuruaren funtzio bezala?

4. Nola egin behar dira esperimentuak errorearen karakterizazioa fidagarria izateko?

(29)

Datu analisia

Diseinu esperimentala eta datu analisia

Sistemaren errendimendu parametroa X izango da.

Probabilitate eredu hau dugu oinarrian: X ausazko aldagaia da, F (x ) banaketa funtzioa duena, batezbestekoa s da eta bariantza σ2. Aldagaiaren banaketa ez dugu ezagutzen, beraz

s eta σ2 ere ez. Esperimentazioaren helburua, X aldagaiaren

batezbestekoa s eta bariantza σ2 estimatzea da.

X parametroaren behaketa esperimentalak dira X1, X2, . . . , Xn,

oro har elkarren artean ez-independenteak.

Sistemaren i -garren behaketa da Xi, ausazko aldagai bat: bere

batezbestekoa s da eta bariantza σ2. Hau da, X aldagaiaren banaketa bera du behaketa bakoitzak.

(30)

Datu analisia

Diseinu esperimentala eta datu analisia

Hau da s parametroaren, X aldagaiaren batezbestekoaren, estimatzailea: X = 1 n n X i =1 Xi

X ere ausazko aldagaia da.

X estimatzailea alboragabea da:

(31)

Datu analisia

Diseinu esperimentala eta datu analisia

X estimatzaile fidagarriagoa da behaketa kopurua handitzen den heinean: Var(X ) = E h X − s2 i = = E   1 n n X i =1 (Xi − s) !2 = = σ 2 n + 2 n2 X i X j >i Cov(Xi, Xj) Frogatu formula

(32)

Datu analisia

Diseinu esperimentala eta datu analisia

I Behaketak independenteak badira, hau da,

Cov(Xi, Xj) = 0 edozein behaketa bikoterekin, orduan

bariantza txikiagotzen da behaketa kopurua handituz, Var(X ) → 0, n → ∞.

I Baldintza ahulagoa da beste hau (behaketak

independenteak ez direnean begiratuko genuke): baldin Cov(Xi, Xj) = 0 behaketen tartea gutxienez m denean,

j ≥ i + m, orduan bariantza txikiagotzen da behaketa kopurua handituz, Var(X ) → 0, n → ∞.

(33)

Datu analisia

Diseinu esperimentala eta datu analisia

X estimatzailea ausazko aldagaia izanik, esperimentuan

tartezko estimazioa egiten da: X emaitzaren inguruko tarte bat lortzen da, s barruan izango duena probabilitate zehatz

batekin. Tartezko estimazioa egiteko, X aldagaiaren bariantza estimatu behar da.

Lehenik, hau da σ2 parametroaren, X aldagaiaren bariantzaren, estimatzailea: δX2 = 1 n − 1 n X i =1 (Xi − X )2 non X = 1/nP iXi

(34)

Datu analisia

Diseinu esperimentala eta datu analisia

Estimatzailearen itxaropena σ2− 2 n(n−1) P i P j >iCov(Xi, Xj)

da, beraz behaketa independenteak ditugunean δX2 estimatzaile alboragabea da, E [δ2

X] = σ2.

X aldagaiaren bariantza σ2/n da behaketa independenteekin, ondorioz hau da X aldagaiaren bariantzaren estimatzailea behaketa independenteak baditugu:

δ2X = δ

2 X

n

(35)

Datu analisia

Diseinu esperimentala eta datu analisia

Balio estimatuaren errore marjina, probabilitate zehatz bati dagokiona, kalkulatzeko, X = 1/nP

iXi aldagaiaren

probabilitate banaketa jakin behar dugu. X ausazko aldagaia normalizatuko dugu: Y = (X − s)√n/σ

Limite zentralaren teoremak hau dio: X1, . . . , Xn ausazko

aldagai independenteak badira eta probabilitate banaketa bera badute (edozein banaketa), orduan Y aldagaia N (0, 1)

banaketa normalerantz doa, n → ∞ doanean.

Bestalde, n finiturako eta Y = (X − s)√n/δX idatziz, baldin

X1, . . . , Xn aldagai independenteek N (s, σ) banaketa

normalari jarraitzen badiote, orduan Y aldagaiak t-banaketa estandarrari, n − 1 askatasun gradukoari, jarraitzen dio.

(36)

Datu analisia

Diseinu esperimentala eta datu analisia

t-banaketa estandarraren taula

df \ α 0.10 0.05 0.025 1 3.077684 6.313752 12.70620 2 1.885618 2.919986 4.30265 3 1.637744 2.353363 3.18245 4 1.533206 2.131847 2.77645 5 1.475884 2.015048 2.57058 6 1.439756 1.943180 2.44691 7 1.414924 1.894579 2.36462 8 1.396815 1.859548 2.30600 9 1.383029 1.833113 2.26216 10 1.372184 1.812461 2.22814 inf 1.281552 1.644854 1.95996

(37)

Datu analisia

Diseinu esperimentala eta datu analisia

df \ α 0.01 0.005 1 31.82052 63.65674 2 6.96456 9.92484 3 4.54070 5.84091 4 3.74695 4.60409 5 3.36493 4.03214 6 3.14267 3.70743 7 2.99795 3.49948 8 2.89646 3.35539 9 2.82144 3.24984 10 2.76377 3.16927 inf 2.32635 2.57583

(38)

Datu analisia

Diseinu esperimentala eta datu analisia

Esperimentuetan tartezko estimazioa honela egiten da. Izan bedi x , esperimentuan X estimatzaileak eman duen balioa:

1. konfiantza tartea definitzen da, x ± e

2. konfiantza maila kalkulatuko da,

P = 1 − 2α = Pr(|X − s| < e)

Alderantziz, tartezko estimazioa honela ere egiten dugu: konfiantza maila zehatz bat eskatuz, honi dagokion konfiantza tartea kalkulatuko da. Konfiantza mailaren ohiko balioak: P = 0,90, 0,95, 0,99 (α = 0,05, 0,025, 0,005)

(39)

Datu analisia

Diseinu esperimentala eta datu analisia

X aldagaiaren ordez aldagai normalizatua erabiltzen da kalkuluetan: Y = √ n δX (X − s) Horrela: e0 = √ n δX e P = 1 − 2α = Pr(|Y | < e0)

Isatsen probabilitateak dira hauek (banaketa simetrikoarekin): Pr(Y > e0) = Pr(Y < −e0) = α

(40)

Datu analisia

Diseinu esperimentala eta datu analisia

Y aldagai normalizatuaren probabilitate banaketa emanik, konfiantza maila bati konfiantza tarte bat dagokio. Konfiantza maila handiagoak eskatzen du konfiantza tartea zabaltzea, eta alderantziz, konfiantza tarte estuagoak konfiantza maila txikiagoa ekartzen du.

Y aldagaiaren banaketa eta bereziki e0 = e√n/δX balioa izanik

n kopuruaren menpekoak, n behaketa kopuru beharrezkoa determinatuko dugu P = 1 − 2α konfiantza mailarako eta ±e konfiantza tarterako, banaketa hauetako baten bidez:

I t-banaketa n − 1 askatasun graduarekin,

I banaketa normal estandarra, n → ∞ doanean (banaketa hau ez dago n kopuruaren menpean, bai ordea e0).

(41)

Datu analisia

Diseinu esperimentala eta datu analisia

Urrats hauek egingo ditugu P konfiantza maila (gutxienez) eta ±e konfiantza tartea (gehienez) lortzeko behar adina behaketa eginez:

1. Egin n behaketa (kopuru arbitrarioa hasieran), s eta σ2

estimatu X eta δ2

X kalkulatuz. Konfiantza maila eta tartea

betetzen badira amaitu dugu, bestela jarraitu.

2. Determinatu n behaketa kopuru berria (handiagoa) konfiantza maila eta tartea betetzeko aurreko estimazioak erabiliz. Joan lehenengo urratsera, behaketa gehigarriak egin eta estimazio berriak kalkulatu.

Honela lortuko dugu X parametroaren batezbestekoaren x estimazioa, P konfiantza mailarekin ±e tartean.

(42)

Datu analisia

Diseinu esperimentala eta datu analisia

Adibidea

Errendimendu parametro bat estimatzeko bost behaketa esperimental egin dira, balio hauek bilduz: 3,07, 3,24, 3,14, 3,11, 3,07

1. Kalkulatu konfiantza maila ±0,1 tarterako.

2. Konfiantza tarte horrekin, determinatu behaketa kopuru beharrezkoa konfiantza maila 99 % baino handiagoa izateko.

(43)

Datu analisia

Diseinu esperimentala eta datu analisia

Parametro bat (X aldagaiaren batezbestekoa) estimatzeko gogoratu:

I Xi behaketak independenteak izan behar dira, baldintza

honek garrantzia du,

I behaketa kopurua oso handia denean, estimatzaileari dagokion Y aldagai normalizatuarekin banaketa normala erabiliko genuke (limite zentralaren teorema), baina oro har t-banaketa erabiliko dugu (Xi behaketek banaketa

normala dutela suposatuz).

Puntu gehigarria litzateke X aldagaiaren bariantzaren estimazioan dugun konfiantza tartea eta maila aztertzea.

(44)

Datu analisia

Diseinu esperimentala eta datu analisia

Bariantza gutxitzeko teknikak bariantza gutxitzeko erabiltzen dira behaketa kopurua finkaturik. Teknika hauekin estimazio hobea lortzen da, edo bestela kostu txikiagoa duen

esperimentua egin daiteke. Kontrol aldagaiaren metodoa aztertuko dugu. Izan bitez X eta Y sistema baten

esperimentazioan behatzen diren ausazko aldagaiak, estimatu behar den parametroa s = E [X ] da. Kontrol aldagaia hau da, non ν = E [Y ]:

Xc = X − a (Y − ν)

Frogatu E [Xc] = E [X ] = s dela.

Xc adagaiaren behaketak erabiliko ditugu s parametroa

estimatzeko baldin Var(Xc) < Var(X ) betetzen bada a

(45)

Datu analisia

Diseinu esperimentala eta datu analisia

Propietatea. Xc aldagaiaren bariantza a = Cov(X , Y )/Var(Y )

koefizienteak minimizatzen du eta bariantzaren minimoa Var(Xc) = (1 − ρ2XY) Var(X ) da, non X eta Y aldagaien

korrelazio koefizientea den ρXY. Beraz X eta Y

independenteak ez badira (0 < |ρ| ≤ 1), Var(Xc) < Var(X ).

Frogatu

Normalean Cov(X , Y ) esperimentalki estimatuko dugu, X eta Y aldagaien behaketak erabiliz. Ondoren Xc kontrol

aldagaiaren balioak lortuko ditugu, s batezbestekoaren eta bariantzaren estimazioak kalkulatuz, hortik tartezko estimazioa dugu. Arazoa Cov(X , Y ) parametroaren estimazioarekin: E [Xc,i] = s da? Xc,i behaketak independenteak dira?

Azkenik, ν = E [Y ] eta Var(Y ) ezezagunak izanez gero, beste esperimentu batekin estimatuko genituzke.

(46)

Esperimentu edo simulazioen antolaketa

Diseinu esperimentala eta datu analisia

Errendimendu parametroetan mota hauek bereiziko ditugu: I (A) Simulazio edo esperimentu batek, ausazko osagaia

izan dezakeen X parametroaren balio bakarra ematen du, ondo definitua. Adibideak: programa baten exekuzio denbora konputagailu batean, web leku baten atzipen denbora.

I (B) Balio batzuen sekuentzia ematen duen simulazioa edo esperimentua egin behar da, oro har elkarren artean independenteak izango ez diren behaketa batzuk, hauen batezbestekoarekin estimatuko da X . Adibidea: switch baten buffer-eko pakete kopurua. Nola antolatu simulazioa edo esperimentua, lortzen diren X1, . . . , Xn

(47)

Esperimentu edo simulazioen antolaketa

Diseinu esperimentala eta datu analisia

Errepika independenteen metodoa

Hemen n simulazio edo esperimentu independente egiten dira.

(A) motako parametroekin erabiltzeko metodoa da.

Simulazio bakoitzean hazia aldatu behar da era egoki batean (adibidez erloju batekin) ausazko zenbakiak sortzeko, edo beste aukera da simulazioetako ausazko zenbaki guztiak elkarren segidan sortzea.

(48)

Esperimentu edo simulazioen antolaketa

Diseinu esperimentala eta datu analisia

Exekuzio bakarraren metodoa

(B) motako parametroekin erabiltzen da.

Simulazio (edo esperimentu) bakarra exekutatzen da, m × n luzerakoa, n sorta edo tartez osatutakoa, bakoitza m

tamainakoa. Simulazioan egiten diren behaketak honela antolatzen dira:

X11, . . . , X1m, . . . , Xi 1, . . . , Xim, . . . , Xn1, . . . , Xnm

Xi = 1/mPmj =1Xij definitzen da, i . sortako m behaketen

batezbestekoa, i = 1, . . . , n sortetan.

(49)

Esperimentu edo simulazioen antolaketa

Diseinu esperimentala eta datu analisia

X aldagaiaren Xt, t = 1, . . . , u, behaketa sekuentzia emanik, k

periodoko autokobariantza honela definitzen da:

R(k) = 1 u − k u−k X t=1 (Xt− X )(Xt+k − X )

Eta autokorrelazio koefizientea da R(k)/R(0) zatidura. (R(0), X aldagaiaren bariantzaren estimatzaile alboratua da) Baldintza hau betetzen bada:

|R(k)/R(0)|  1

Xt eta Xs behaketa independentetzat hartzen dira |t − s| ≥ k

(50)

Esperimentu edo simulazioen antolaketa

Diseinu esperimentala eta datu analisia

X aldagaiaren simulazioan Xij behaketak antolatuz m

tamainako n sorta edo tartetan, guztira m × n behaketa, eta i = 1, . . . , n sorta bakoitzean Xi = 1/m

Pm

j =1Xij

batezbestekoa hartuz, Xi sekuentzia berri honen

autokobariantza hau da:

R(1) = 1 n − 1 n−1 X i =1 (Xi − X )(Xi +1 − X ) non X = 1/nPn i =1Xi

Eta autokorrelazio koefizientea:

(51)

Esperimentu edo simulazioen antolaketa

Diseinu esperimentala eta datu analisia

Behaketa independenteen hipotesia egingo dugu baldintza hau betetzen denean:

|R(1)/R(0)|  1

Adibidez |R(1)/R(0)| < 0,02 bada. Behaketa independenteak lortzeko m handia aukeratuko dugu. Balio ohikoak dira hauek: n ∝ 10, m ∝ 100.

Metodo honek bi aldaera ditu:

I NB (nonoverlapping batch), teilakatu gabeko sortak, goian azaldu den bezala.

I OB (overlapping batch), sorta teilakatuak. Behaketak sorta teilakatutan antolatzeko aukera desberdinak daude. Metodo eraginkorragoa izan daiteke.

(52)

Esperimentu edo simulazioen antolaketa

Diseinu esperimentala eta datu analisia

Metodo birsortzaileak

Prozesu estokastiko bat dugu: {X (t); t ≥ 0} sekuentzia non X (t) sistema jakin baten egoera den, denbora-parametroaren funtzioa den ausazko aldagaia (denbora jarraitua da, bestalde X aldagaiak ez dauka sistema osoa deskribatu beharrik).

Prozesua birsortzailea da baldin existitzen bada berritze egoera bat non sistema probabilistikoki berritzen den behin eta berriz.

Zikloa deitzen zaio prozesuaren gauzatzeari ondoz ondoko bi berritzeren artean. Zikloaren iraupenak itxaropen finitua izango du eta berritzeak amaiera gabe gertatuko dira.

(53)

Esperimentu edo simulazioen antolaketa

Diseinu esperimentala eta datu analisia

Errendimendu parametroaren balioa, ziklo batean X (t) aldagaiaren batezbestekoak duen itxaropena da. Ziklo guztietan itxaropen bera dugu, berritze prozesua denez.

Errendimendu parametroa esperimentalki estimatzen denean, zikloetan Xij behaketak biltzen dira (tamaina desberdineko

sortak oro har), ziklo bakoitzean Xi batezbestekoa kalkulatuz,

i = 1, . . . , n. Prozesu birsortzaile baten esperimentazioan Xi

aldagaiak independenteak dira.

Sistema konplexuetan oro har ziklo luzeak ditugu, egoerak sistema osoa deskribatzen badu, eta metodo birsortzailea ezinezkoa izan daiteke.

(54)

Selecci´

on de entradas: dise˜

nos factoriales

Diseinu esperimentala eta datu analisia

Estudio del efecto conjunto en el rendimiento de un sistema de los distintos par´ametros o factores de entrada (inputs)

multivaluados: k entradas controlables, cada uno con n valores diferentes.

Se dise˜na un experimento factorial: realizar las nk combinaciones posibles del experimento. Puede ser impracticable.

Modos de simplificar la experimentaci´on:

I mantener constantes los factores menos importantes, I considerar independientes factores que interaccionan

(55)

Selecci´

on de entradas: dise˜

nos factoriales

Diseinu esperimentala eta datu analisia

Selecci´on de factores importantes

Asignar dos valores a cada factor: 0 bajo (m´ınimo), 1 alto (m´aximo). Vector de factores:

c = (c1, . . . , ck)

donde cada ci ∈ {0, 1}

X (c) valor del par´ametro de rendimiento para un vector de entrada c.

(56)

Selecci´

on de entradas: dise˜

nos factoriales

Diseinu esperimentala eta datu analisia

Efecto principal o de primer orden del factor i -´esimo:

ei = 1 2k−1 " X c : ci=1 X (c) − X c : ci=0 X (c) #

Hip´otesis de monotonicidad, del mismo signo, de X (c) funci´on de ci, para todo c.

Valor promedio del rendimiento:

X = 1 2k

X

c

(57)

Selecci´

on de entradas: dise˜

nos factoriales

Diseinu esperimentala eta datu analisia

Si |ei|  X el factor i -´esimo no es importante. Se fija para la

entrada i -´esima un valor intermedio entre el m´ınimo y el m´aximo establecidos para el dise˜no factorial 2k.

Si ei es significativo frente a X la entrada i -´esima es un factor

importante.

Se definir´a un dise˜no factorial seleccionando los factores importantes.

(58)

Selecci´

on de entradas: dise˜

nos factoriales

Diseinu esperimentala eta datu analisia

Interacci´on entre factores importantes

Efecto de primer orden del factor i -´esimo fijando el factor j con un valor x ∈ {0, 1}: eij(x ) = 1 2k−2   X c : ci=1,cj=x X (c) − X c : ci=0,cj=x X (c)  

Efecto de orden superior, interacci´on entre los factores i y j :

eij =

eij(1) − eij(0) 2 = eji

(59)

Selecci´

on de entradas: dise˜

nos factoriales

Diseinu esperimentala eta datu analisia

Si |eij|  X : interacci´on d´ebil entre factores i y j , factores

independientes.

Si eij significativo frente a X : factores dependientes.

Criterios en el dise˜no experimental

I Para cada factor importante que no interacciona con otros factores importantes: estudiar el rendimiento para sus n valores, fijando valores intermedios para los otros factores. I Para p factores importantes que interaccionan entre si:

experimentar con np combinaciones siendo n los valores

(60)

Selecci´

on de entradas: dise˜

nos factoriales

Diseinu esperimentala eta datu analisia

Dise˜no factorial fraccional

Se eliminan algunas de las 2k combinaciones iniciales de

factores. Se sigue con el estudio de factores principales y sus interacciones.

(61)

Selecci´

on del sistema ´

optimo

Diseinu esperimentala eta datu analisia

Problema de optimizaci´on: de un conjunto de sistemas, seleccionar un sistema de acuerdo con un criterio de rendimiento, usualmente minimizando o maximizando un par´ametro de rendimiento (o una funci´on de varios).

Soluci´on trivial con estimaciones no aleatorias de los par´ametros de rendimiento.

Formulaci´on estad´ıstica del problema de optimizaci´on para estimaciones estad´ısticas de los par´ametros.

(62)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Sistemaren errendimendua aztertzen denean, sarrera parametro kontrolagarriak bi motakoak izaten dira:

I kualitatiboak, I kuantitatboak.

Sarrera kuantitatiboekin interesgarria da interpolazio eta estrapolazio teknikak erabiltzea errendimendu parametroen estimazioan.

(63)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Formulazio orokorra

Izan bedi Y errendimendu parametroa, sistema baten irteera, ausazko aldagaia (jarraitua) izango da eta x sarreraren (aldagai errealaren) funtzioa, bere batezbestekoa izanik y = f (x ).

Hipotesia: f funtzioa ezaguna da baina ez bere α1, . . . , αk

parametroen balioak,

y = f (x ; α1, . . . , αk)

Sarreraren balio batzuk x1, . . . , xn emanik, irteeraren

Y1, . . . , Yn behaketak egingo ditugu: x -en gaineko y -ren

erregresioa kalkulatzeko problema, esperimentuaren emaitzetatik α1, . . . , αk parametroak estimatzea da.

(64)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Behaketek ausazko errorea dute (ezezaguna), εi = Yi − f (xi).

Ondorengo metodoan begiratuko dugu behaketaren eta estimazioaren arteko errorea, Yi − ˆf (xi).

Karratu txikienen metodoa: minimizatu errore koadratikoen batura f funtzioko parametroen ˆα1, . . . , ˆαk estimazioekin,

QE = n X i =1 h Yi − ˆf (xi) i2

Y1, . . . , Yn behatu diren irteera balioak dira, eta

ˆ

f (x1), . . . , ˆf (xn) balioak, f (x ; ˆα1, . . . , ˆαk) funtzioarekin

estimatu diren irteera balioak, x1, . . . , xn sarrera balioetarako.

QE minimizatzen duten ˆα1, . . . , ˆαk estimazioekin dugu x -en

(65)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Gauss-Markov-en teorema

Karratu txikienen metodoak ematen dituen ˆα1, . . . , ˆαk

estimatzaileak alboragabeak dira eta bariantza minimoa dute baldintza hauek betetzen badira:

1. f (x ) linela da α1, . . . , αk parametroetan,

f (x ) = α1g1(x ) + . . . + αkgk(x )

2. Behatu diren Yi balioen erroreek ez dute alborapenik, hau

da, E [εi] = 0

(66)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Beraz, teoremaren baldintzak betetzen badira, karratu txikienen metodoa erabiliz:

I Estimatzaileak alboragabeak dira, hau da, E [ ˆαi] = αi.

I Var( ˆαi) bariantza minimoa da, parametroak estimatzeko

erabil litezkeen metodo guztien artean.

Esango dugu karratu txikienen metodoa hoberena dela f (x ) funtzioaren parametroak estimatzeko, funtzioa α1, . . . , αk

(67)

Erregresio analisia

Diseinu esperimentala eta datu analisia

QE funtzioa, ˆαj estimatzaileen funtzio ganbila da. Bere

minimo globala kalkulatuko dugu, ˆαj, j = 1, . . . , k,

aldagaietarako deribatu eta zeroarekin berdinduz:

n

X

i =1

gj(xi) [Yi − ˆα1g1(xi) − . . . − ˆαkgk(xi)] = 0

Ekuazio sistemaren adierazpen matriziala:

Π ˆα = θ

Π matrizeak k × k tamaina du, θ bektorea da (zutabe bektorea), eta ˆα ekuazio sistemako ezezagunen bektorea.

(68)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Adibidea

Funtzio honekin, x -en gaineko y -ren erregresioa kalkulatu:

f (x ) = α1+ α2x + α3x2

Sarrera jakin batzuk emanik, xi, i = 1, . . . , n, hauei dagozkien

Yi behaketak bildurik, deduzitu ˆα1, ˆα2, ˆα3 estimatzaileen

(69)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Erregresio lineala

Orain Y irteera aldagaiaren y batezbestekoa x sarreraren funtzio lineala da:

y = α + β x

QE errore koadratikoa, α eta β parametroen estimatzaileen

funtzio ganbila, minimizatuz:

ˆ β = n X i =1 (xi − x) Yi / n X i =1 (xi − x)2 ˆ α = Y − ˆβ x non x =Pn i =1xi/n, Y = Pn i =1Yi/n

(70)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Y aldagaiaren y = α + βx batezbestekoaren estimatzailea hau da:

ˆ

Y = ˆα + ˆβ x = Y + ˆβ (x − x ) ˆ

Y estimatzailearen bariantza aztertuko dugu. Y eta ˆβ ausazko aldagai independenteak dira, beraz:

Var( ˆY ) = Var(Y ) + (x − x )2Var( ˆβ)

Y1, . . . , Yn behaketak independenteak izanik, hau deduzitzen

da: Var( ˆY ) = σ2  1 n + (x − x )2 Pn i =1(xi − x)2 

(71)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Var( ˆY ) bariantza x -en funtzioa da, honelakoa: bere balio minimoa σ2/n da, sarrera x = x denean, n-rekin txikiagotuz

doa, gehikuntza koadratikoa du |x − x | > 0 denean. Y aldagaiaren eta honen behaketen σ2 bariantzaren estimatzaile alboragabea hau da:

δ2 = 1 n − 2 n X i =1 (Yi − ˆYi)2 = QE n − 2

non ˆYi = ˆf (xi) = ˆα + ˆβxi. Eta Var( ˆY ) estimatzeko:

ν2 = δ2  1 n + (x − x )2 Pn i =1(xi − x)2 

(72)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Behaketa esperimentalak egin ondoren, sarrera konkretu bat x emanik (ez du izan behar behaketetako xi bat), irteeraren

(batezbestekoaren) estimazioa ˆY = ˆα + ˆβx da eta honen konfiantza tartea eta maila lortu nahi ditugu.

Konfiantza tartea eta maila kalkulatzeko orain ( ˆY − y )/ν aldagai normalizatua hartuko dugu, non x finkatuta dagoen. Hemen y = f (x ) = α + βx dugu eta ˆY -ren desbiderapen estandarraren estimazioa da ν, emandako x -erako.

Aldagai normalizatu honek t-banaketa du, n − 2 askatasun gradukoa. (Hipotesia: Yi − f (xi) behaketa erroreek banaketa

normala dute.)

(73)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Eredu orokorraren egokitasuna

Irizpide erraz bat dugu, x -en gaineko y -ren erregresioan, y = f (x ; α1, . . . , αk) ereduaren egokitasuna kuantifikatzeko.

Lehenik, batezbestekoaren inguruko aldakuntza totala:

QT = n

X

i =1

(Yi − Y )2

Errore koadratikoaren minimoa:

QE = n

X

i =1

(74)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Hau da irizpidea:

QE/ QT → 0

Errorearen jatorriak hauek izaten dira:

I neurketan akats handiak egitea, neurketa kopuru txikiegia hartzea,

I eredu desegokia erabiltzea, gehiegizko sinplifikazioak egitea eredua definitzeko hipotesietan.

Bestalde, irizpide honekin kontuan izan behar da gehiegizko doikuntzaren arazoa (overfitting).

(75)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Zenbait kontu

Erregresio funtzioren linealizazioa aztertuko dugu, erregresio funtzioa parametroetan lineala ez denean.

Adibidea: f (x ) = aebx funtzioa linealizatu logaritmoa hartuz.

Karratu txikienen metodoarekin, Gauss-Markov-en teoremaren hipotesian, behatutako g (Yi) balio berrien ausazko errorean ez

dago alborapenik?

(76)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Adibidea

Aztertuko dugu zerbitzari baten erantzun-denbora, bezero aktiboen kopuruaren funtzio bezala. Taulako datu

esperimentalekin y = axb ereduaren parametroak estimatu.

Lortu bezero kopuruaren maximoa, erantzun-denbora izan dadin 3 segundo baino txikiagoa ehuneko 95aren konfiantza mailarekin.

x 2 4 6 8 10 12

y 0,09 0,25 0,45 0,60 0,85 1,45 x 14 16 18 20 22 y 1,80 2,15 2,55 3,00 3,40

(77)

Erregresio analisia

Diseinu esperimentala eta datu analisia

Erregresio anizkoitza

y = f (u, v , w , . . . ; α1, α2, . . .)

Karratu txikienak, Gauss-Markov teorema.

Eredua konplexuagoa egiten da. Behar den behaketa kopurua oso handia da.

(78)

Sarrera

Probabilitate ereduak eta berritze prozesuak

Konputagailu sistema eta komunikazio sareetarako eredu probabilistikoek bi oinarri hauek dituzte:

I Berritze teoria: prozesu birsortzaileak. I Markov kateak.

Sistemak analizatu eta errendimendua ebaluatzeko bidea eskaintzen dute eredu hauek.

Eredu esponentzialek, hauen oroimengabetasunak, analisi matematikoa errazten du.

(79)

Sarrera

Probabilitate ereduak eta berritze prozesuak

Adibidea. IQ pakete-kommutagailurako (Input-Queueing Packet Switch) eredu probabilistikoa:

Input Output i2 j3 g2 h2 d1 e1 f1 a1 b3 c4 × × × × × c × × × j b × g h i × × × d e a f × × 4 3 2 1 4 3 2 1 4 × 4 Switch T = 0 6 5 4 3 2 1 Time

(80)

Sarrera

Probabilitate ereduak eta berritze prozesuak

Eredu hau Markov kate bat da eta egoeren limiteko

probabilitateak kalkulatzen dira. Kommutagailuaren erabilera, sarrera/irteera kopuruaren arabera:

N Erabilera 1 1,00 2 0,75 3 0,68 4 0,65

Analisi asintotikoa eginez frogatzen da erabilera 2 −√2 = 0,59 limiterantz doala N → ∞ badoa.

(81)

Eredu esponentzialak

Probabilitate ereduak eta berritze prozesuak

Izan bedi X ausazko aldagaia, balioak [0, ∞) tartean hartuz banaketa funtzio hau duena:

F (x ) = 1 − e−λx

Banaketa esponentziala deitzen zaio, λ > 0 parametroduna. X ausazko aldagai jarraitua da, deribatuz probabilitate dentsitatea dugu: f (x ) = λe−λx

Frogatu ondorengoa: E [X ] = 1 λ Var(X ) = 1 λ2 CV(X ) = 1

(82)

Eredu esponentzialak

Probabilitate ereduak eta berritze prozesuak

Esango dugu X ausazko aldagaia oroimengabea dela baldin edozein s, t ≥ 0 baliorako:

P{X > s + t | X > s} = P{X > t}

Oroimengabetasunaren interpretazioa.

Frogatu formulazio baliokidea dela hau:

P{X > s + t} = P{X > s} · P{X > t}

Propietatea. Banaketa esponetziala duen ausazko aldagaia oroimengabea da.

(83)

Eredu esponentzialak

Probabilitate ereduak eta berritze prozesuak

Ausazko aldagai oroimengabeak:

I banaketa esponentziala (aldagai jarraitua) I banaketa geometrikoa (aldagai diskretua)

Adibidea

Aldagai oroimengabe bati dagozkion probabilitate batzuk kalkulatu.

(84)

Eredu esponentzialak

Probabilitate ereduak eta berritze prozesuak

X1 eta X2 ausazko aldagaien minimoa definituko dugu:

X = min(X1, X2)

X (ω) = min{X1(ω), X2(ω)} izango da edozein ω laginerako.

Propietatea. X1 eta X2 ausazko aldagai esponentzialak badira,

λ1 eta λ2 parametrodunak hurrenez hurren, eta aldagai

independenteak badira, orduan X = min(X1, X2) ausazko

aldagaia esponentziala da eta λ1 + λ2 parametroa du.

(85)

Eredu esponentzialak

Probabilitate ereduak eta berritze prozesuak

Beraz, X1 eta X2 esponentzialak eta independenteak badira,

minimoaren itxaropena, X = min(X1, X2) ausazko aldagaiaren

itxaropena, hau da:

E [X ] = 1 λ1+ λ2

(86)

Eredu esponentzialak

Probabilitate ereduak eta berritze prozesuak

Propietatea. X1 eta X2 ausazko aldagai esponentzialak badira,

λ1 eta λ2 parametrodunak, eta aldagai independenteak badira,

orduan: P{X1 < X2} = λ1 λ1+ λ2 Antzera, P{X2 < X1} = λ2/(λ1 + λ2) Frogatu Adibidea

(87)

Eredu esponentzialak

Probabilitate ereduak eta berritze prozesuak

Erlang-en n etapako banaketa adarkatua

Izan bitez X1, X2,. . . ,Xn ausazko aldagai esponentzialak eta

independenteak. X ausazko aldagaia definituko dugu:

X =        X1 p = q1 probabilitatearekin X1+ X2 p = (1 − q1)q2 probabilitatearekin · · · · X1+ . . . + Xn p = (1 − q1) . . . (1 − qn−1)

Adierazi banaketa honen definizioa grafiko baten bidez. Banaketa esponentziala orokortzen du, CV(X ) 6= 1 duten ausazko aldagaietarako. Ez da banaketa esponentziala baina eredu markovtarrak definitzeko aukera ematen du etapak kontsideratuz.

(88)

Eredu esponentzialak

Probabilitate ereduak eta berritze prozesuak

Propietatea. Edozein aldakuntza koefiziente emanik, CV ≥ 1/√n, non n osokoren bat den, orduan existitzen da Erlang-en n etapako banaketa adarkatua CV(X ) = CV izanik. Bereziki, λ1 = . . . = λn = λ eta q1 = . . . = qn−1 = 0 hartuz,

orduan CV(X ) = 1/√n dugu. Frogatu

Adibidea

Aztertu ausazko aldagai hipo-esponentzialak, CV(X ) < 1, eta hiper-esponentzialak, CV(X ) > 1.

(89)

Berritze prozesuak

Probabilitate ereduak eta berritze prozesuak

Berritze prozesua deitzen zaio X1, X2, . . . ausazko aldagai

ez-negatiboen sekuentziari, baldin independenteak badira eta probabilitate banaketa bera badute. Aldagai hauen itxaropen komuna adieraziko dugu m = E [Xn] idatziz, n = 1, 2, . . ., eta

0 < m < ∞ izango da. Berritze arteko denborak bezala interpretatuko ditugu: Xn ausazko aldagaia, (n − 1)-garren

berritzetik n-garren berritzea arte igaro den denbora da. Berritze denborak ere definituko ditugu:

Tn= n X i =1 Xi , n = 1, 2, . . . Adibidea

(90)

Berritze prozesuak

Probabilitate ereduak eta berritze prozesuak

N(t) ausazko aldagaia definituko dugu t ≥ 0 bakoitzerako, t denbora arte izandako berritzeen kopurua bezala: N(t) = n baldin Tn ≤ t < Tn+1 (hasieran N(t) = 0 da, t < T1).

Propietatea. Berritze prozesuan (limite hau existitzen da):

limt→∞

N(t) t =

1 m

Definizioz, berritze tasa da 1/m, denbora unitateko berritze kopurua, m = E [Xn] izanik.

(91)

Berritze prozesuak

Probabilitate ereduak eta berritze prozesuak

Prozesu estokastikoa, ausazko gertaera diskretuen denborazko sekuentzia litzateke.

Formalki, prozesu estokastikoa definitzen da lagin espazio baten gaineko ausazko aldagaien bilduma bezala:

I {X (t), t ≥ 0} denbora jarraituko prozesu estokastikoaren denbora parametroak balio errealak hartzen ditu,

t ∈ R, ∀t ≥ 0

I {Xn, n = 0, 1, . . .} denbora diskretuko prozesu

estokastikoaren denbora indizeak osoko balioak hartzen ditu, n ∈ Z, ∀n ≥ 0

Esango dugu, hurrenez hurren, prozesu estokastikoa X (t) egoeran dela t denboran edo Xn egoeran dela n denboran.

(92)

Berritze prozesuak

Probabilitate ereduak eta berritze prozesuak

Denbora jarraituko prozesu estokastiko mota bat kontaketa prozesua da, {N(t), t ≥ 0}, non N(t) aldagaia, t denbora arte izan diren gertaeren kopurua den.

Kontaketa prozesuan, gertaeren arteko denborek berritze prozesua definitzen dute baldin independenteak badira eta probabilitate banaketa bera badute (berritzeak lirateke gertaerak).

Adibidea

(93)

Poisson prozesuak

Probabilitate ereduak eta berritze prozesuak

Poisson prozesua deitzen zaio {N(t), t ≥ 0} kontaketa prozesuari baldin etorrera (gertaera) arteko denborak

esponetzialak badira eta berritze prozesua definitzen badute.

X1, X2, . . . aldagaien itxaropen komuna m = 1/λ bezala

idazten da, non λ etorrera tasa (berritze tasa) den, hori da etorrera arteko denbora esponetzialen parametroa.

Esango dugu Poisson prozesua oroimengabea dela: s unea emanik, hurrengo etorrera arte igaroko den X denbora

(banaketa esponetziala du λ parametrokoa) independentea da {N(t), 0 ≤ t ≤ s} aldagai bildumatik, s unearen aurreko historiatik.

(94)

Poisson prozesuak

Probabilitate ereduak eta berritze prozesuak

Poisson prozesuaren oroimengabetasunaren ondorioak dira bi propietate hauek.

I Gehikuntza independenteak: bi tarte disjuntu hartuz, t1 < t2 ≤ t3 < t4, orduan N(t2) − N(t1) eta

N(t4) − N(t3) etorrera kopuruak ausazko aldagai

independenteak dira.

I Gehikuntza geldikorrak: N(s + t) − N(s) etorrera kopuruaren probabilitate banaketa ez dago s denboraren menpean, inbariantea da denbora tartea desplazatuz, banaketa soilik tartearen iraupenaren (t) funtzioa da.

Adibidea

Kontaketa prozesuetan aztertu gehikuntzak independenteak eta geldikorrak diren.

(95)

Poisson prozesuak

Probabilitate ereduak eta berritze prozesuak

Propietatea. Izan bedi {N(t), t ≥ 0} Poisson prozesua, λ etorrera tasa duena. Hau da t iraupeneko denbora tartean etorrera kopurua k = 0, 1, 2, . . . izateko probabilitatea:

P{N(s + t) − N(s) = k} = P{N(t) = k} = e

−λt(λt)k

k!

N(s + t) − N(s) ausazko aldagaiaren itxaropena eta bariantza (gehikuntza geldikorrak ditugu) hauek dira:

E [N(t)] = λt

(bagenekien limt→∞N(t)/t = λ dela)

(96)

Poisson prozesuak

Probabilitate ereduak eta berritze prozesuak

Adibidea

Poisson prozesu batean probabilitateak kalkulatu.

Poisson prozesuan X1, X2, . . . etorrera arteko denborak ausazko

aldagai independenteak dira eta λ (etorrera tasa) parametroko banaketa esponentziala dute. Bestalde, hau da n-garren etorrera denbora:

Tn= X1+ X2+ . . . + Xn

Lehenik, T1, T2, . . . etorrera denborak ez dira ausazko aldagai

(97)

Poisson prozesuak

Probabilitate ereduak eta berritze prozesuak

Tn etorrera denborak Erlang-en n etapako banaketa du:

Erlang-en banaketa adarkatu gabea, etapa guztiak parametro berdinarekin. Hauek dira beraz batezbestekoa eta bariantza:

E [Tn] = n λ Var(Tn) = n λ2 Adibidea

(98)

Prozesu birsortzaileak

Probabilitate ereduak eta berritze prozesuak

{X (t), t ≥ 0} denbora jarraituko prozesu estokastikoa,

prozesu birsortzailea dela esaten da baldin berritze prozesu bat badu elkartuta non berritze bakoitzarekin prozesu

estokastikoak aurrera jarraitzen duen hasieratik abiatuko balitz bezala, hau da, hasieran eta berritze bakoitzean, T0, T1, T2. . .

denboretan, {X (t), t ≥ s | Tn = s} ondorengo prozesuak

probabilitate egitura bera du, aurreko historiatik

independentea dena. Ondoz ondoko bi berritzek prozesu birsortzailearen zikloa mugatzen dute.

Adibidea

(99)

Prozesu birsortzaileak

Probabilitate ereduak eta berritze prozesuak

Denbora jarraituko prozesu estokastikoan, j egoera bakoitzerako, proportzio hauek definituko ditugu:

I prozesua j egoeran dagoen denbora proportzioa, T denbora batean, hau da, T (j )/T zatikia, non T (j ), prozesua hasieratik T arte j egoeran egon den denbora totala den,

I prozesua j egoeran izateko probabilitatea, t une jakin batean, P{X (t) = j } bezala adieraziko duguna.

Propietatea. Baldin {X (t), t ≥ 0} prozesu birsortzailea bada eta berritze arteko denborak ausazko aldagai jarraituak badira, orduan, edozein j egoerarako, existitzen dira eta berdinak dira, egoeraren denbora proportzioa eta probabilitatea, denboraren limitean:

(100)

Prozesu birsortzaileak

Probabilitate ereduak eta berritze prozesuak

Pj = limt→∞P{X (t) = j } = limT →∞T (j )/T

Egoeren limiteko probabilitateak balantza ekuazioen bidez kalkulatzen dira.

Esango dugu s unean i egoeratik j egoerarako trantsizioa gertatu dela baldin X (s − ) = i bada,  → 0, eta X (s) = j ; esango dugu gainera j egoerarako bisita gertatu dela.

T denbora baterako, kalkulatuko ditugu ni →j/T trantsizio

tasa eta ni/T bisita tasa. Prozesu birsortzailean existitzen dira

(101)

Prozesu birsortzaileak

Probabilitate ereduak eta berritze prozesuak

Hauek dira prozesu birsortzailearen balantza ekuazioak:

j egoerarako bisita tasa = = P

i i egoeratik j egoerarako trantsizio tasa

j egoera bakoitzerako.

Ekuazio hauetatik lortuko ditugu egoeren Pj probabilitateak

(102)

Etorrerak dituen sistema birsortzailea

Probabilitate ereduak eta berritze prozesuak

Izan bedi {N(t), t ≥ 0} kontaketa prozesua, R1, R2, . . . sari

sekuentziari elkartutakoa: R(t) =PN(t)

i =1 Ri da t denborako sari

metatua. Sariak ausazko aldagaiak dira, probabilitate banaketa bera dutenak (eta E [Ri] < ∞).

Gainera, izan bedi {X (t), t ≥ 0} prozesu birsortzailea non X (t) sistemako bezero kopurua den: bezeroak sistemara λ tasaren arabera etortzen dira, bezero bakoitza sisteman ausazko denbora bat egoten da, i -garren bezeroak Ri saria

ematen dio sistemari eta gero sistematik irteten da. Prozesu birsortzailearen ziklo batean emandako sariak independenteak dira aurreko zikloetako sarietatik.

(103)

Etorrerak dituen sistema birsortzailea

Probabilitate ereduak eta berritze prozesuak

Etorrerak dituen sistema birsortzailea deskribatu ondoren, honelako sistema batean erabilgarria den irabazi tasa definituko dugu: G = limT →∞R(T )/T

Kostu ekuazioa dugu irabazi tasarako:

G = λ E [Ri]

Frogatu

Ekuazio honetan kostuaren egitura zehaztuz hainbat lege ondorioztatzen dira.

(104)

Etorrerak dituen sistema birsortzailea

Probabilitate ereduak eta berritze prozesuak

Little-ren legea

L = λ W

I W da bezeroak sisteman egoten diren denboraren batezbestekoa

I L da sisteman dauden bezeroen kopuruaren batezbestekoa Frogatu

(105)

Etorrerak dituen sistema birsortzailea

Probabilitate ereduak eta berritze prozesuak

Orain, etorrerak dituen sistema birsortzaile bereziagoa kontsideratuko dugu, zerbitzua duena: bezeroa sisteman dagoen bitartean, denboraren zati bat zerbitzuaren zain dago, eta denboraren beste zatia zerbitzua jasotzen.

Sistemak zerbitzari bat edo gehiago izango ditu. Denborako une bakoitzean zerbitzaria geldirik egondo da edo bestela bezero bat zerbitzatzen.

(106)

Etorrerak dituen sistema birsortzailea

Probabilitate ereduak eta berritze prozesuak

Erabilera legea. Zerbitzari bakarra duen sisteman:

U = λ S

I S da bezeroen zerbitzu denboraren batezbestekoa I U da sistema bezeroei zerbitzua ematen ari den denbora

zatikia Frogatu

Sistemaren erabilera deitzen zaio U balioari; U = 1 − P0 da,

non P0 = limt→∞P{X (t) = 0} (baldin sistema bezeroak

(107)

Etorrerak dituen sistema birsortzailea

Probabilitate ereduak eta berritze prozesuak

Geroago erabiliko den emaitza tekniko bat aipatuko dugu. Orain X (t) sistema baten egoera izango da (ez da nahitaez bezero kopurua).

Etorrera teorema (PASTA)

Bezeroak sistemara Poisson prozesuaren arabera iristen badira eta {X (t), t ≥ 0} prozesu birsotzailea bada, berritze arteko denbora jarraituak dituena, orduan Aj = Pj dugu edozein j

egoerarako, definizio hauekin:

I Aj da sistema j egoeran izateko probabilitatea bezero bat sisteman sartu aurreko une zehatzean,

(108)

Etorrerak dituen sistema birsortzailea

Probabilitate ereduak eta berritze prozesuak

M/M/1 itxarote-lerroa

Hau da itxarote-lerroaren eredu errazena:

I Poisson prozesuaren araberako etorrerak (M) I zerbitzu denbora esponentziala (M)

I zerbitzari bakarra (1)

X (t) ausazko aldagaiak adieraziko du itxarote-lerroan t unean dauden bezeroen kopurua: lehenengo iritsi dena zerbitzua jasotzen izango da eta besteak itxaroten. Izan bedi λ etorrera tasa eta µ zerbitzu esponentzialen parametroa: baldin λ < µ bada, orduan {X (t), t ≥ 0} prozesu birsortzailea da.

Kontsidera dezakegu prozesua berritzen dela itxarote-lerroa hutsik geratzen den bakoitzean.

(109)

Etorrerak dituen sistema birsortzailea

Probabilitate ereduak eta berritze prozesuak

Batez besteko balioaren analisiak (MVA) formula hauek ematen dizkigu: W = 1 µ − λ L = λ µ − λ U = λ µ Frogatu

Prozesu estokastiko honetan egoerek dituzten probabilitateak lortzeko, balantza ekuazioak idatzi behar dira, ez da nahikoa MVA analisia.

(110)

Etorrerak dituen sistema birsortzailea

Probabilitate ereduak eta berritze prozesuak

Adibidea

(111)

Denbora diskretuko Markov kateak

Markov kateak

Prozesu estokastikoaren probabilitate egitura zehaztuko dugu, ereduaren analisia egin eta egoeren probabilitateak kalkulatu ahal izateko.

Oroimengabetasun propietate bat, Markov propietatea, betetzen duten probabilitate eredu errazak definituko ditugu. Propietate honek prozesu estokastikoaren analisia egiteko aukera ematen du (antzekoa gertatzen da Poisson prozesuak edo banaketa esponetzialak aztertzen direnean).

(112)

Denbora diskretuko Markov kateak

Markov kateak

Izan bedi {Xn, n = 0, 1, . . .} denbora diskretuko prozesu

estokastikoa. Prozesua n denboran j egoeran badago, Xn= j

idatziko dugu. Egoera multzoa zenbakigarria da, finitua ala infinitua: 0, 1, 2 . . . egoerak ditugu.

Prozesu estokastiko hori Markov katea da baldin, edozein n denbora eta j egoerarako, hau betetzen bada:

P{Xn+1 = j | X0, . . . , Xn−1, Xn} = P{Xn+1 = j | Xn}

Honela interpretatuko genuke definizioa: Xn egoera emanik,

Xn+1 egoera independentea da X0,. . . , Xn−1 egoeretatik, hau

da, egungo egoera jakinik, hurrengo egoera independentea da iraganeko egoeretatik.

(113)

Denbora diskretuko Markov kateak

Markov kateak

Prozesu estokastikoa i egoeran izanik, pauso batean j egoerara trantsizioa egiteko probabilitateari, trantsizio probabilitatea deitzen zaio:

P{Xn+1 = j | Xn = i } = Pij

Probabilitate baldintzatu hau ez da izango n denboraren menpekoa. Trantsizio matrizea dugu, probabilitateak lerro eta zutabeetan i eta j egoeren arabera idatziz:

P =      P00 P01 P02 · · · P10 P11 P12 · · · P20 P21 P22 · · · .. . ... ... . ..     

(114)

Denbora diskretuko Markov kateak

Markov kateak

P matrizearen sarrerak ez-negatiboak dira eta lerro bakoitzean P

j Pij = 1 betetzen da: i egoera bakoitzerako, j egoera

desberdinetarako trantsizio probabilitateen batura 1 da.

Matrizearen diagonaleko Pii sarrerak, egoera batetik egoera

bererako trantsizio probabilitateak dira.

Adibidea

(115)

Denbora diskretuko Markov kateak

Markov kateak

Pauso bateko Pij trantsizio probabilitateek Markov katearen

probabilitate egitura guztiz zehazten dute (hasierako egoera emanik). Orain, n pausoko trantsizio probabilitateak lortzea nahi dugu.

Propietatea. Pauso bateko trantsizio probabilitateak jakinik:

P{Xm+n = j | Xm = i } = (Pn)ij

Frogatu

Pijn idatziko dugu probabilitate baldintzatu hau adierazteko: prozesu estokastikoa i egoeran izanik, n pausotan j egoerara trantsizioa egiteko probabilitatea; Pn matrizeko (i , j ) sarreran

(116)

Denbora diskretuko Markov kateak

Markov kateak

Hasierako egoera finkatu ordez, n = 0 denboran i egoera desberdinentarako probabilitateak ezagutzen baditugu,

αi = P{X0 = i }

orduan n denboran edozein j egoerarako ondorengo probabilitate ez-baldintzatua kalkulatuko dugu.

Propietatea P{Xn = j } = X i αiPijn Frogatu Adibidea

(117)

Egoerak sailkatzea

Markov kateak

Egoerak sailkatuko ditugu, prozesu estokastikoak denboran zehar izango duen bilakaera aztertzeko.

Prozesua i egoeratik abiatu bada, Ti ausazko aldagaiak

adieraziko du prozesua i egoerara noiz itzuliko den; Ti = ∞

idatziko dugu inoiz ez bada itzultzen.

Prozesua hasierako i egoerara noizbait itzultzeko probabilitatea definituko dugu:

(118)

Egoerak sailkatzea

Markov kateak

Esango dugu i egoera:

I errepikaria dela baldin fi = 1, hau da, i egoeratik abiatuz

prozesua beti itzultzen da (1 probabilitatearekin) hasierako egoerara,

I iragankorra dela baldin fi < 1, hau da, i egoeratik abiatuz

badugu probabilitate positibo bat (1 − fi) prozesua

hasierako egoerara inoiz ez itzultzeko.

Bereizketa hau egiten da i egoera errepikaria denean: errepikari positiboa da baldin E [Ti| X0 = i ] < ∞ eta errepikari nulua da

(119)

Egoerak sailkatzea

Markov kateak

Izan bedi Ni prozesu estokastikoak i hasierako egoerara egingo

dituen bisiten kopurua. Baldin:

I hasierako egoera errepikaria bada Ni = ∞ izango da,

I hasierako egoera iragankorra bada Ni < ∞ izango da,

banaketa geometrikoa du Ni ausazko aldagaiak kasu

(120)

Egoerak sailkatzea

Markov kateak

Egoerak periodikotasunaren arabera ere sailkatuko ditugu: I Esango dugu i egoera errepikariak d ≥ 2 periodoa duela,

baldin Piin= 0 bada periodoaren multiploa ez den edozein n osokorako, d izanik propietate hori betezen duen osoko handiena.

I Propietate hori betetzen duen d ≥ 2 osokorik ez bada existitzen, edo egoera iragankorra bada, esango dugu i egoera aperiodikoa dela.

Beraz i egoera periodikoa bada, d periododuna, prozesu estokastikoa i egoeratik abiatuz, i egoerara itzuliko da soilik d , 2d , 3d , . . . denboretan, ez derrigor denbora guzti horietan.

Azkenik, egoera bat ergodikoa dela esaten da errepikari positiboa eta aperiodikoa bada.

(121)

Egoerak sailkatzea

Markov kateak

Egoera posible guztien multzoaren partiketa definituko dugu baliokidetasun erlazio baten bidez.

Esango dugu i egoeratik j egoerara hel gaitezkeela, i → j idatziz, existitzen bada n osokoren bat Pijn> 0 izanik. Esango dugu i eta j egoerak komunikatzen direla, i ↔ j idatziz, baldin i → j eta j → i betetzen bada.

Propietatea. Egoeren arteko → erlazioa iragankorra da eta ↔ komunikazio erlazioa baliokidetasun erlazio bat da.

Frogatu

Komunikazio erlazioak induzitutako baliokidetasun klaseak, komunikazio klaseak, egoera multzoaren partiketa bat dira.

(122)

Egoerak sailkatzea

Markov kateak

Markov kate bat laburtezina dela esaten da baldin egoera multzoak komunikazio klase bakarra badu, egoera guztiak elkarren artean komunikatzen badira.

Komunikazio klase bat itxia da baldin ezinezkoa bada klasekoa ez den egoera batera heltzea bertako egoeretatik: klase itxiko egoera batera iristen denean prozesu estokastikoa, klasetik ez da irtengo inoiz.

Klase itxiak egoera bakarra badu, honi egoera xurgatzailea deitzen zaio. Bestalde, Markov kate laburtezinean, egoera multzoaren klase bakarra itxia da.

(123)

Egoerak sailkatzea

Markov kateak

Propietatea

I Komunikazio klase ez-itxi bateko egoera guztiak iragankorrak dira.

I Egoera kopurua finitua bada, komunikazio klase itxi bateko egoera guztiak errepikariak (positiboak) dira. I Egoera kopurua infinitua bada, klase itxi bateko egoera

guztiak iragankorrak dira edo bestela egoera guztiak errepikariak dira (denak positiboak edo denak nuluak). I Klase batean, egoera guztiak aperiodikoak dira edo

bestela egoera guztiak periodikoak dira, denak periodo berdinekoak.

(124)

Egoerak sailkatzea

Markov kateak

Irizpide hau dugu periodikotasuna aztertzeko (baldintza nahikoa da baina ez derrigorrezkoa): baldin Pii > 0 bada

orduan i egoera aperiodikoa da. Bestalde, kontuan izango dugu klase bateko egoera guztiek periodikotasun berdina dutela.

Adibidea

Sailkatu egoerak bi Markov kate hauetan.

Esango dugu Markov kate laburtezin bat aperiodikoa dela egoerak aperiodikoak badira, eta ergodikoa dela egoerak ergodikoak badira.

(125)

Limiteko probabilitateak

Markov kateak

Markov katearen Pij trantsizio probabilitateak jakinik, denbora

diskretuko prozesu estokastiko honetan, egoera bakoitzaren limiteko probabilitatea kalkulatu nahi dugu:

πj = limn→∞P{Xn = j }

Markov kate laburtezinak kontsideratuko ditugu: egoera kopurua finitua bada, egoerak errepikariak (positiboak) dira; infinitua bada, egoerak errepikariak (positiboak edo nuluak) dira edo bestela iragankorrak.

(126)

Limiteko probabilitateak

Markov kateak

Hauek dira Markov kate laburtezinerako balantza ekuazioak, normalizazio ekuazioa ere gehituz:

πj = X i πiPij , j = 0, 1, . . . X j πj = 1

Egoera kopurua finitua bada, egoerak errepikariak (positiboak) dira eta balantza ekuazioek soluzioa dute, π = (π0, π1, . . .),

soluzio bakarra eta positiboa.

(127)

Limiteko probabilitateak

Markov kateak

Egoerak aperiodikoak badira, egoeren limiteko probabilitateak ditugu, prozesuaren hasierako egoeraren menpean ez

daudenak: πj = limn→∞Pijn. Egoerak periodikoak badira,

denbora proportzioak dira πj hauek.

Egoera kopurua infinitua bada, balantza ekuazioek

(normalizazio ekuazioarekin batera) soluzioa dute baldin eta soilik baldin egoerak errepikari positiboak badira (horrela bada, soluzioa bakarra eta positiboa da).

Egoera kopurua infinitua izanik, baldin egoerak iragankorrak edo errepikari nuluak badira, orduan limiteko probabilitateak nuluak dira.

(128)

Limiteko probabilitateak

Markov kateak

Ekuazioen adierazpen matriziala hau da:

π = πP π1 = 1 non π = π0 π1 . . . , 1 =  1 1 . . .  T eta P trantsizio matrizea den. Adibidea

Baldin π = πP, π1 = 1 ekuazioen soluzioa bada π, banaketa geldikorra deitzen zaio, πsd idazkera erabiliz.

(129)

Limiteko probabilitateak

Markov kateak

Propietatea. Hasierako egoera desberdinetarako probabilitateek πsd banaketa geldikorra badute, orduan edozein n denborako

egoera posibleen probabilitateek ere πsd banaketa dute.

Frogatu

(130)

Denbora jarraituko Markov kateak

Markov kateak

Markov propietatea betetzen duten denbora jarraituko prozesu estokastikoak aztertuko ditugu.

Izan bedi {X (t), t ≥ 0} denbora jarraituko prozesu

estokastikoa, egoera multzo zenbakigarria duena, finitua ala infinitua. Esango dugu denbora jarraituko Markov katea (DJMK) dela baldin edozein s, t denboretarako eta j egoerarako hau betetzen bada:

P{X (s + t) = j | X (u), u ≤ s} = P{X (s + t) = j | X (s)}

Probabilitate baldintzatu hau ez da s denboraren menpekoa izango, baina oro har t denboraren menpean dago.

(131)

Denbora jarraituko Markov kateak

Markov kateak

DJMKaren definizioa honela ulertuko dugu: X (s) egoera jakinik, X (s + t) egoera independentea da u < s denboretako X (u) egoeretatik; hau da, “oraingo egoera” jakinik, edozein “etorkizuneko egoera” independentea da “iraganeko

egoeretatik”.

DJMKaren analisia zailagoa da denbora diskretuko Markov katearen (DDMK) analisia baino, DJMK batean trantsizio probabilitatea t denboraren funtzioa baita (i eta j egoeren menpekoa izateaz gain):

Referencias

Documento similar

The part I assessment is coordinated involving all MSCs and led by the RMS who prepares a draft assessment report, sends the request for information (RFI) with considerations,

EXPERIMENTACIÓN: Explorando modelos de sistemas y arquitecturas entre dominios de aplicaciones dadas y el test de si esos modelos pueden predecir nuevas conductas con

En este tra b a jo , en cambio, pretende mos ocuparnos de un caso mis general en el cual esos co e ficientes sean funciones periôdicas del tiempo. Los problemas

contrario a lo que sucede en países del primer mundo en los cuales se le ha dado mayor calidad informativa a esta industria cultural. En el país se abordan los temas de moda con

Más allá de que no falta quien en el controvertido debate sobre las escuelas laicas halla la explicación a la caída de la natalidad en Australia y Francia en el hecho de que «tanto

Como la hip´ otesis que se quiere comprobar es que utilizando la informaci´ on de las detecciones de una c´ amara en el resto de c´ amaras del sistema (dos en este caso), se

El objetivo del trabajo ha sido implementar un sistema de aprendizaje adaptable para colegios de educación especial con estudiantes con TEA, con el fin de ayudar a que los alumnos

• Desarrollo de un modelo global en TRNSYS para asistir al diseño de este tipo de sistemas. • Desarrollo de un modelo basado en redes neuronales para caracterizar el