4.1 Panorama actual y perspectivas de futuro
4.1.5 La relación entre la subtitulación amateur y la profesional
Viera Labudová, Katarína Sušienková
Abstract
The entropy of a system is related to the amount of information it contains. A highly ordered system can be described using fewer bits of information than a disordered one. Shannon's formula gives the entropy =−
∑
i
i
i p
p
H log2 . The article presents the entropy as a measure of inequality of a distribution, entropy is used as a parameter that describes asymmetry of a distribution too.
Entropia ako miera koncentrácie
Nerovnomernosť rozdelenia celkovej sumy (úhrnu) hodnôt znaku medzi jednotlivé štatistické jednotky štatistického súboru nazývame v štatistike koncentráciou.
Na posúdenie sily koncentrácie možno použiť grafické zobrazenie rozdelenia hodnôt znaku v pravouhlom súradnicovom systéme, tzv. Lorenzovu krivku (koncentračnú krivku). Lorenzova krivka vznikne tak, že na os x nanášame kumulované podiely štatistických jednotiek Fi a na os y kumulované podiely hodnôt znaku Zi, ktoré prislúchajú danému podielu
štatistických jednotiek.
Vychádzajúc z Lorenzovej krivky, možno odvodiť vzťah na výpočet koeficienta koncentrácie.
Graf 1 Lorenzova krivka
Ak P je plocha ohraničená diagonálou a Lorenzovou krivkou, T je plocha trojuholníka 0BC, S plocha pod Lorenzovou krivkou a plocha štvorca so stranami o dĺžke jedna sa rovná jednej, potom plocha trojuholníka T=0,5.
Koeficient koncentrácie možno určiť1
:
1Uvedný vzťah možno ďalej upresniť, viď. Terek (2002), Pacáková ().
P
S
O B
K P T T S T S S k = = − = 0 5− = − 0 5 1 2 , , (1)
Koeficient koncentrácie nadobúda hodnoty od 0 do 1. Čím viac sa jeho hodnota blíži k jednej, tým je koncentrácia vyššia, t. j. hodnoty znaku sú rozdelené nerovnomernejšie a naopak hodnoty blížiace sa k 0 svedčia o nízkom stupni koncentrácie, teda o rovnomernom rozdelení sledovaných hodnôt znaku.
Na meranie nerovnomernosti rozdelenia hodnôt premennej možno použiť entropiu. V teórii informácií sa entropia používa ako miera apriórnej neurčitosti systému. Ak skúmame systém X, ktorý je schopný prijímať konečné množstvo stavov x1, x2, ...,xn
s pravdepodobnosťami p1, p2,...,pn, entropiou systému sa nazýva súčet súčinov
pravdepodobností rôznych stavov systému a logaritmov týchto pravdepodobností. s opačným znamienkom. =−
∑
i i i p p H log2 . (2)Systém X môžeme nahradiť diskrétnou náhodnou premennou X, ktorá nadobúda hodnoty x1, x2, ...,xn (môžu to byť napríklad poradové čísla stavu systému)
s pravdepodobnosťami p1, p2,...,pn2
Ak sa entropia rovná nule, všetky štatistické jednotky nadobúdajú rovnakú hodnotu xj.
Entropia nadobúda maximálnu hodnotu vtedy, keď sú rôzne hodnoty x1, x2, ...,xn rovnako
pravdepodobné, resp. relatívne početnosti tried x1, x2, ...,xn sú rovnaké. Maximálna hodnota
entropie sa rovná počtu rôznych obmien premennej X.
a vzťah (2) použiť na vyčíslenie entropie empirického súboru s premennou X.
Hmax =log2n. (3) Vzhľadom na to, že entropia závisí od počtu obmien premennej, pri porovnávaní entropie rôznych súborov sa používa koeficient entropie , ktorý je vyjadrený pomocou jej maximálnej hodnoty: max 1 H H WH = − . (4) Uvažujme nasledovné príklady rozdelenia pravdepodobnosti (relatívnej početnosti) náhodnej premennej X.
Tab. 1...Empirické súbory pre výpočet entropie
A B C D xi pi xi pi xi pi xi pi 1 0,2 1 0,05 1 0,02 1 0,40 2 0,2 2 0,10 2 0,03 2 0,50 3 0,2 3 0,70 3 0,05 3 0,05 4 0,2 4 0,10 4 0,50 4 0,03 5 0,2 5 0,05 5 0,40 5 0,02
2Pre opísanie miery neurčitosti systému nie sú dôležité hodnoty x
1, x2, ...,xn, podstatný je len počet týchto
Pre každý prípad A, B, C, D sú vyčíslené hodnoty entropie H a koeficienta entropie WH. Koncentrácia hodnôt znaku je najväčšia v prípade A, kedy dosahuje entropia maximum a koeficient entropie hodnotu 0. Koncentrácia hodnôt znaku v prípadoch B, C, D je nižšia (v prípade C a D rovnaká).
Tab. 2 Hodnoty rôznych mier koncentrácie
A B C D
H 2,3219 1,4568 1,5095 1,5095 WH 0 0,3723 0,3499 0,3499
Rôzny stupeň koncentrácie hodnôt znaku pre súbory A, B, C je zobrazený pomocou Lorenzovej krivky.
Graf 2 Lorenzova krivka pre súbory A, B, C
0 0,2 0,4 0,6 0,8 1 1,2 0 0,2 0,4 0,6 0,8 1 1,2 A B C
Použitie entropie pri posudzovaní asymetrie rozdelenia
Grafické zobrazenie hodnôt entropie možno použiť na posúdenie asymetrie rozdelenia náhodnej premennej X.
Graf pre posúdenie asymetrie rozdelenia je konštruovaný z kumulatívnych pravdepodobností (relatívnych početností) jednotlivých hodnôt znaku cum pi, ktoré sú
nanesené na x-ovú os a kumulatívnych „čiastkových“ koeficientov entropie cum wih, ktoré sú
nanesené na y-ovú os. Čiastkové koeficienty entropie sa počítajú podľa vzťahu: max 2 log H p p wi = i i . (5) Pri určovaní asymetrie (zošikmenia) rozdelenia hodnôt znaku v štatistickom súbore je dôležitá tzv. čiara „empirickej symetrie“. V prípade symetrického rozdelenia, graf entropie pretína túto čiaru (B), ak je zošikmenie rozdelenia pravostranné, graf entropie prechádza ponad túto čiaru (D), pri ľavostrannej asymetrii, leží čiara empirickej symetrie nad grafom entropie (C).
Graf 3 Enropia súboru B 0 0,2 0,4 0,6 0,8 1 1,2 0 0,2 0,4 0,6 0,8 1 1,2 cum pi cu m w i h A B emp . sy metria
Graf 4 Entropia súboru C
0 0,2 0,4 0,6 0,8 1 1,2 0 0,2 0,4 0,6 0,8 1 1,2 cum p i cu m w ih A C
Graf 5 Entropia súboru D 0 0,2 0,4 0,6 0,8 1 1,2 0 0,2 0,4 0,6 0,8 1 1,2 D A emp . sy metria Literatúra
1. PACÁKOVÁ V.: Štatistika pre ekonómov. Edícia Ekonómia, Bratislava, 2003
2. ROESKE - SLOMKA, I.: Entropia jako miara koncentracji i asymetrii rozkladu.. In.: Przeglad statystyczny, Nr.1, 1993, s. 61- 69.
3. TEREK M.: Miery koncentrácie, Slovenská štatistika a demografia, č. 3, 2002, ISSN 1210-1095
4. VENTCELOVÁ, J. S.: Teória pravdepodobnosti. ALFA, 1973. 5. http://dictionary.reference.com/browse/entropy
Kontakt
RNDr. Viera Labudová, PhD.,
Katedra štatistiky FHI; Ekonomická univerzita v Bratislave, Dolnozemská cesta 1, 852 35 [email protected]
Ing. Katarína Sušienková,
Katedra štatistiky FHI; Ekonomická univerzita v Bratislave, Dolnozemská cesta 1, 852 35 [email protected]
–––––––––––––––––––––––––––––––––––––––––––––––––– Uvedený príspevok vznikol ako súčasť projektu VEGA 1/2631/05