Rueda de control de - AIR CONDITIONER OWNER S MANUAL. Please read this manual carefully before

Po zaveden´ı dat ze zdrojov ých soubor ˚u do databáze je moˇzno pˇristoupit k test ˚um jednotliv ých analytick ých metod. C´ılem následuj´ıc´ıch experiment ˚u je porovnat efektivitu a vhodnost v ýstup ˚u pro zpracován´ı zadaného typu dat.

Pro úˇcel testován´ı analytick ých sluˇzeb jsem zvolil soubor s daty kurzu Mikroekono- mie A. Tento soubor sestává ze stejn ých sloupc ˚u jako soubor se zdrojov ými daty. Soubor obsahuje 65013 záznam ˚u.

Tvorba projektu analytické sluˇzby je pro vˇsechny analyzované soubory identická. Po zaloˇzen´ı nového analytického projektu je potˇreba urˇcit um´ıstˇen´ı zdrojových dat (Data Sour- ces), resp. zdrojový pohled (Data Source Views) - k tomu úˇcelu slouˇz´ı pˇr´ısluˇsné poloˇzky panelu Solution Explorer. Sloupec ”Cel ý název”jsem pouˇzil jako kl´ıˇc. Sloupec ”Kurz”je, d´ıky pˇredchoz´ımu rozdˇelen´ı záznam ˚u do zvláˇstn´ıch soubor ˚u podle hodnot sloupce ”Kurz”, zbyteˇcn ý (vˇsechny záznamy tohoto sloupce jsou v rámci jednoho souboru stejné).

Vˇsechny metody byly testovány s parametry nastaven ými na v ýchoz´ı hodnoty. Pouˇzité sloupce a veˇskeré ostatn´ı odliˇsnosti jsou vˇzdy zm´ınˇeny.

4.2.1 Test shlukovac´ıch metod

Shlukovac´ı metodu jsem pouˇzil pro anal ýzu ˇcetnosti hodnot jednotliv ých sloupc ˚u. Jako vstupn´ı hodnoty jsem pouˇzil sloupce IP adresa, ˇCas (hodnota sloupce ˇCas byla diskreti- zována), Akce a Informace. Jako kl´ıˇcov ý, jsem pouˇzil sloupec Cel ý název. Predikce nebyla poˇzadována nad ˇzádn ým sloupcem.

Anal ´yza trvala 57 sekund.

Tato metoda dává uˇzivateli k dispozici ˇctyˇri panely s grafick ými v ýstupy: Cluster Diagram, Cluster Profiles, Cluster Characteristics a Cluster Discrimination.

Panel diagramu shluk ˚u (viz obr. 3) nám umoˇz ˇnuje vidˇet vztahy mezi jednotliv ými shluky a s´ılu vazeb mezi nimi (s´ıla vazeb je pˇr´ımo úmˇerná intenzitˇe barvy spojovac´ı hrany). Barva uzl ˚u znázor ˇnuje procento z celkové populace, které shluk zastupuje (rozliˇsován´ı barvou uzl ˚u se dá zmˇenit na kter ýkoliv ze vstupn´ıch atribut ˚u).

Panel s profily shluk ˚u (viz obr. 4) je z informaˇcn´ıho hlediska ze vˇsech nejpˇr´ınosnˇejˇs´ı. Vid´ıme zde zastoupen´ı hodnot parametr ˚u v jednotliv ých shluc´ıch. Prvn´ı sloupec oznaˇcuje vstupn´ı sloupec, druh ý nejastˇeji se vyskytuj´ıc´ı hodnoty pro dan ý sloupec a shluk. Zbylé sloupce zachycuj´ı pomˇery mezi hodnotami ve shluc´ıch.

Obr´azek 3: Diagram shluk ˚u (Cluster Diagram)

Vid´ıme, ˇze napˇr. nejˇcastˇeji provádˇené akce jsou: prohl´ıˇzen´ı úvodn´ı stránky kurzu, zápis do kurzu a prohl´ıˇzen´ı blogu. Drtivá vˇetˇsina pˇrihláˇsen´ı probˇehla pˇred 30.12.2008. Ze sloupce s IP adresami vid´ıme, ˇze nejˇcasˇeji prob´ıhalo pˇrihlaˇsován´ı z adres 85.71.147.124, 78.45.87.250 a 77.242.83.208.

Panel s charakteristikou shluk ˚u (viz obr. 5) nám umoˇz ˇnuje procházet obsah jednotliv ých shluk ˚u a zjistit, s jakou pravdˇepodobnost´ı nab ývá záznam um´ıstˇen ý v daném shluku urˇcit ých hodnot.

Nástroj pro vizualizaci v ýsledk ˚u shlukovac´ı metody dále obsahuje panel cluster discrimination, kter ý umoˇz ˇnuje porovnávat dvojice zvolen ých shluk ˚u.

Shlukovac´ı metody nám umoˇz ˇnuj´ı pouˇz´ıt dva typy algoritm ˚u, v ýchoz´ı hodnota této metody je nastavena na algoritmus ˇskálovatelného EM-shlukován´ı. Rozhodl jsem se proto dále otestovat algoritmus K-pr ˚umˇer ˚u (nastaven´ım parametru CLUSTERING METHOD na hodnotu 3). Jak je vidˇet z obrázku 6, doˇslo v rozvrˇzen´ı k urˇcit ým zmˇenám.

Obr´azek 4: Profily shluk ˚u (Cluster Profiles)

Prakticky vymizely shluky, které by obsahovaly v´ıce neˇz dvˇe hodnoty - ve sloupci ˇCas se tak shluky ménˇe pˇrekr ývaj´ı. Byly zde také nalezeny dvˇe nové opakuj´ıc´ı se IP adresy (217.77.165.49 a 88.146.164.51).

Dále zde byla vyselektován shluk skupiny uˇzivatel ˚u, kteˇr´ı se zaˇcátkem semestru zapi- sovali do kurzu (cluster ˇc. 3 - záznamy z tohoto clusteru byly pravdˇepodobnˇe v pˇredchoz´ım pˇr´ıpadˇe zahrnuty do clusteru ˇc. 1). Nicménˇe i po aplikaci odliˇsné metody z ˚ustaly nˇekteré shluky zcela stejné (viz následuj´ıc´ı tabulku).

EM-shlukov´an´ı shlukov´an´ı K-mean

ˇc´ısla shluk ˚u 8 9

ˇc´ısla shluk ˚u 2 2

Obr´azek 5: Charakteristika shluk ˚u (Cluster Characteristics)

4.2.2 Test naivn´ı Bayesovy metody

Pro aplikaci naivn´ı Bayesovy metody jsem jako vstupn´ı sloupce zvolil ˇCas, Akce a IP adresa, sloupec Informace jsem pouˇzil jako predikovan ý a sloupec Celý název jako kl´ıˇcov ý.

Anal ýza trvala 48 sekund. Vizualizace v ýsledk ˚u sestává ze ˇctyˇr panel ˚u: ”Dependency network”, ”Attribute profile”, ”Attribute characteristics”, ”Attribute discrimination”.

Panel Dependency network obsahuje s´ıt’ závislost´ı. V ýsledkem této anal ýzy byla závislost hodnoty atributu Informace na hodnote atributu Akce. Lze tedy pˇredpokládat, ˇze predikovan ý sloupec Informace nen´ı v ýraznˇe závisl ý na hodnotách zbyl ých sloupc ˚u.

Panel s profily atribut ˚u 7 zobrazuje hodnoty sloupce Informace a ty hodnoty sloupce Akce, které je vyvolávaj´ı. Nen´ı pˇrekvapivé, ˇze v kurzu Mikroekonomie A je nejv´ıce za- stoupena akce zobrazuj´ıc´ı úvodn´ı stránku kurzu a k n´ı náleˇz´ı informace (tedy parametr akce) obsahuj´ıc´ı k ód kurzu Mikroekonomie A.

Vzhledem k tomu, ˇze na sloupce Akce a Informace nen´ı moˇzné aplikovat diskretizaci, je grafick ý v ýstup naivn´ı Bayesovy metody pro toto mnoˇzstv´ı hodnot pomˇernˇe nevhodn ý.

Obr´azek 6: Charakteristika shluk ˚u (Cluster Characteristics) po pouˇzit´ı algoritmu K-mean

Panel s charakteristikou atribut ˚u pro tuto anal ýzu neobsahuje ˇzádné informace a panel diskriminace atribut ˚u nám umoˇz ˇnuje porovnávat u dvojic parametr ˚u Informace pravdˇepodobnost, ˇze se objev´ı v záznamu s pˇr´ısluˇsnou hodnotou Akce.

Mimo fakt, ˇze hodnota sloupce Informace je závislá primárnˇe na hodnotˇe sloupce Akce (a tedy hodnoty sloupc ˚u ˇCas a IP adresa maj´ı celkem zanedbateln ý vliv), nepˇrinesla anal ýza naivn´ı Bayesovou metodou ˇzádné zaj´ımavé poznatky.

Obr´azek 7: Bayesova metoda - profily atribut ˚u

4.2.3 Test asocia ˇcn´ıch pravidel

Metodu asociaˇcn´ıch pravidel jsem vyzkouˇsel dvˇema zp ˚usoby. Poprvé pro zjiˇstˇen´ı pravidel závislosti mezi sloupci Akce (vstupn´ı) a Informace (predikovan ý) - jako kl´ıˇc jsem opˇet pouˇzil sloupec Celý název.

V ýpoˇcet této anal ýzy trval 29 sekund. V ýsledkem byl souhrn nalezen ých pravidel, ten je ve vizualizaˇcn´ım nástroji znázornˇen v panelu Rules (viz obr. 8).

Tato anal ýza nemá, vzhledem k závislosti mezi sloupci, která byla zjiˇstˇena v pˇredchoz´ı anal ýze, v ýznam pro hledán´ı samotn ých pravidel. Nicménˇe m ˚uˇzeme d´ıky n´ı vysledovat nejˇcastˇeji se vyskytuj´ıc´ı akce a k nim pˇr´ısluˇsej´ıc´ı parametry. Pro tento úˇcel se hod´ı panel Dependency network (viz obr. 10), kter ý zachycuje s´ıt’ závislost´ı Informac´ı na Akc´ıch. Z nˇej je zˇrejmé napˇr. ˇze nejv´ıce navˇstˇevované je diskuzn´ı f órum s ˇc´ıslem 1256. U tohoto f óra je zárove ˇn nejvyˇsˇs´ı v ýskyt poˇzadavk ˚u o zas´ılán´ı nov ých pˇr´ıspˇevk ˚u na e-mail.

Dále je napˇr. patrné, ˇze u testu ˇc. 1889 je nadpr ˚umˇernˇe vysok ý poˇcet akc´ı ”quiz view”(oznaˇcuje prohl´ıˇzen´ı podm´ınek testu) a ”quiz continue attempt”(oznaˇcuje opako-

Obr´azek 8: Asociaˇcn´ı pravidla - nalezen´a pravidla

van ý pous o absolvován´ı testu) - z toho m ˚uˇzeme vyvodit, ˇze ˇslo pravdˇepodobnˇe o obt´ıˇzn ý test.

U testu ˇc. 1885 je evidentnˇe nadpr ˚umˇern ý poˇcet akc´ı ”quiz review”(oznaˇcuje prohl´ıˇzen´ı v ýsledk ˚u absolvovaného testu) a ”quiz attempt”(oznaˇcuje vyhodnocen´ı testu), coˇz by mohlo znamenat, ˇze tento test byl absolvován velk ým poˇctem student ˚u kurzu a nav´ıc se pˇri jeho absolvován´ı student ˚um daˇrilo lépe neˇz pr ˚umˇernˇe (chyb´ı zde vazba na akci ”quiz continue attempt”- ta se pro tento test evidentnˇe vyskytovala jen podpr ˚umˇernˇe).

Podruhé jsem se pokusil pomoc´ı asociaˇcn´ıch pravidel zjistit závislost akc´ı na ˇcase. Sloupec ˇCas jse pouˇzil jako vstupn´ı, sloupec Akce jako predikovan ý a sloupec Celkový název jako kl´ıˇc. Protoˇze se dá pˇredpokládat, ˇze kardinalita sloupce ˇCas bude velmi vy- soká (soubor obsahuje záznamy za necel ý jeden rok), a v ýsledky anal ýzy by tak byly nepˇrehledné, rozhodl jsem se nad t´ımto sloupcem provést diskretizaci (akce nastavitelná pˇri tvorbˇe DM procesu).

Obr´azek 9: Asociaˇcn´ı pravidla - mnoˇzina nalezen ´ych prvk ˚u

Anal ýza trvala 31 sekund. Z vizualizace v ýsledk ˚u anal ýzy (viz obr. 11) je zˇrejmé, ˇze proces diskretizace rozdˇelil hodnoty sloupce ˇCas na 5 obdob´ı. Ze s´ıtˇe závislost´ı je evidentn´ı, ˇze napˇr. zat´ımco zobrazován´ı úvodn´ı stránky kurzu prob´ıhá po cel ý rok, tak napˇr. prohl´ıˇzen´ı blog ˚u prob´ıhá aˇz od konce ledna a odhlaˇsován´ı z kurzu prob´ıhá aˇz na konci roku.

4.2.4 Test neuronov ´ych s´ıt´ı

Pro test metody neuronov ých s´ıt´ı jsem zvolil jako vstupn´ı parametry sloupce Akce, IP adresa a ˇCas (diskretizován). Predikován byl sloupec Akce a jako kl´ıˇc slouˇzil sloupec Celý název. Anal ýza probˇehla za 38 sekund. MS SQL Server vybral ze sloupce Akce pro predikci hodnoty ”quiz view”a ”forum add post”. Pravdˇepodobnost uskuteˇcnˇen´ı tˇechto akc´ı pak provádˇel na základˇe IP adresy, pˇr´ıpadnˇe ˇcasového obdob´ı (viz obr. 12).

Obr´azek 10: Asociaˇcn´ı pravidla - s´ıt’ z´avislost´ı informac´ı na akc´ıch

Dvojice hodnot, jejichˇz pravdˇepodobnost je pomˇeˇrována je moˇzno dále volit, nicménˇe ne vˇzdy je moˇzné pro vˇsechny dvojice pravdˇepodobnost dopoˇc´ıtat a zobrazit grafick ý v ýstup.

Tato metoda pro zadan ý soubor dat nen´ı pˇr´ıliˇs vhodná. Poblém vid´ım opˇet v tom, ˇze nen´ı moˇzné provést diskretizaci ˇzádného sloupce kromˇe sloupce s ˇcasov ým údajem. V ýstup je nav´ıc prezentován formou pomˇeˇrován´ı hodnot z dvojice sloupc ˚u, coˇz v pˇr´ıpadˇe, ˇze kardinalita obou tˇechto sloupc ˚u nen´ı malá, má ten efekt, ˇze vizualizace v ýstupu této analytické metody je znaˇcnˇe nepˇrehledná.

U obecné anal ýzy takového typu dat tedy tato metoda selhává. Vhodná by byla v pˇr´ıpadˇe, ˇze bychom potˇrebovali analyzovat chován´ı jednoho nebo nˇekolika málo student ˚u (na základˇe hodnoty sloupce Celý název), pˇr´ıpadnˇe poˇc´ıtaˇc ˚u (na základˇe IP adres). Pro tento pˇr´ıpad naopak nejsou pˇr´ıliˇs vhodné realtivnˇe obecnˇe zamˇeˇrené metody, jako je shlukován´ı.

Obr´azek 11: Asociaˇcn´ı pravidla - s´ıt’ z´avislosti akc´ı na ˇcase

Dalˇs´ım vhodn ým uˇzit´ım by byla predikce sloupce s n´ızkou kardinalitou (v ideáln´ım pˇr´ıpadˇe binárn´ı - napˇr. sloupec obsajuj´ıc´ı logickou hodnotu podle toho, zda dan ý student na konci semestru úspˇeˇsnˇe ukonˇcil kurz, nebo nikoliv).

4.2.5 Test logistick ´e regrese

Logistická regrese je v SQL Serveru 2008 z technického hlediska specifickou formou neu- ronové s´ıtˇe. Testem této metody jsem se rozhodl analyzovat závislost sloupce Akce na ˇcase. Jako kl´ıˇc jsem tedy nastavil sloupec Celý název, jako vstupn´ı ˇCas a jako predikovan ý Akce.

Test se plnohodnotnˇe podaˇril aˇz napodruhé. Napoprvé selhal nástroj pro vizualizaci - d ˚uvodem byl pˇr´ıliˇs vysok ý poˇcet hodnot ve sloupci ˇCas. Podruhé jsem tedy pˇred spuˇstˇen´ım anal ýzy nechal provést diskretizaci sloupce ˇCas. D´ıky tomu se viuzualizace omezila na zobrazen´ı pˇeti ˇcasov ých obdob´ı. Anal ýza trvala 31 sekund.

Obr´azek 12: Neuronov´e s´ıtˇe - pˇrehled preferenc´ı

Podobnˇe jako metoda neuronov ých s´ıt´ı umoˇz ˇnuje logistická regrese porovnáván´ı prav- dˇepodobnosti uskuteˇcnˇen´ı urˇcitého jevu. V naˇsem pˇr´ıpadˇe pravdˇepodobnost uskuteˇcnˇen´ı jedné, nebo druhé zvolené akce v pr ˚ubˇehu jednotliv ých obdob´ı.

Pro demostraci jsem zvolil pomˇer mezi hodnotami ”course enrol”a ”course unenrol”- tedy pomˇer toho, jak se v jednotliv ých obdob´ıch liˇsilo pˇrihlaˇsován´ı, resp. odhlaˇsován´ı z kurzu Mikroekonomie A. Je na prvn´ı pohled patrné, ˇze pˇrihlaˇsován´ı do kurzu prob´ıhalo nejv´ıce v pr ˚ubˇehu mˇes´ıce ledna. V následuj´ıc´ıch obdob´ıch pak prob´ıhalo jen odhlaˇsován´ı (pˇrihlaˇsován´ı na kurz bylo evidentnˇe ˇcasové omezeno).

4.2.6 Test sekven ˇcn´ıho shlukov ´an´ı

Metoda sekvenˇcn´ıho shlukován´ı slouˇz´ı k odhalen´ı návaznost´ı urˇcit ých provádˇen ých akc´ı. Pˇri tomto testu byly vstupn´ımi hodnotami sloupce ˇCas (opˇet diskretizován), IP adresa, In- formace a Akce. Kl´ıˇcov ým sloupcem byl sloupec Celý název. Pro predikci jem nevyb´ıral

Obr´azek 13: Logistick´a regrese - pˇrehled preferenc´ı

ˇzánou hodnotu - ˇslo mi pouze o nalezen´ı sekvenc´ı, ne predikci potenciálnˇe následuj´ıc´ıch akc´ı.

Délka anal ýzy byla 49 sekund. Algoritmus sekvenˇcn´ıho shlukován´ı vˇsak ve zdrojové databázi nenalezl ˇzádné sekvence. M ˚uˇzeme tedy pˇredpokládat, ˇze studenti své aktivity v systému Moodle neprovádˇeli v ˇzádném zaznamenatelném vzoru.

V ýsledkem anal ýzy bylo vytvoˇren´ı pouh ých tˇr´ı shluk ˚u (viz obr. 14), v porovnán´ı s klasick ými metodami shlukován´ı je informaˇcn´ı pˇr´ınos této anal ýzy jen minimáln´ı.

4.2.7 Test metody rozhodovac´ıch strom ˚u

Pomoc´ı metody rozhodovac´ıch strom ˚u m ˚uˇzeme provádˇet dˇelen´ı vstupn´ı mnoˇziny dat na podmonoˇziny aplikac´ı série kritéri´ı. Testován´ı této metody bylo pomˇernˇe dost proble- matické. S v ýchoz´ım nastaven´ım algoritmu v podstatˇe nebylo moˇzné vytvoˇrit vˇetven´ı - vytvoˇren ý strom sestával z jediného uzlu.

Obr´azek 14: Sekvenˇcn´ı shlukov´an´ı - profily shluk ˚u

Problém jsem vyˇreˇsil nastaven´ım hodnot parametru COMPLEXITY PENALTY (n´ızká hodnota zvyˇsuje pravdˇepodobnost vˇetven´ı) na hodnotu 0.1 a parametru MINIMUM SUPPORT (udává minimáln´ı poˇcet poloˇzek v uzlu stromu) na hodnotu 2 (ve v ýchoz´ım stavu byla nastavena na 10) Pˇri testován´ı této metody jsem jako vstupy pouˇzil sloupce Informace a IP adresa, jako l´ıˇc slouˇzil sloupec Celý název a predikoval jsem sloupec Akce. Anal ýza prob´ıhala 39 sekund.

Nicménˇe v ýsledky ani tak nebyly pˇr´ıliˇs uspokojivé. Algoritmus vybral ty hodnoty sloupce Akce, které mˇely v ýznamné zastoupen´ı a na základˇe k nim pˇr´ısluˇsej´ıc´ıch (resp. nepˇr´ısluˇsej´ıc´ıch) hodnot sloupce Informace provádˇel binárn´ı vˇetven´ı (viz obr. 15).

Nalezena byla pouhá tˇri hodnot´ıc´ı kritéria. Kaˇzd ý uzel pak obsahuje ty akce, které nab ývaj´ı hodnoty uvedené v popisku uzlu. Takto provedená anal ýza tedy nepˇrinesla ˇzádné uˇziteˇcné informace. Je moˇzné, ˇze na vˇetˇs´ı mnoˇzinˇe dat by bylo moˇzné vˇetven´ı provádˇet snáze i pˇri v ýchoz´ım nastaven´ı, pouˇzit´ı v ýznamnˇe vˇetˇs´ı vstupn´ı databáze bohuˇzel

Obr´azek 15: Rozhodovac´ı strom

dostupn ý hardware neumoˇz ˇnoval. Metodu rozhodovac´ıch strom ˚u by bylo jednoduˇsˇs´ı aplikovat na databázi obsahuj´ıc´ı pˇreváˇznˇe numerická data.

Bohuˇzel jsem nemohl otestovat funkˇcnost metody ˇcasov ých ˇrad a metody lineárn´ı regrese, protoˇze kromˇe ˇcasového vstupu dále vyˇzaduj´ı dalˇs´ı vstup, kter ý obshauje spojité hodnoty. V testovac´ı databázi se vˇsak ˇzádn ý sloupec obsahuj´ıc´ı taková data nevyskytuje.

5 Z ´av ˇer

Ve své práci jsem obecnˇe popsal jednotlivé funkce programu MS SQL 2008, které slouˇz´ı pro podporu Business Intelligence. Jedná se o integraˇcn´ı, analytické a reportovac´ı sluˇzby. Ve zvláˇstn´ı kapitole jsem popsal principy funkce, zp ˚usoby implementace a vhodná pouˇzit´ı jednotliv ých analytick ých sluˇzeb.

V ˇcásti zab ývaj´ıc´ı se experimenty jsem demonstroval aplikaci integraˇcn´ıch a analytick ých sluˇzeb na zadaná data a vyhodnotil vhodnost jednotliv ých zp ˚usob ˚u anal ýzy.

Program MS SQL Server 2008 poskytuje znaˇcné mnoˇzstv´ı nástroj ˚u pro integraci datov ých zdroj ˚u (napˇr. vytvoˇren´ı databáze z textového souboru, souboru tabulkového pro- cesoru, atd.), filtraci vstupn´ıch dat, jejich dodateˇcnou úpravu, atd. Pouˇzit´ı integraˇcn´ıch sluˇzeb je pomˇernˇe intuitivn´ı. Pˇri práci s programem nen´ı nezbytnˇe nutná znalost jazyka MS SQL, prakticky vˇsechny potˇrebné pˇr´ıkazy jsou generovány automaticky.

Obsaˇzené analytické sluˇzby jsou mocn ým nástrojem pro dolován´ı dat. Pomoc´ı nich je moˇzné nacházet v databáz´ıch vzory, které umoˇznuj´ı následné predikce.

Data, která jsem obdrˇzel pro demostraci metod dolován´ı dat, které MS SQL Server poskytuje, jsem nejprve upravil pomoc´ı integrˇcn´ıch sluˇzeb a následnˇe je nahrál do databáze serveru.

Následnˇe jsem na nich otestoval funkˇcnost jednotliv ých metod. Ne vˇsechny se ukázaly jako vhodné. Nejlepˇs´ı v ýsledky poskytly metody shlukovac´ı a asociaˇcn´ı pravidla. Po- moc´ı tˇechto jsem zjistil napˇr. nejˇcastˇejˇs´ı hodnoty vstupn´ıch sloupc ˚u, pˇr´ıpadnˇe vztahy mezi nimi. Pomoc´ı metody neuronov ých s´ıt´ı a logistické regrese pak bylo moˇzno sledo- vat napˇr. chován´ı vybran ých uˇzivatel ˚u, pˇr´ıpadnˇe poˇc´ıtaˇc ˚u.

Naivn´ı Bayesova metoda a metoda rozhodovac´ıch strom ˚u se ukázaly jako neefek- tivn´ı, metodu ˇcasov ých ˇrad a lineárn´ı regresi pak d´ıky charakteru vstupn´ıch dat nebylo moˇzno otestovat v ˚ubec.

V pr ˚ubˇehu práce s MS SQL Serverem 2008 jsem se setkal s nˇekolika nepˇr´ıjemnostmi. Program obˇcas pˇrestal odpov´ıdat, zejména pˇri náhledu na panel vizualizace v ýsledk ˚u anal ýzy a pˇri rozbalován´ı nab´ıdky dostupn ých server ˚u (pˇri tvorbˇe manaˇzer ˚u spojen´ı). Dále mi pˇripadalo nevhodné vyhodnocován´ı chybn ých nastaven´ı projektu aˇz pˇri spuˇstˇen´ı anal ýzy (omylem jsem nastavil diskretizaci pro sloupec obsahuj´ıc´ı text, progam pˇri anal ýze zhavaroval, protoˇze diskretizace nad t´ımto typem dat nebyla moˇzná).

Domn´ıvám se, ˇze MS SQL Server 2008 je v ýborn ým prostˇredkem pro operace do- lován´ı dat, nicménˇe jeho metody nejsou univerzáln´ı a nemus´ı b ýt pro anal ýzu daného typu dat stejnˇe vhodné - je tedy potˇreba je pouˇz´ıvat uváˇzlivˇe.

6 Reference

[1] ˇREZANKOV Á, Hana; H ÚSEK, Duˇsan; SN ÁˇSEL, Václav. Shluková analýza dat . 2. Praha : Professional Publishing, 2009. 218 s. ISBN 978-80-86946-81-8.

[2] Introduction to Information Retrieval [online]. 2008, 07-Apr-2009 [cit. 2010-04-26]. Do- stupn´e z WWW: < http://nlp.stanford.edu/IR-book/>.

[3] LACKO, L’uboslav. Business Intelligence v SQL Serveru 2005. 1. Brno : Computer Press, 2006. 391 s. ISBN 80-251-1110-5.

[4] BERKA, Petr. Dobýván´ı znalost´ı z databáz´ı. 1. Praha : Academia, 2003. 366 s. ISBN 80-200-1062-9.

[5] DE MANTARAS, Lopez. A Distance-Based Attribute Selection Measure for Decision Tree Induction. Machine Learning [online]. 1991, 6, [cit. 2010-04-26]. Dostupn ´y z WWW: <http://www.springerlink.com/content/hp3215h75t0054k2/fulltext.pdf>.

[6] FAYYAD, Usama; PIATETSKY-SHAPIRO, Gregory; SMYTH, Pad- hraic. From Data Mining to Knowledge Discovery in Databases. AI Ma- gazine [online]. 1997, 17, 3, [cit. 2010-03-08]. Dostupn ´y z WWW: <http://www.aaai.org/ojs/index.php/aimagazine/article/view/1230/1131>. [7] Microsoft. Microsoft Developer Network [online]. 2010 [cit. 2010-03-08]. Dostupn´e z

WWW: <http://msdn.microsoft.com/en-us/default.aspx>.

[8] MELOUN, Milan; MILITK Ý, Jiˇr´ı; HILL, Martin. Poˇc´ıtaˇcová analýza v´ıcerozmˇerných dat v pˇr´ıkladech. 1. Praha : Academia, 2005. 449 s. ISBN 80-200-1335-0.

[9] Bayesian network In Wikipedia : the free encyclopedia [online]. St. Petersburg (Flo- rida) : Wikipedia Foundation, 2003, 2010 [cit. 2010-03-08]. Dostupn´e z WWW: <http://en.wikipedia.org/wiki/Bayesian network>.

[10] Markov chain In Wikipedia : the free encyclopedia [online]. St. Petersburg (Florida) : Wi- kipedia Foundation, 2002, http://en.wikipedia.org/wiki/Markov chain [cit. 2010- 03-08]. Dostupn´e z WWW: <http://en.wikipedia.org/wiki/Markov chain>. [11] VAN DER VAART, Aad W. Time series [online]. Amster-

dam : [s.n.], 1995-2001 [cit. 2010-05-02]. Dostupn´e z WWW: <http://www.researchgate.net/publication/40517175 Time Series>.

[12] AGRAWAL, Rakesh; IMIELINSKI, Tomasz; SWAMI, Arun Mining Association Ru- les between Sets of Items in Large Databases. IBM Almaden Research Center : 650 Harry Road, San Jose, CA 95120, 1993 [cit. 2010-05-02]. Dostupn´e z WWW: <http://rakesh.agrawal-family.com/papers/sigmod93assoc.pdf>

[13] LACKO, Luboslav. Databáze: datové sklady : OLAP a dolován´ı dat s pˇr´ıklady v Microsoft SQL Serveru a Oracle. 1. Brno : Computer Press, 2003. 469 s. ISBN 80-7226-969-0.

[14] Power, D.J. A Brief History of Decision Support Systems. DSSResources.COM, World Wide Web, http://DSSResources.COM/history/dsshistory.html, version 4.0, March 10, 2007.

[15] HURBEAN, Luminita. Business Intelligence: applications, trends, and strategies. Economic Sciences Series [online]. 2006, 1, [cit. 2010-05-02]. Dostupn ´y z WWW: <http://anale.feaa.uaic.ro/anale/resurse/46 Hurbean L - Business intelligence- applications, trends and strategies.pdf>.

In document AIR CONDITIONER OWNER S MANUAL. Please read this manual carefully before operating your air conditioner and retain it for future reference. (página 33-39)