Popis:
Seminárna práca sa zaoberá problematikou dátových skladov ich históriou , štruktúrou a ich významom.
Pojem dátový sklad (DW - Data Warehouse) sa počas posledných niekoľkých rokov nezmazateľne zapísal do povedomia užívateľov informačných systémov (IS). Dátový sklad je správne chápaný ako nevyhnutná nadstavba prevádzkových IS, pomocou ktorej pracovníci manažmentu ľahko a rýchlo získavajú vo veľmi prehľadnej podobe informácie pre sumárnu analýzu dát, odhaľovanie skrytých súvislostí, sledovanie trendov v rôznych oblastiach a pod. Pod pojmom "dátový sklad" môžeme chápať "Komplexné dáta uložené v štruktúre, ktorá umožňuje efektívnu analýzu a dopytovanie. Dáta do dátového skladu sú čerpané z primárnych informačných systémov a ďalších zdrojov.
[Brzák, Manažerska Informatika, 69]
Využitie dobre navrhnutého dátového skladu nie je len záležitosť pre pracovníkov vrcholového manažmentu. Je naliehavo potrebné priblížiť možnosti využitia dátových skladov aj používateľom mimo vrcholový manažment a to úplne všeobecne v rôznych podnikoch a na rôznych úrovniach.
[Brzák, Manažerska Informatika, 69]
Dátový sklad je pomenovanie pre systémy umožňujúce analytické spracovanie dát prostredníctvom nástrojov OLAP (OnLine Analytical Processing). Tieto nástroje tvoriace užívateľské rozhranie potom slúžia k analýze historických dát, z ktorých sú potom vytvárane obsiahle štatistické zostavy.
[Sodomka,Klčová, Informační systémy v podnikové praxi, 407]
Za jedného zo zakladateľov DWH považujeme Williama Inmona, ktorý definuje dátový sklad nasledovne: Dátový sklad je integrovaný, subjektovo orientovaný, stály a časovo rozlíšený súhrn dát, usporiadaný pre podporu potrieb manažmentu.
[Stuchlý, Informační systémy v Marketingu, 42]
Integrovaný - dáta sú ukladané v rámci celého podniku a nie iba v rámci jednotlivých oddelení do jedného systému.
[Stuchlý, Informační systémy v Marketingu, 42]
Subjektovo orientovaný - dáta sú rozdeľované podľa ich typu, nie podľa aplikácií, v ktorých vznikli. Napríklad informácie o zamestnancovi sú uložené iba jedenkrát a to v databáze dátového skladu, na rozdiel od produkčného systému, kde sú rozptýlené do rôznych súborov podľa toho, pre ktorú aplikáciu majú byť použité.
[Stuchlý, Informační systémy v Marketingu, 42-43]
Stály - dátové sklady sú koncipované prevažne ako „read only“ čo v praxi znamená, že tu žiadne dáta nevznikajú a nie je možné ich ani užívateľskými nástrojmi meniť. Dáta sú do DWH načítané z produkčných databáz, alebo iných externých zdrojov a existujú tu po celú dobu života dátového skladu.
[Stuchlý, Informační systémy v Marketingu, 43]
Časovo rozlíšený - aby bolo možné uskutočňovať analýzy za určité obdobie je nevyhnutné, aby bola do DWH uložená aj história dát. Načítané dáta si musia so sebou niesť informáciu o dimenzii času. Sú k dispozícii dáta aj za niekoľko minulých rokov.
...
Kľúčové slová:
dátové sklady
data mining
dátová pumpa
olap
oltp
dátová kocka
rolap
molap
multidimenzionálna databáza
tabuľka faktov
kontingečná tabuľka
informatika
hospodárska informatika
Obsah:
- 1. Ako správne rozumieť základnej terminológii 4
1.1 Dátový sklad 4
1.2 Dátové sklady nie len pre vrcholový manažment 6
1.3 Business intelligence 6
1.3.1 Základné riešenia aplikácií business intelligence 7
1.4 Manažérsky informačný systém 7
2.História 9
3.Ako funguje dátový sklad 10
3.1 Dátová pumpa (transformation) 12
3.2 Funkcie dátového skladu 13
3.3 Konceptuálne modelovanie dw (dátový sklad) 14
4.Multidimenzionálna databáza 14
4.2 Základné vlastnosti olap 16
4.3 Molap 17
4.4 Rolap 18
4.5 Dolap 19
5.Metadáta 20
5.1.1Metadáta pre správu ds 20
5.1.2Metadáta pre koncových užívateľov 22
5.1.3 Optimalizačné metadáta 22
5.1.4 Metadáta ako základ pre automatizáciu podporných procesov 23
5.1.5 Štandardizácia metadát 23
6.Budovanie dátového skladu 24
7. Architektúra dátových skladov 25
7.1 Jednoúrovňová architektúra (bus architektúra) 25
8. Správa dimenzií 27
VStup dát do data staging area 27
VStupná dsa 27
Procesná vrstva 27
Cd repository 27
Výstupná dsa 27
Distribučná vrstva 27
8.1 Dvojúrovňová architektúra 27
8.2 Porovnanie architektúr dátových skladov 28
8.2.1 Jednoúrovňová bus architektúra 28
8.2.2 Dvojúrovňová architektúra 29
9. Dátové trhy (data mart, dma) 29
9.1 Dátový sklad ako množina dátových trhov 30
9.2 Integrovaný dátový sklad 30
10. Dátové kocky 30
11. Chyby pri budovaní dátových skladov 31
12. Dolovanie dát (data mining) 32
12.1 Dolovanie z dát (data mining), nástroje pre obchod a marketing.metodológia semma. 33
12.1.1 Charakteristické oblasti použitia pre data mining 33
12.1.2 Definovanie cieľa pre data mining 33
12.1.3 Metodika procesu data mining 34
12.1.4 Typické problémy riešené s využitím data miningu sú napríklad: 36
Zoznam použitej literatúry: 43
Zdroje:
- Brzák Jozef : Manažerská Informatika,2012, Vysoká škola regionálního rozvoje, 148, vydanie 2, http://files.vsrr.webnode.cz/200000019-d2a71d3a11/SO%20-%20Mana%C5%BEersk%C3%A1%20informatika%20(Brz%C3%A1k).pdf?fbclid=IwAR1ImyHu0zbZXP-LxOg7EDxz4u4TVsvC-Rgd2pF4ivXYpKYgLz06X_hy97k
- Stuchlý Peter : Informačné systémy v marketingu, Slovenská poľnohospodárska univerzita v Nitre, 67, vydanie 2 , https://spu.fem.uniag.sk/cvicenia/ku/stuchly/Informa%C4%8Dn%C3%A9%20syst%C3%A9my%20v%20Marketingu/Predn%C3%A1%C5%A1ky%20ISvM%202016.pdf
- Sodomka Petr, Hana Klčová : Informační systémy v podnikové praxi,2011, Computer Press a.s,504, 978-80-251-2878-7, vydanie 1, Centrum vedecko-technických informácií SR Bratislava
- Pour Jan a kolektiv: Informační systémy a elektronické podnikání, 2004, Vysoká škola ekonomická v Praze,200, 80-245-0783-8, vydanie 2, Slovenská ekonomická knižnica EU v Bratislave
- Gála Libor, Pour Jan, Šedivá Zuzana: Podniková informatika, 2015, Grada Publishing a.s, 240, 978-80-247-9918-6, vydanie 3, Slovenská ekonomická knižnica EU v Bratislave
- Šarmanová Jana: Informační systémy a datové sklady, 2007, VŠB - Technická univerzita Ostrava, 169, 978-80-248-1500-8, vydanie 1, http://gisak.vsb.cz/wikivyuka/images/2/20/Ins.pdf?fbclid=IwAR1GgUpi7zDB-W6TbwAa5fSXb9bPMy3G_S_VdMItGpJMXfyww5OI-j1tdLk
- Bébr Richard, Doucek Petr: Informační systémy pro podporu manažerské práce, 2005, Kamil Mařík - Professional publishing, 224, 80-86419-79-7, vydanie 1, Slovenská ekonomická knižnica EU v Bratislave
- Horák Jiří, Horáková Bronislava: Datové sklady a využití datové struktury typu hvězda pro prostorová data, Institut geoinformatiky, VŠB-TU Ostrava, 26 http://gisak.vsb.cz/GIS_Ostrava/GIS_Ova_2007/sbornik/Referaty/Sekce3/hvezdaF4.pdf