Online kurz Hadoop I. Začiatočník will teach you
- Pochopiť základné princípy práce s veľkými dátami a analytikou Big Data
- Pracovať s Microsoft Excelom pri spracovaní veľkých dát a identifikovať jeho limity
- Naučiť sa charakteristiku 3V (objem, rýchlosť, rôznorodosť) a rozdiely medzi dátami, informáciami a znalosťami
- Inštalovať a konfigurovať Apache Hadoop pomocou Oracle VirtualBoxu a riešiť najčastejšie problémy
- Používať nástroje Hadoop Distributed File System (HDFS) a dashboard Ambari na správu dát
- Pracovať s Hadoop príkazovým riadkom pomocou nástroja Putty
- Osvojiť si používanie komponentov Hadoop ekosystému ako Hive a PIG
- Manipulovať s dátami v Hadoop pomocou Apache Hive a spracovávať údaje v Apache PIG
- Rozumieť základom databáz, jazyka SQL a NoSQL a ich využitiu pri spracovaní veľkých dát
- Získať odporúčania na zdroje a literatúru pre ďalšie prehlbovanie znalostí v Hadoop a Big Data
Požiadavky a Vstupné Znalosti
- Pokročilá úroveň práce s PC a Windows, Linux alebo macOS
- Pokročilá úroveň práce s kancelárskym balíkom Microsoft Office, OpenOffice alebo LibreOffice
- Pokročilá úroveň práce s textovým editorom
- Na absolvovanie tohto kurzu sú odporúčané skúsenosti s kódovaním a programovaním
- Základy práce s terminálom (príkazovým riadkom)
- Logické a algoritmické myslenie je výhodou
- Odporúčaním pre tento kurz je absolvovanie kurzu SQL I. Začiatočník
Cieľové skupiny a Komu je kurz určený
- Záujemci o Apache Hadoop, ktorí sa chcú v ňom naučiť pracovať
- Dátoví analytici
- Databázoví admini
- Dátoví vedci (Data Scientists)
- Obchodní analytici
- Dátoví vedci
- IT špecialisti
- Programátori, vývojári, developeri
- Vedúci projektov a projektová podpora
- Projektoví a IT manažéri
Obsah a Učebná Osnova online kurz Hadoop I. Začiatočník
I. Úvod do Hadoop analytiky a Big Data
Úvod a predstavenie kurzu Hadoop, analytiky a Big Data. | 59:55 |
Začíname pracovať s "Veľkými Dátami" v Microsoft Exceli. | 30:18 |
Aké sú limity tabuľkových preprocesorov typu Microsoft Excel? Čo sú to veľké operácie? | 14:03 |
Čo je charakteristika 3V pre veľké dáta? Aký je rozdiel medzi dátami, informáciami a znalosťami? | 28:01 |
Je Excel nástroj pre Big Data? Čo je to PowerPivot a Power BI a ako sa pracuje s XML súbormi? | 45:35 |
Čo sú to binárne (XLSB) a textové súbory ako sa s nimi pracuje v tabuľkovým preprocesoroch typu Excel? | 17:18 |
Čo sú databázy, jazyk SQL a jazyk NoSQL? Prehľad štatistických metód. | 48:26 |
Príručka kurz Hadoop
Príručka kurz Hadoop | 66 strán |
II. Inštalujeme a rozbehávame Apache Hadoop v Oracle VirtualBoxe
Ako nainštalovať a rozbehať Apache pomocou virtualizácií vo VirtualBoxe? | 55:11 |
Čo je to Java ako platforma a ako programovací jazyk? | 01:12:43 |
Načo si dať pozor a aké sú najčastejšie chyby pri inštalácií? Spustili sme dashboard Ambari Apache Hadoop. Používame Hadoop v príkazovom riadku. | 32:12 |
OPAKOVANIE: čo je Hadoop a HDFS? Aké nástroje sa používajú na inštaláciu Hadoop? Čo je Cloudera (ex Hortonworks)? | 49:33 |
Robíme Hadoop základný test. Inštalujeme VirtualBox s HDP a používame Hadoop na servery s Putty. | 45:06 |
III. Prehľad Hadoop ekosystému (Hadoop Stack) a odporúčané zdroje
Aké komponenty a aplikácie nájdeme v ekosystéme Apache Hadoop (Hadoop Stack)? Pracuje so súbormi a Hive. | 33:26 |
Aké sú odporúčané zdroje a knihy k Apache Hadoop? | 33:51 |
VI. Nástroje Hive, PIG a práca s príkazovým riadkom
Ako pracovať s datasetmi v Hadoop? Používame Apache Hive a Putty s príkazovým riadkom. | 1:18:45 |
Čo je to Apache PIG ako sa používa? Prehľad operátorov, dátových typov. | 1:43:33 |
Záverečný Test
Záverečný Test | 40 minút |