Online kurz Vysokovýkonné počítanie (HPC) a Veľké dáta (Big Data) ťa naučí
- Porozumieť základom vysokovýkonného počítania (HPC) a superpočítačom (Supercomputers)
- Identifikovať a riešiť limity tabuľkových preprocesorov ako Microsoft Excel pri práci s veľkými dátami
- Pochopiť charakteristiku 3V+ pre veľké dáta a rozdiel medzi dátami, informáciami a znalosťami
- Naučiť sa používať binárne a textové súbory (XLSB) a pracovať s formátmi XML v tabuľkových procesoroch
- Osvojiť si prácu s databázami SQL a NoSQL a ich využitie pri spracovaní veľkých dát
- Generovať fiktívne dáta pomocou Python knižnice Faker a pracovať s Parquet formátmi
- Efektívne analyzovať a spracovávať dáta pomocou Python knižnice Polars
- Spracovať a porovnávať veľké dátové súbory v rôznych formátoch vrátane Parquet
- Rozumieť základom databáz, jazyka SQL a NoSQL a ich využitiu pri spracovaní veľkých dát (Big Data)
- Pripraviť sa na praktické riešenia dátových tokov a analýzu Big Data pomocou moderných nástrojov
Požiadavky a Vstupné Znalosti
- Pokročilá úroveň práce s PC a Windows, Linux alebo macOS
- Pokročilá úroveň práce s kancelárskym balíkom Microsoft Office, OpenOffice alebo LibreOffice
- Pokročilá úroveň práce s textovým editorom
- Na absolvovanie tohto kurzu sú odporúčané skúsenosti s kódovaním a programovaním v Pythone
- Základy práce s terminálom (príkazovým riadkom)
- Logické a algoritmické myslenie je výhodou
- Odporúčaním pre tento kurz je absolvovanie kurzu Python I. Začiatočník
- Odporúčaním pre tento kurz je absolvovanie kurzu SQL I. Začiatočník
Cieľové skupiny a Komu je kurz určený
- Záujemci o HPC a Big Data, ktorí sa s nimi chcú naučiť pracovať
- Dátoví analytici
- Databázoví admini
- Dátoví vedci (Data Scientists)
- Obchodní analytici
- Dátoví vedci
- IT špecialisti
- Programátori, vývojári, developeri
- Vedúci projektov a projektová podpora
- Projektoví a IT manažéri
Obsah a Učebná Osnova online kurz Vysokovýkonné počítanie (HPC) a Veľké dáta (Big Data)
I. Úvod do Vysokovýkonného počítania (HPC) a veľkých dát (Big Data)
Úvod a predstavenie kurzu Vysokovýkonné počítanie (HPC) a Veľké dáta (Big Data). | 10:36 |
Ako začať s HPC? Čo sú to superpočítače? Aké HPC nástroje a knižnice existujú? | 30:18 |
Aké sú limity tabuľkových preprocesorov typu Microsoft Excel? Čo sú to veľké operácie? | 14:03 |
Ako začať s veľkými dátami (Big Data)? | 01:09:41 |
Čo je charakteristika 3V pre veľké dáta? Aký je rozdiel medzi dátami, informáciami a znalosťami? | 28:01 |
Čo sú to binárne (XLSB) a textové súbory ako sa s nimi pracuje v tabuľkovým preprocesoroch typu Excel? | 17:18 |
Čo sú databázy, jazyk SQL a jazyk NoSQL? Prehľad štatistických metód. | 48:26 |
Príručka kurz Hadoop, HPC a Big Data
Príručka kurz Hadoop, HPC a Big Data | 66 strán |
II. Nástroje a knižnice na prácu s HPC a Big Data v Pythone
Pracujeme v knižnici Faker a Parquet. Generujeme fiktívne dáta. | 44:05 |
Pracujeme v knižnici Polars a spracovávame dáta. | 02:07:40 |
Ako pracovať s Big Data súbormi? Používame Parquet formáty a porovnávame s inými typmi súborov? | 01:09:17 |