Online kurz Data Science II. Mierne Pokročilý will teach you
- Programovať v jazykoch R aj Python
- Pracovať s dátovými štruktúrami
- Exportovať a importovať dáta
- Analyzovať a vizualizovať zozbierané dáta
- Získať znalosti zo strojového učenia
- Validovať vstupné údaje vrátane reťazcov
- Písať SQL databázové dopyty
- Využívať štatistické a analytické nástroje GA4 a Matomo
- Spracovávať dáta pomocou tabuliek, grafov a histogramov
- Používať techniky na zlepšenie zdrojového kódu
Požiadavky a Vstupné Znalosti
- Odporúčaním pre tento kurz je absolvovanie kurzu Data Science I. Začiatočník
- Pokročilá práca s PC a Windows, Linux alebo macOS
- Pokročilá práca s kancelárskym balíkom Microsoft Office, OpenOffice alebo LibreOffice
- Pokročilá práca s textovým editorom
- Pri absolvovaní online kurzu sú výhodou skúsenosti s kódovaním a programovaním
- Jazyk R a Python na úrovni mierne pokročilý
- Základy DataScience
Cieľové skupiny a Komu je kurz určený
- Záujemcom, ktorí sa chcú stať a uplatniť ako dátoví vedci
- Dátoví vedci (Data Sciences)
- Analytici (IT, dátoví, biznis)
- Softvéroví inžinieri
- Dátoví špecialisti
- IT konzultanti
- SQL špecialisti
- Manažéri a riaditelia
- Učitelia a pedagogickí zamestnanci
- Podnikatelia
Obsah a Učebná Osnova online kurz Data Science II. Mierne Pokročilý
I. Úvod do Data Science
Úvod a predstavenie kurzu Data Science | 13:07 |
Jetbrains Datalore | 16:23 |
Aritmetický, geometrický a harmonický priemer | 53:49 |
II. Jazyk R, datasety a premenné
Balíčky, dplyr, devtools, ggplot2 | 28:53 |
Datasety, premenné, dplyr, view, names | 15:45 |
Dátumy, údržba, zdroje, skupiny | 7:17 |
III. Strojové učenie, kvalitatívne premenné
Čo je Strojové Učenie (Machine Learning ML)? | 35:41 |
Dátumy, formátovanie, rozsahy | 11:53 |
sapply, summary, Hmisc, fivenum | 35:31 |
Kvalitatívne premenné, MASS, frekvenčné tabuľky, cbind | 15:44 |
IV. Dátové štruktúry, KPIs a mierky
Dátové štruktúry, DataFrame, RData, matrix, dim | 21:07 |
write, CSV, rnorm, plot, datasety, Excel | 27:07 |
Export, Stata, IBM SPSS, SAS, balíčky | 11:50 |
KPIs a Mierky | 30:13 |
V. Vizualizácia dát a Google Analytics GA4
Čo je Vizualizácia Dát (Data Visualization)? | 01:00:22 |
Grafy, Histogramy, grid, sample, Boxplot, plot, curve | 44:28 |
t-test, jednovýberový, dvojvýberový | 32:24 |
Google Analytics GA4 | 01:19:20 |
Google Analytics a Segmenty | 01:16:33 |
Vlastné reporty Google Analytics a Power BI | 29:20 |
VI. Jazyk R a SQL
Eurostat, datasety, search, enviroment.yml | 18:33 |
sqldf, SQL, dopyty, exporty obrázky, PDF | 6:51 |
Iterátorové funkcie v Microsoft Power BI | 21:33 |
Filtrovacie Funkcie v Microsoft Power BI | 01:45:23 |
VII. Spracovanie Dát v Pythone
Python Triedy a OOP | 51:13 |
Validácia a normalizácia dát | 15:46 |
Normalizácia reťazcov | 09:57 |
Reťazce, kolekcie, deque | 30:09 |
Statické metódy v Pythone | 41:18 |
VIII. Python Knižnice
Data Science knižnice | 38:28 |
Knižnica Pandas | 46:01 |
IX. ETL procesy
ETL Proces, CSV | 17:52 |
Pandas ETL projekt | 1:08:08 |
X. Vlastnosti a cacheovanie
Vlastnosti (Property) | 45:58 |
Cacheovanie a cache | 14:54 |
XI. Grafy a vizualizácie dát
Matplotlib a špeciálne Grafy | 1:10:54 |
Grafy a vizualizácie | 16:49 |
Úvod do knižnice Plotly a grafov | 01:12:24 |
Plotly a stĺpcové grafy | 34:45 |
Plotly a mapy (kartogramy) | 09:28 |
XII. Techniky na zlepšenie zdrojového kódu
Duck typing | 29:00 |
Type hinting a generika | 42:54 |
Docstring a dokumentácia | 22:55 |
XIII. Webová Analytika v nástroji Matomo
Matomo, WordPress, webová analytika | 1:02:56 |
Záverečný Test
Záverečný Test | 40 minút |