Moduł A: Organizacja i przebieg procesu analizy danych (2 godz.)
Metodyka CRISP-DM
Moduł B: Pozyskiwanie i przekształcanie danych, tworzenie modeli danych (82 godz.)
Celem modułu jest zapoznanie Uczestników z różnymi formami przechowywania danych, które są stosowane w procesach analitycznych. Uczestnicy pozyskają umiejętności pozwalające na dobór odpowiedniej techniki magazynowania i przetwarzania danych, zaprojektowanie, budowę oraz wykorzystanie magazynów danych we własnych rozwiązaniach analitycznych.
Formy magazynowania danych - wady, zalety, korzyści, problemy
Power Query - pobieranie i przekształcanie danych (Excel, Power BI)
Język SQL i relacyjne bazy danych
Tworzenie wielowymiarowych modeli semantycznych (Excel, Power BI)
Zaawansowane funkcje pracy z danymi w Excel
Moduł C: Analiza i wizualizacja danych (32 godz.)
Analiza i wizualizacja danych z wykorzystaniem Excel
Analiza i wizualizacja danych z wykorzystaniem Power BI
Moduł D: Język Python w analizie i wizualizacji danych (40 godz.)
Python w analizie danych
Analiza dużych zbiorów danych z wykorzystaniem Apache Spark
Wykorzystanie algorytmów uczenia maszynowego w analizie danych
Moduł E: Konsultacje z doradcą HR (4 godz.)
Konsultacje z doradcą HR
Metoda realizacji szkolenia
W trakcie szkolenia uczestnicy będą realizowali trzy projekty praktyczne:
1. Projekt realizowany w trakcie trwania modułu B.
Celem projektu jest przygotowanie kompletnego modelu analitycznego obejmującego zdefiniowany obszar merytoryczny.
Realizacja projektu będzie wymagała:
- Pozyskania danych z różnorodnych źródeł (bazy danych, dane publiczne w Internecie, pliki płaskie, arkusze Excel).
- Utworzenia zautomatyzowanych procedur pobierania i przekształcania danych.
- Zaprojektowania i realizacji tabelarycznego modelu analitycznego.
- Zdefiniowania w ramach modelu szeregu kalkulacji pozwalających na analizę w różnych perspektywach czasowych.
2. Projekt realizowany w trakcie trwania modułu C.
Celem projektu jest przygotowanie wizualizacji danych na modelu utworzonym w ramach pierwszego projektu. Realizacja projektu będzie wymagała:
- Doboru odpowiednich do celów wizualizacji danych.
- Utworzenia raportów prezentujących analizę danych oraz wnioski z niej płynące.
Utworzenie interaktywnej prezentacji opowiadającej historię zapisaną w modelu (storytelling).
Do realizacji projektu uczestnik będzie mógł wykorzystać Power BI lub SQL Server Reporting Services.
3. Projekt końcowy.
Jest to projekt podsumowujący wiedzę nabytą w trakcie naszego intensywnego kursu analizy danych. Punktem wyjścia będzie zestaw pytań, na które, przy pomocy utworzonego modelu oraz analizy wspartej uczeniem maszynowym, będzie musiał odpowiedzieć uczestnik kursu. Realizacja projektu będzie wymagała:
Pozyskania danych adekwatnych do wymagań projektu.
- Utworzenia modelu analitycznego wraz z zautomatyzowanymi procedurami pobierania i transformacji danych.
- Przeprowadzenia eksploracyjnej analizy danych.
- Wykorzystania algorytmów uczenia maszynowego do budowy modelu, który będzie mógł być użyty w predykcji danych.
- Utworzenia raportów prezentujących wypracowane wnioski.
- Zaprezentowania całości efektów projektu.
POBIERZ PROGRAM W PDF