Informacje o warsztacie
Celem warsztatu jest wprowadzenie teoretyczne i praktyczne do powszechnie wykorzystywanych rozwiązań w branży ML/AI. Zaprezentowane zostaną techniki wstępnego przetwarzania danych (preprocessing), problemy uczenia nadzorowanego i nienadzorowanego oraz praktyki, które pozwalają na automatyczny dobór modelu do postawionego zadania (AutoML). Wykorzystane algorytmy na różnym poziomie złożoności (od regresji liniowej po głębokie sieci neuronowe) zapewniają szeroką gamę uniwersalnych narzędzi do powtórnego użycia w przyszłości.
Czego się dowiesz?
- nabierzesz intuicji dotyczącej działania powszechnie używanych algorytmów w branży ML,
- zrozumiesz, jakie największe wyzwania stoją przed developerami budującymi rozwiązania oparte o Machine Learning,
- uzyskasz uniwersalne fragmenty kodu, które pomogą Ci w Twoich przyszłych projektach.
Wymagania
- podstawy Pythona 3.X i bibliotek matplotlib, numpy i pandas,
- znajomość pojęć takich, jak: średnia, mediana, odchylenie standardowe, wariancja, rozkład prawdopodobieństwa, korelacja, wektory, pochodne.
Stack technologiczny
Python 3.X, numpy, pandas, matplotlib, scikit-learn, TensorFlow, Keras.
Program warsztatów
Dzień pierwszy
1. Wstęp, nazewnictwo i źródła danych
2. Preprocessing danych
3. Problem regresji
3.1. Regresja Liniowa
3.2. Regresja Wielomianowa
3.3. Maszyny Wektorów Wspierających (SVR + Kernel)
3.4. Drzewa Decyzyjne
3.5. Lasy Drzew Losowych
3.6. Zespół Extra Trees
3.7. Sieci Neuronowe
4. Miary oceny modeli przy problemie regresji
5. Zadanie na danych rzeczywistych
6. Podsumowanie
Dzień drugi
1. Wstęp i podsumowanie poprzedniego dnia warsztatów
2. Problem klasyfikacji
2.1. Metoda Najbliższych Sąsiadów (K-NN)
2.2. Regresja Liniowa + Logistyczna
2.3. Maszyny Wektorów Wspierających (SVM + Kernel)
2.4. Drzewa Decyzyjne
2.5. Lasy Drzew Losowych
2.6. Zespół Extra Trees
2.7. Sieci Neuronowe
3. Miary oceny modeli przy problemie
4. klasyfikacji
5. Dobór modeli i dobre praktyki
6. Zadanie na danych rzeczywistych
6.1. Redukcja wymiarowości i metody wizualizacji danych
6.2. Drzewa Decyzyjne i Lasy Losowe
6.3. Principal Component Analysis (PCA) t-Distributed Stochastic Neighbor mbedding (t-SNE)
7. Podsumowanie i zakończenie
Prowadzący
Waldemar Kołodziejczyk
Artificial Intelligence Developer z doświadczeniem przy budowaniu modeli operujących na szeregach czasowych.
Interesuje się algorytmiką, rozwiązaniami uczenia ze wzmocnieniem oraz szeroko rozumianym statystycznym przetwarzaniem danych.
Rejestracja i dodatkowe informacje: https://evenea.pl/event/ml7809/