WAMPIR #3 - Natural Language Processing in Business and Auto-EDA
Stowarzyszenie Wrocławskich Użytkowników R zaprasza na kolejne spotkanie z serii WAMPIR (Wrocławski Alians Miłośników Pythona i R).
Na tych spotkaniach chcemy poruszać bardziej zaawansowane aspekty uczenia maszynowego, ale zawsze w przyjaznej STWURowej atmosferze.
Temat #1
Mówca: dr Dominik Deja
Temat: Contract Digitalization: Natural Language Processing in Business
Abstrakt:
Ostatnie lata przyniosły niezwykle szybki rozwój technik uczenia maszynowego związanych z przetwarzaniem języka naturalnego. W efekcie, rozbudziło to oczekiwania sektora biznesowego co do zakresu w jakim Sztuczna Inteligencja jest w stanie zastąpić pracowników w ich codziennej pracy. Podczas wykładu opowiem o projekcie cyfryzacji kontraktów który prowadzę od ponad roku. Celem projektu jest stworzenie narzędzia umożliwiającego automatyczne zarządzanie i analizę kontraktów zawieranych przez firmę. W tym celu przetestowaliśmy i wykorzystujemy najnowsze (jak i odrobinę starsze) techniki uczenia maszynowego, typu BERT, czy CatBoost, jak i zaadoptowaliśmy podejście Active Learning w uczeniu SI rozpoznawania nowych klauzul umownych. Wykład ma na celu omówienie głównych założeń projektu, zaprezentowanie naszego podejścia i przedstawienie użytych technik uczenia maszynowego.
Bio:
Doktor nauk technicznych specjalizujący się w zaawansowanej analizie danych (Data Science). Absolwent Polsko-Japońskiej Akademii Technik Komputerowych (dr, informatyka) i Szkoły Głównej Handlowej (mgr, metody ilościowe w ekonomii i systemy informacyjne). Były konsultant McKinsey, obecnie Product Owner w firmie Nokia specjalizujący się w prowadzeniu projektów automatyzujących skomplikowane procesy biznesowe (w szczególności przy wykorzystaniu technik sztucznej inteligencji i przetwarzania języka naturalnego) i zarządzający dużymi zespołami eksperckimi.
Temat #2
Mówca: Mateusz Staniak
Temat: Szybka i zautomatyzowana eksploracja danych w R (autoEDA).
Abstrakt:
Czyszczenie i eksploracja danych to kluczowe elementy procesu analitycznego, które wpływają zarówno na jakość budowanych modeli predykcyjnych/statystycznych, jak i zrozumienie problemu biznesowego i charakterystyki danych.
W R, i w innych językach do analizy danych, powstaje coraz więcej narzędzi, które mają na celu jak najmocniej przyspieszyć i zautomatyzować eksplorację danych. Do najważniejszych przykładów należą pakiety DataExplorer i dataMaid.
Opowiem o ogólnych metodach i pakietach R-owych, które pomagają ograniczyć ilość pisanego kodu i zautomatyzować typowe elementy eksploracji danych.
Bio:
Jestem doktorantem ze statystyki w Instytucie Matematyki UWr, freelancer. Specjalizuję się w metodach statystycznych dla biologii (przede wszystkich proteomika) i rozwoju oprogramowania w R.