WAMPIR #3 - Natural Language Processing in Business and Auto-EDA

Event:

Event type:

Meetup

Category:

IT

Topic:

programming , AI/ML

Date:

21.01.2020 (tuesday)

Time:

18:00

Language:

Polish

Price:

Free

City:

Wrocław

Place:

Department of Biotechnology of the University of Wroclaw

Address:

Fryder yka Joliot-Curie 14a

Zgłoś zmiany w wydarzeniu

Log in, by zgłosić zmianę.

Speakers:

Mateusz Staniak

Dominik Deja

Description:

Stowarzyszenie Wrocławskich Użytkowników R zaprasza na kolejne spotkanie z serii WAMPIR (Wrocławski Alians Miłośników Pythona i R).

Na tych spotkaniach chcemy poruszać bardziej zaawansowane aspekty uczenia maszynowego, ale zawsze w przyjaznej STWURowej atmosferze.

Temat #1

Mówca: dr Dominik Deja

Temat: Contract Digitalization: Natural Language Processing in Business

Abstrakt:

Ostatnie lata przyniosły niezwykle szybki rozwój technik uczenia maszynowego związanych z przetwarzaniem języka naturalnego. W efekcie, rozbudziło to oczekiwania sektora biznesowego co do zakresu w jakim Sztuczna Inteligencja jest w stanie zastąpić pracowników w ich codziennej pracy. Podczas wykładu opowiem o projekcie cyfryzacji kontraktów który prowadzę od ponad roku. Celem projektu jest stworzenie narzędzia umożliwiającego automatyczne zarządzanie i analizę kontraktów zawieranych przez firmę. W tym celu przetestowaliśmy i wykorzystujemy najnowsze (jak i odrobinę starsze) techniki uczenia maszynowego, typu BERT, czy CatBoost, jak i zaadoptowaliśmy podejście Active Learning w uczeniu SI rozpoznawania nowych klauzul umownych. Wykład ma na celu omówienie głównych założeń projektu, zaprezentowanie naszego podejścia i przedstawienie użytych technik uczenia maszynowego.

Bio:

Doktor nauk technicznych specjalizujący się w zaawansowanej analizie danych (Data Science). Absolwent Polsko-Japońskiej Akademii Technik Komputerowych (dr, informatyka) i Szkoły Głównej Handlowej (mgr, metody ilościowe w ekonomii i systemy informacyjne). Były konsultant McKinsey, obecnie Product Owner w firmie Nokia specjalizujący się w prowadzeniu projektów automatyzujących skomplikowane procesy biznesowe (w szczególności przy wykorzystaniu technik sztucznej inteligencji i przetwarzania języka naturalnego) i zarządzający dużymi zespołami eksperckimi.

Temat #2

Mówca: Mateusz Staniak

Temat: Szybka i zautomatyzowana eksploracja danych w R (autoEDA).

Abstrakt:

Czyszczenie i eksploracja danych to kluczowe elementy procesu analitycznego, które wpływają zarówno na jakość budowanych modeli predykcyjnych/statystycznych, jak i zrozumienie problemu biznesowego i charakterystyki danych.

W R, i w innych językach do analizy danych, powstaje coraz więcej narzędzi, które mają na celu jak najmocniej przyspieszyć i zautomatyzować eksplorację danych. Do najważniejszych przykładów należą pakiety DataExplorer i dataMaid.

Opowiem o ogólnych metodach i pakietach R-owych, które pomagają ograniczyć ilość pisanego kodu i zautomatyzować typowe elementy eksploracji danych.

Bio:

Jestem doktorantem ze statystyki w Instytucie Matematyki UWr, freelancer. Specjalizuję się w metodach statystycznych dla biologii (przede wszystkich proteomika) i rozwoju oprogramowania w R.

Log in

Przypomnij hasło

WAMPIR #3 - Natural Language Processing in Business and Auto-EDA

WRUG

Similar events

Profile of employers