Logo Crossweb

Log in

No account yet? Forgot password

Przypomnij hasło

close Wypełnij formularz.
Na Twój adres e-mail zostanie wysłane link umożliwiający zmianę hasła.
Send
This event has already taken place. Check upcoming events

Toruń JUG: Warsztaty Spark

Event:
Toruń JUG: Warsztaty Spark
Event type:
Meetup
Category:
IT
Topic:
Date:
23.02.2018 (friday)
Time:
18:00
Language:
Polish
Price:
Free
City:
Place:
Business Link Toruń
Address:
Łokietka 5
Description:

Zapraszamy serdecznie na Warsztaty Sparka zorganizowane przez Toruń Java User Group, które odbędą się w piątek, 23 lutego 2018 roku w godzinach 18:00-20:00 w budynku Business Link Toruń przy ulicy Władysława Łokietka 5 w Toruniu.


Wstęp na spotkanie jest wolny, obecność na wcześniejszych spotkaniach nie jest wymagana - pomiędzy spotkaniami nie ma żadnych zależności, do naszej społeczności można dołączyć w dowolnym momencie. Na spotkanie możesz przyjść bez rejestracji na portalu Meetup, jednak pojemność sali warsztatowej jest ograniczona (16 miejsc), więc prosimy o rejestrację ze względów organizacyjnych.


Czy chodziło Ci o....?


Po internecie krąży miejska legenda, jakoby pewnego dnia algorytmy Tesco słusznie przewidziały, że ich klientka jest w ciąży bazując na jej zakupach, które niewiele miały wspólnego z macierzyństem (http://www.businessinsider.com/the-incredible-story-of-how-target-exposed-a-teen-girls-pregnancy-2012-2). Jak w każdej legendzie, i w tej musi być ziarno prawdy. Mając pokaźny zbiór danych i stosując techniki znane już w latach 60' (!) (https://en.wikipedia.org/wiki/Association_rule_learning) można sprawnie określić powiązania niewidoczne na pierwszy rzut oka.

W trakcie warsztatów zaimplementujesz prostą wersję takiego algorytmu - silnik rekomentacji dla wyszukiwarki, zbliżony do google'owego "did you mean..." albo "related phrases". Przy okazji nauczysz się pracować w sparku i wykonywać podstawowe operacje: transformacje, agregacje i łączenie zbiorów danych. Znajomość podstaw pythona lub scali jest bardzo mile widziana. Nie musisz przynosić ze sobą 16-corowego laptopa - wykorzystamy chmurową platformę Databricks. Załóż wcześniej darmowe konto typu "community edition" na https://databricks.com/try-databricks


O prowadzącym: Mariusz Strzelecki - Fan(atyk) danych (głównie tych dużych, ale tych istotnych też ;-). Przemierza świat Big Data od ponad 3 lat.

Profile of employers

Similar events