This event has already taken place. Check upcoming events
Wprowadzenie do Big Data i Apache Spark
Event:
Wprowadzenie do Big Data i Apache Spark
Event type:
Workshops
Category:
Topic:
Date:
09.09.2017 (saturday)
Time:
09:00
Language:
Polish
Price:
Free
City:
Place:
TBD
Log in, by zgłosić zmianę.
Agenda:
- 1. Wstęp do Big Data.
- Definicja.
- Czym jest Big Data?
- Geneza i historia Big Data.
- Typy przetwarzania Big Data.
- 2. Apache Spark.
- Wstęp.
- Historia.
- Spark a Hadoop.
- Architektura.
- Warianty uruchomienia klastra.
- 3. Spark Core.
- Wstęp.
- Java vs Scala vs Python.
- Łączenie z klastrem.
- Rozproszone dane.
- Operacje.
- Współdzielone zmienne.
- Uruchomienie i testowanie.
- 4. Spark SQL
- Wstęp.
- Spark SQL a Hive.
- Zasada działania.
- Dane i schematy.
- Zapytania.
- Integracja z Hive.
- Uruchomienie i testowanie.
- 5. Spark Streaming
- Wstęp.
- Zasada działania.
- Strumienie.
- Uruchomienie i testowanie.
- 6. Pozostałe komponenty rodziny Apache Spark
- MLlib.
- GraphX.
Description:
Poznaj Apache Spark - najszybciej rozwijający się projekt Big Data ostatnich lat - podczas jednodniowych warsztatów z ekspertem! Program oferuje szybki start w świecie przetwarzania Big Data wraz z Apache Spark. Oprócz prezentacji, dla uczestników jest przygotowany warsztat, gdzie w praktyce będą mieli okazję samodzielnie eksplorować zbiory danych.
Podczas warsztatów:
- zdobędziesz podstawową wiedzę, dotyczącą problemów skali Big Data,
- dowiesz się co to RDD,
- poznasz największą rewolucję w Big Data od czasów Hadoop: Apache Spark,
- poznasz zalety i wady omawianych technologii.
Podczas warsztatu będziemy pracować w Pythonie. Od uczestników wymagana jest podstawowa wiedza z SQLa, basha, Pythona (lub innego języka skryptowego) oraz Javy. Uczestnicy w trakcie zajęć korzystają z własnego sprzętu (wymagany komputer z min. 6GB RAM i procesorem Intel i5 lub nowszym/podobnym).