124. spotkanie Data Community Krakow

18:00 – 18:15 Rozpoczęcie spotkania, sprawy organizacyjne
18:15 – 19:20 Od B-Drzew do V-Order - opowiedziane inaczej niż zwykle - Tomasz Kostyrka
19:20 – 19:45 Networking
19:45 – 20:45 Wprowadzenie do MS Fabric Real-Time Intelligence - Michał Sadowski
20:45 – 20:50 Zakończenie spotkania
Zapraszamy na 124. spotkanie krakowskiej grupy Data Community.
KIEDY
17 października (czwartek) - 18:00
GDZIE
Wyższa Szkoła Ekonomii i Informatyki w Krakowie - sala Praga
ABSTRAKT
Od B-Drzew do V-Order - opowiedziane inaczej niż zwykle - Podczas sesji omówimy podstawowe techniki optymalizacji zapytań, zaczynając od klasycznych indeksów (B-Tree) dla baz relacyjnych, poprzez partycjonowanie, Z-Order oraz Liquid Clustering dla DataLake/Lakehouse, a kończąc na wprowadzonym przez Microsoft mechanizmie V-Order, który przyspiesza działanie zapytań w trybie Direct Lake.
W ciągu tej godziny będziemy często odwoływać się do podstaw matematycznych stojących za tymi mechanizmami, jednocześnie sprawdzając, jak daleko odbiega od rzeczywistości nasza intuicja i to, co czasem uważamy za oczywiste.
Odpowiemy sobie m.in. na pytania:
- czym różnią się porządek częściowy od liniowego i jak ma się to do sortowania wierszy w tabelach,
- skąd wzięły się krzywe Mortona i Hilberta, zanim zostały wykorzystane do optymalizacji mechanizmu "Data Skipping",
- z czego składa się plik Parquet, jak działa Predicate Pushdown i dlaczego Z-Order i V-Order nie wykluczają się wzajemnie.
- A także...
- ilu nowych krasnoludków zmieści się w zapełnionym hotelu o nieskończonej liczbie pokoi? ;)
BIO
Tomasz Kostyrka - Data Platform Architect @GetInData | Part of Xebia. Od 10 lat w projektach z obszaru Data opartych w większości o platformę Microsofti chmurę Azure. Ostatnie lata chętnie uciekający w tematy związane z Architekturą i DevOps.