Logo Crossweb

Logowanie

Nie masz konta? Zapomniałem hasła

Przypomnij hasło

close Wypełnij formularz.
Na Twój adres e-mail zostanie wysłane link umożliwiający zmianę hasła.
Wyślij
<< przejdź do listy podcastów

Spichlerz / Speakleash - open source dataset z polskimi tekstami - Sebastian Kondracki

05.04.2023
00:44
Polski

Rozmowa z Sebastianem Kondrackim - jednym z założycieli projektu Spichlerz / Speakleash

Rozmawiamy na temat:
- czym jest projekt Spichlerz / speakleash
- ścieżce jaką przeszedł Sebastian poznając m.in ludzi z HuggingFace
- ilości danych potrzebnych, żeby trenować dobry model języka polskiego
- ochotnikach, którzy pracują przy projekcie
- etapie na jakim jest teraz projekt (update - ponad 140GB!)
- promowaniu polskich projektów Open Source
- osobach i organizacjach, które wspierają aktualnie Spichlerz

Codebooster - szkolenie z AI dla programistów
https://codebooster.pl

PDF - Jak generować dane za pomocą chatGPT:
PDF “Jak generować dane w chatGPT” (codebooster.pl)


Oficjalna strona
https://speakleash.org/

Repo na github:
https://github.com/speakleash

Dashboard pokazujący ilość danych:
Speakleash Dashboard · Streamlit

LinekdIn:
https://www.linkedin.com/company/speakleash/

Twitter
https://twitter.com/Speak_Leash

Discord
https://discord.gg/a2rz3v9e

Email
[email protected]

PyPi
https://pypi.org/project/speakleash/

Linkedin Sebastiana:
Sebastian Kondracki | LinkedIn

Osoby zaangażowane w projekt:
Jacek Chwiła (Credit Agricole Bank Polska) 
Adrian Gwoździej (BTC) 
Jan Maria Kowalski (Bank Pekao SA) 
Izabela Babis (Deviniti) 
Mateusz Kuras (Deviniti) 
Maciej Ogrodnik (Deviniti) 
Maria Filipkowska 
Tomasz Siedlecki 
Marcin Kurzyna (Wirtualna Polska S.A.) 
Waldemar Boszko
i inni anonimowi pasjonaci AI

Napisz do mnie:
Michal Dulemba | LinkedIn

Subskrybuj podcast:
Apple Podcasts
Spotify
Google Podcasts
Podcast Addict
RSS

Podobne podcasty