Rozmowa z Piotrem Rybakiem - NLP researcherem w PAN w Instytucie Podstaw Informatyki
Rozmawiamy min.:
- najlepszych praktykach w budowaniu systemów typu "Retrieval"
- jak trenować modele do tworzenia embeddingów
- o budowie datasetów, tłumaczeniu angielskich i scrapowaniu
- o tym czy LLMy mogą ukrywać przed nami swoją świadomość
- czy proste rzeczy są naprawdę proste i czy są łatwe do zrozumienia
- o różnicach w wiedzy na temat polskich i angielskich QnA
- modelach Silver Retriever,
- datasetach MAUPQA i POLQA
- aplikacji do rozpoznawania klocków LEGO
Przydatne linki:
Papers with code:
https://paperswithcode.com/search?q=author%3APiotr+Rybak
model Silver Retriever
https://huggingface.co/ipipan/silver-retriever-base-v1
datasety Polqa i Maupqa
https://huggingface.co/datasets/ipipan/polqa
https://huggingface.co/datasets/ipipan/maupqa
Aplikacja do rozpoznawania klocków LEGO:
https://brickognize.com/
Książka "Jak zacząć podcast" - poradnik dla osób, które chcą zacząć podcastować
Napisz do mnie:
Michal Dulemba | LinkedIn
Subskrybuj podcast:
Apple Podcasts
Spotify
Google Podcasts
Podcast Addict
RSS
Korzystam z:
Buzzsprout (hosting odcinków):
https://www.buzzsprout.com/?referrer_id=1783532
Riverside (aplikacja do zdalnego nagrywania):
https://www.riverside.fm/?via=dulemba