Machine Learning Podcast

#055 ML Илья Гусев. Как запускать большие языковые модели локально


Listen Later

Гостем выпуска стал Илья Гусев - известный NLP-специалист, сделавший большой вклад в область своими опенсорс-проектами, среди которых анализатор морфологии, генератор стихов, сборка различных датасетов и некоторые другие. Один из таких проектов как раз и стал поводом к сегодняшнему общению. Это большая языковая модель, заточенная на работу с русским языком - Сайга. Но говорим в выпуске мы далеко не только о ней. Илья сделал классный исторический экскурс в современные языковые модели, рассказал некоторые подробности об их устройстве, о тех подходах, которые применяют, чтобы такие модели можно было запускать на домашнем компьютере, как с помощью языковых моделей можно решать разные задачи и стоит ли вообще использовать локальные модели. Интересного и полезного прослушивания!


Ссылки выпуска:


Статья Ильи на Хабре "Как (быстро) сделать русский локальный ChatGPT" (https://habr.com/ru/articles/759386/)

Сервис для запуска больших языковых моделей локально - lmstudio (https://lmstudio.ai/)

Репозиторий сервиса oobabooga, с помощью которого можно запустить веб-интерфейс для работы с LLM локально (https://github.com/oobabooga/text-generation-webui)

Репозиторий сервиса Text Generation Inference (TGI), который позволяет развертывать и поддерживать LLM (https://github.com/huggingface/text-generation-inference)

Статья на arxiv "Self-Consuming Generative Models Go MAD" с анализом того, к чему приводят разные подходы обучения LLM на синтетических датасетах, сгенерированных другими LLM (https://arxiv.org/abs/2307.01850)

Пост Ильи со списком материалов для погружения в NLP (https://t.me/natural_language_processing/81627)


Буду благодарен за обратную связь!


Вступайте в книжный ML-клуб, где мы читаем книги по машинному обучению и смежным темам!

MLBookClub (https://t.me/+HIXnIwXIIFAyYzYy)

Подписывайтесь на телеграм-канал "Стать специалистом по машинному обучению" (https://t.me/toBeAnMLspecialist)


Мой телеграм для связи (https://t.me/kmsint)

Также со мной можно связаться по электронной почте: [email protected]


Я сделал бесплатный курс по созданию телеграм-ботов на Python и aiogram на Степике (https://stepik.org/120924). Присоединяйтесь, если хотите научиться разрабатывать телеграм-ботов!

И буквально неделю назад я открыл доступ к пре-релизу нового курса по продвинутой разработке телеграм-ботов с элементами микросервисной архитектуры (https://stepik.org/a/153850?utm_source=mlpodcast&utm_campaign=ep_55)


Выразить благодарность можно добрым словом и/или донатом (https://www.tinkoff.ru/rm/kryzhanovskiy.mikhail11/NkwE718878/)

...more
View all episodesView all episodes
Download on the App Store

Machine Learning PodcastBy Mikhail

  • 5
  • 5
  • 5
  • 5
  • 5

5

2 ratings


More shows like Machine Learning Podcast

View all
Завтракаст (Zavtracast) by Завтракаст (Zavtracast)

Завтракаст (Zavtracast)

120 Listeners

Не занесли by Максим Иванов, Павел Пивоваров, Артемий Леонов

Не занесли

58 Listeners

Что случилось by Медуза / Meduza

Что случилось

360 Listeners

Радио Медуза by Медуза / Meduza

Радио Медуза

95 Listeners

Продолжение следует by Продолжение следует

Продолжение следует

58 Listeners

Зачем я это увидел? by Arzamas

Зачем я это увидел?

25 Listeners

Короче, история by Максим Зеленский и Алексей Катефин

Короче, история

99 Listeners

Несладкий бизнес by Anya & Nastya

Несладкий бизнес

7 Listeners

Экономика на слух by РЭШ

Экономика на слух

12 Listeners

На пенсию в 35 лет! by Babaykin

На пенсию в 35 лет!

12 Listeners

Прием by Т—Ж

Прием

6 Listeners

Живой Гвоздь by Живой Гвоздь

Живой Гвоздь

178 Listeners

Популярная политика by Популярная политика

Популярная политика

25 Listeners

‎Неловкая пауза by Arzamas

‎Неловкая пауза

15 Listeners

Время и деньги by libo/libo

Время и деньги

35 Listeners