Machine Learning Podcast

#062 ML Александр Резанов. Генеративный ИИ в компьютерном зрении


Listen Later

В гостях выпуска Александр Резанов - ML Engineer в Higgsfield AI, специалист по генеративному компьютерному зрению, о котором мы и будем говорить. Как развивалась область генеративного AI, какие подходы к генерации картинок применялись тогда и какие применяются сейчас. Нормализующие потоки, состязательные сети и диффузионные модели. Что с генерацией видео? Можно ли уже сейчас генерировать качественные видеоролики по текстовому описанию? Имеет ли смысл тягаться с корпорациями, вваливающими миллиарды долларов в вычислительные мощности, если у тебя одна не самая мощная видеокарточка? Где происходит все самое интересное по теме для обычного пользователя? Как учатся GAN'ы и как из шума получать фотореалистичные изображения? Reddit как источник идей и вдохновения для современных исследователей. Обо всем этом, и даже немного про сверхпроводимость в условиях комнатных температур, в выпуске!


Ссылки выпуска:


Статья на arxiv про вариационные автоэнкодеры (https://arxiv.org/abs/1312.6114)

Статья на arxiv про генеративно-состязательные сети (https://arxiv.org/abs/1406.2661)

Сайт с фотографиями несуществующих людей (https://thispersondoesnotexist.com/)

Статья на arxiv про Latent Diffusion Model (https://arxiv.org/abs/2112.10752)

OpenSource интерфейсы для диффузионных сетей:

1. AUTOMATIC1111 (https://github.com/AUTOMATIC1111/stable-diffusion-webui)

2. ComfyUI (https://github.com/comfyanonymous/ComfyUI)


Буду благодарен за обратную связь!

Мой телеграм для связи (https://t.me/kmsint)

Подписывайтесь на телеграм-канал "Стать специалистом по машинному обучению" (https://t.me/toBeAnMLspecialist)


Я сделал бесплатный курс по созданию телеграм-ботов на Python и aiogram на Степике (https://stepik.org/120924). Присоединяйтесь, если хотите научиться разрабатывать телеграм-ботов!

Также в соавторстве с крутыми разработчиками я пишу курс по продвинутой разработке телеграм-ботов с элементами микросервисной архитектуры (https://stepik.org/a/153850?utm_source=mlpodcast&utm_campaign=ep_62).


Выразить благодарность можно добрым словом и/или донатом (https://www.tinkoff.ru/rm/kryzhanovskiy.mikhail11/NkwE718878/)


...more
View all episodesView all episodes
Download on the App Store

Machine Learning PodcastBy Mikhail

  • 5
  • 5
  • 5
  • 5
  • 5

5

2 ratings


More shows like Machine Learning Podcast

View all
Завтракаст (Zavtracast) by Завтракаст (Zavtracast)

Завтракаст (Zavtracast)

120 Listeners

Не занесли by Максим Иванов, Павел Пивоваров, Артемий Леонов

Не занесли

58 Listeners

Что случилось by Медуза / Meduza

Что случилось

360 Listeners

Радио Медуза by Медуза / Meduza

Радио Медуза

94 Listeners

Продолжение следует by Продолжение следует

Продолжение следует

58 Listeners

Зачем я это увидел? by Arzamas

Зачем я это увидел?

25 Listeners

Короче, история by Максим Зеленский и Алексей Катефин

Короче, история

99 Listeners

Несладкий бизнес by Anya & Nastya

Несладкий бизнес

7 Listeners

Экономика на слух by РЭШ

Экономика на слух

12 Listeners

На пенсию в 35 лет! by Babaykin

На пенсию в 35 лет!

12 Listeners

Прием by Т—Ж

Прием

6 Listeners

Живой Гвоздь by Живой Гвоздь

Живой Гвоздь

178 Listeners

Популярная политика by Популярная политика

Популярная политика

25 Listeners

‎Неловкая пауза by Arzamas

‎Неловкая пауза

15 Listeners

Время и деньги by libo/libo

Время и деньги

35 Listeners