Machine Learning Podcast

#062 ML Александр Резанов. Генеративный ИИ в компьютерном зрении


Listen Later

В гостях выпуска Александр Резанов - ML Engineer в Higgsfield AI, специалист по генеративному компьютерному зрению, о котором мы и будем говорить. Как развивалась область генеративного AI, какие подходы к генерации картинок применялись тогда и какие применяются сейчас. Нормализующие потоки, состязательные сети и диффузионные модели. Что с генерацией видео? Можно ли уже сейчас генерировать качественные видеоролики по текстовому описанию? Имеет ли смысл тягаться с корпорациями, вваливающими миллиарды долларов в вычислительные мощности, если у тебя одна не самая мощная видеокарточка? Где происходит все самое интересное по теме для обычного пользователя? Как учатся GAN'ы и как из шума получать фотореалистичные изображения? Reddit как источник идей и вдохновения для современных исследователей. Обо всем этом, и даже немного про сверхпроводимость в условиях комнатных температур, в выпуске!


Ссылки выпуска:


Статья на arxiv про вариационные автоэнкодеры (https://arxiv.org/abs/1312.6114)

Статья на arxiv про генеративно-состязательные сети (https://arxiv.org/abs/1406.2661)

Сайт с фотографиями несуществующих людей (https://thispersondoesnotexist.com/)

Статья на arxiv про Latent Diffusion Model (https://arxiv.org/abs/2112.10752)

OpenSource интерфейсы для диффузионных сетей:

1. AUTOMATIC1111 (https://github.com/AUTOMATIC1111/stable-diffusion-webui)

2. ComfyUI (https://github.com/comfyanonymous/ComfyUI)


Буду благодарен за обратную связь!

Мой телеграм для связи (https://t.me/kmsint)

Подписывайтесь на телеграм-канал "Стать специалистом по машинному обучению" (https://t.me/toBeAnMLspecialist)


Я сделал бесплатный курс по созданию телеграм-ботов на Python и aiogram на Степике (https://stepik.org/120924). Присоединяйтесь, если хотите научиться разрабатывать телеграм-ботов!

Также в соавторстве с крутыми разработчиками я пишу курс по продвинутой разработке телеграм-ботов с элементами микросервисной архитектуры (https://stepik.org/a/153850?utm_source=mlpodcast&utm_campaign=ep_62).


Выразить благодарность можно добрым словом и/или донатом (https://www.tinkoff.ru/rm/kryzhanovskiy.mikhail11/NkwE718878/)


...more
View all episodesView all episodes
Download on the App Store

Machine Learning PodcastBy Mikhail

  • 5
  • 5
  • 5
  • 5
  • 5

5

2 ratings


More shows like Machine Learning Podcast

View all
Лекции Arzamas by Arzamas / Арзамас

Лекции Arzamas

147 Listeners

ШоПоКо by Anton Pozdnyakov

ШоПоКо

148 Listeners

Что случилось by Медуза / Meduza

Что случилось

358 Listeners

Радио Медуза by Медуза / Meduza

Радио Медуза

97 Listeners

Бауновкаст by CarnegiePolitika.org

Бауновкаст

14 Listeners

kuji podcast by kuji podcast

kuji podcast

131 Listeners

Это непросто by Ксения Шульц

Это непросто

46 Listeners

Продолжение следует by Продолжение следует

Продолжение следует

58 Listeners

Психология с Александрой Яковлевой by Александра Яковлева

Психология с Александрой Яковлевой

64 Listeners

Серёжа и микрофон. Подкаст by Сережа и микрофон. Подкаст

Серёжа и микрофон. Подкаст

57 Listeners

Запуск завтра by libo/libo

Запуск завтра

84 Listeners

Закат империи by libo/libo

Закат империи

191 Listeners

План Б by Т—Ж

План Б

17 Listeners

Сигнал by Сигнал / Signal

Сигнал

68 Listeners

Вид на Кремль by Медуза / Meduza

Вид на Кремль

24 Listeners