Share Деньги любят техно
Share to email
Share to Facebook
Share to X
By VTB Bank
The podcast currently has 31 episodes available.
Ищем сходства и различия в задачах DS-команд в финтехе и промышленности, обсуждаем проблемы и решения, выделяем главные направления развития ML в этих сферах.
Ведущие выпуска: Юлий Шамаев, начальник управления моделирования партнерств и ИТ-процессов ВТБ, и Марина Эфендиева, технологический обозреватель.
Подкаст доступен в видео-версии на платформе VK Видео и на всех популярных аудио-платформах. Подпишитесь, чтобы поддержать нас и не пропустить новые эпизоды сезона Data Science.
Ведущие эпизода: Юлий Шамаев, начальник управления моделирования партнерств и ИТ-процессов ВТБ, и Марина Эфендиева, технологический обозреватель.
Этот выпуск — «пилот» пятого сезона, который мы запускаем и в уже привычном формате аудио, и в новом для нашего подкаста формате видео. Слушайте и смотрите нас на удобных вам площадках и поддержите подкаст, если считаете, что он приносит пользу!
С командой дата-сайентистов из ВТБ подводим итоги 2023 года в темах развития нейросетей, машинного обучения, инструментов на базе ИИ. Конечно же говорим про большие языковые модели и начало гонки генеративного AI среди бигтехов. Делимся своим опытом использования нейросетей в работе и в жизни. Говорим об этике, философски обсуждаем настоящее и немного фантазируем о будущем. И пытаемся узнать, когда ИИ поработит человечество.
Участники:
• Антон Бабак, тимлид в команде перспективных алгоритмов машинного обучения
• Иван Яруков, Senior DS, моделирование в крупном бизнесе и СМБ
• Анатолий Глушенко, тимлид DS, моделирование партнерств и ИТ-процессов
Ведущая:
• Технологический обозреватель Марина Эфендиева
Подпишитесь, чтобы послушать другие эпизоды сезона Data Science в подкасте «Деньги любят техно».
Машинное обучение так или иначе уже применяется в компаниях самых разных масштабов и направлений деятельности. Однако для выстраивания зрелой ML-инфраструктуры и перехода к эффективным MLOps-практикам требуется понимание: с чего начать, на какие платформы обратить внимание, к каким инструментам присмотреться внимательнее, а какие подойдут лишь для разовых экспериментов.
К инструментам MLOps для больших исследовательских и бизнес-задач предъявляется три базовых требования: интерпретируемость, воспроизводимость, надёжность. Как среди десятков Open-Source-инструментов выбрать правильные, что могут или не могут использовать компании, к которым предъявляются высокие требования стандартизации, на чем должен основываться выбор между облаками и InHouse для ML — в третьем выпуске серии MLOps обсудили Юрий Карев, руководитель управления процессов и стандартов моделирования и машинного обучения ВТБ, и Алексей Незнанов, к.т.н, старший научный сотрудник международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ.
Подпишитесь, чтобы не пропустить новые эпизоды сезона Data Science в подкасте «Деньги любят техно».
Дополнительные материалы:
Ссылки на полезные ресурсы к этому эпизоду ищите в нашем блоге на Хабр: https://habr.com/ru/companies/vtb/news/778270/
Во второй части большой темы про MLOps, которую мы разбили на несколько эпизодов подкаста, ещё глубже погружаемся в тему машинного обучения и работы с данными, лежащей в основе ML. Рассматриваем вопросы обогащения данных, разбираемся с разметкой, говорим о специфических аспектах управления данными.
В этом выпуске вы услышите:
Почему общепринятых стандартов управления данными недостаточно для работы с большими данными для ML;
Что такое хвосты и артефакты в сверхбольших данных;
Может ли overfeeding стать причиной overfitting’a (или это одно и то же?);
И многое другое!
Юрий Карев, руководитель управления процессов и стандартов моделирования и машинного обучения ВТБ, и Алексей Незнанов, к.т.н, старший научный сотрудник международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ, подошли к теме с двух сторон: теоретической и практической. Помогли ведущей подкаста разобраться с терминологией. А также поговорили про специфику подходов к образованию для специалистов в Data Science, DataOps и MLOps.
Полезные ресурсы и ссылки:
Курс MLOps (OTUS): https://otus.ru/lessons/ml-bigdata/
Основные идеи из книги «Сотрудничество в DevOps-культуре»: http://agilemindset.ru/основные-идеи-из-книги-сотрудничест/
MLOps: Continuous delivery and automation pipelines in machine learning: https://cloud.google.com/architecture/mlops-continuous-delivery-and-automation-pipelines-in-machine-learning
Как создавать качественные ML-системы. Часть 1: каждый проект должен начинаться с плана: https://habr.com/ru/companies/vk/articles/749850/
Как создавать качественные ML-системы. Часть 2: приручаем хаос: https://habr.com/ru/companies/vk/articles/749852/
The Data Engineering Cookbook: https://github.com/andkret/Cookbook
Стандарты:
ISO/IEC DIS 5259-1: https://www.iso.org/standard/81088.html
ISO/IEC DIS 5259-4: https://www.iso.org/standard/81093.html
ISO/IEC 8183:2023: https://www.iso.org/standard/83002.html
О нейронных сетях мы слышим сегодня буквально отовсюду. Это — одно из наиболее активно развивающихся направлений в машинном обучении. В новом выпуске подкаста «Деньги любят техно», сезон Data Science, пробуем зайти в тему нейросетей с необычного ракурса.
С Артемом Летиным, начальником управления корпоративного моделирования ВТБ, Евгением Смирновым, руководителем Лаборатории машинного обучения Альфа-Банка и Никитой Зелинским, руководителем центра компетенций Data Science МТС говорим о применении нейросетей в кредитном скоринге и других сегментах деятельности финансовых организаций.
В этом выпуске мы возвращаемся к теме MLOps — на этот раз с Алексеем Незнановым, к.т.н., старшим научным сотрудником международной лаборатории интеллектуальных систем и структурного анализа НИУ ВШЭ, и Юрием Каревым, руководителем управления процессов и стандартов моделирования и машинного обучения ВТБ.
Начинаем с обсуждения самого понятия MLOps: что это — необходимые для большой компании практики или очередная хайповая тема? Как интегрировать MLOps в производственные IT процессы и зачем это делать? Насколько на развитие этого направления влияют вопросы управления данными, очистки данных, и решены ли они.
Спойлер: это первый выпуск на тему MLOps из запланированной серии. Подпишитесь, чтобы не пропустить продолжение.
Мы рады поделиться первым выпуском четвёртого сезона подкаста «Деньги любят техно» — и это уже второй сезон, посвящённый темам Data Science. Сразу же решили обсудить животрепещущую тему датасетов для искусственного интеллекта: их доступность, их источники, вопросы регулирования и востребованности рынком.
В этом выпуске — Алексей Каширин, директор Центра продвинутой аналитики Альфа-Банка и Сергей Голицын, вице-президент, заместитель руководителя Департамента анализа данных и моделирования ВТБ поговорили о применении датасетов в финтехе и других отраслях, поделились опытом работы своих команд, рассказали о самых заметных событиях и конкурсах в этой области.
The podcast currently has 31 episodes available.