Почему нейросети генерируют бред, когда от них ждут правды? Как преодолеть разрыв между компьютерной лингвистикой и теоретической? Что мы можем узнать с помощью нейросетей о внутреннем устройстве языке, и на каком слое BERT «лежит синтаксис»? Каким должно быть образование в области Natural Language Processing?
Все это мы обсудили с новым гостем подкаста «Неопознанный искусственный интеллект» — руководителем направления в «SberDevices», одним из создателей семейства голосовых помощников «Салют» Денисом Кирьяновым. Яркие моменты выпуска:
01:33 — как делали голосовых помощников «Салют»
03:25 — чем машина все еще хуже человека: проблема целеполагания
06:53 — «писули» от «волшебной машины»: почему GPT-3 генерирует фейковые факты и выдуманные названия рок-групп
10:50 — как сделать персональных помощников более человекоподобными: проактивные ИИ-зануды
14:22 — как машине научиться делать то, чего она никогда не видела
16:55 — конец нейронного блицкрига: «забрасывать железом» компьютерно-лингвистические задачи больше не модно
17:59 — применение лингвистики в разработке голосовых помощников
19:07 — вычислительная лингвистика versus лингвистическая теория
24:30 — лингвисты между двумя стульями: преодолим ли разрыв между теоретиками и компьютерщиками
28:24 — что могут дать компьютерные модели теоретическим лингвистам
31:22 — когда нейросети начнут создавать новые теории
39:31 — ИИ будущего и межкультурные различия
40:54 — как должно быть устроено образование в области автоматической обработки языка
43:42 — Data Science в курятнике и кибер-village
Ведущие подкаста: Даниил Скоринкин и Анатолий Старостин.
Над выпуском работали: Наталья Перкова, Этери Джафарова, Михаил Калра, Алена Завьялова, ВГ, Анастасия Хорошева и Илья Булгаков.
Подкаст издания Системный Блокъ. Пишите ваши вопросы и идеи на [email protected].