牛油果烤面包

#128. 计算机视觉遇上大语言模型


Listen Later

整整4年前,计算机视觉领域专家孙晨首次做客节目,介绍了计算机视觉领域的发展。如今,他再次做客,详细讨论了大语言模型对计算机视觉带来的巨大冲击与新机遇,并回顾了过去4年的显著变化。他提到生成式模型的崛起,使图像和视频生成技术取得了突破性进展,以及扩散模型在生成高保真度图像中的应用。孙教授分享了他的研究成果,包括一个用于测试模型在新环境中表现的宇航员测试集。他还探讨了大语言模型在医学、教育等领域的广泛应用和未来趋势,强调了工程能力在该领域的重要性,并提出了未来发展的挑战与机遇。

嘉宾:孙晨

主播:斯图亚特、Vindy
剪辑&时间线:季雨清

  • 00:01:53 学校做科研和企业做研究的区别
  • 00:09:39 短短4年,做菜视频生成菜谱的理想已经实现
  • 00:19:34 学术界寻找自我
  • 00:22:37 计算机视觉的最新进展
  • 00:29:01 AI具备“理解”能力吗
  • 00:37:16 给AI打工
  • 00:44:41 计算机视觉的可能未来
  • 00:51:24 如何进入计算机视觉领域
  • 欢迎您在每期节目下方给我们留言,和我们的主播互动交流。如果您对我们的志愿者工作有兴趣,请点击 这个链接 看我们的招募帖;你有什么有趣的话题,想来作牛油果烤面包的嘉宾,或是对节目有任何的意见或建议,欢迎发邮件和我们联系。我们的邮件地址是:[email protected]

    片头片尾音乐:

    Courante 1st Cello Suite
    Exzel Music Publishing (freemusicpublicdomain.com)
    Licensed under Creative Commons: By Attribution 3.0
    http://creativecommons.org/licenses/by/3.0/

    ...more
    View all episodesView all episodes
    Download on the App Store

    牛油果烤面包By 牛油果烤面包

    • 4.5
    • 4.5
    • 4.5
    • 4.5
    • 4.5

    4.5

    41 ratings


    More shows like 牛油果烤面包

    View all
    津津乐道 by DAO

    津津乐道

    119 Listeners

    疯投圈 by 黄海、Rio

    疯投圈

    109 Listeners

    日谈公园 by 日谈公园

    日谈公园

    439 Listeners

    声东击西 by ETW Studio

    声东击西

    314 Listeners

    科技乱炖 by DAO

    科技乱炖

    24 Listeners

    忽左忽右 by JustPod

    忽左忽右

    440 Listeners

    What's Next|科技早知道 by 声动活泼

    What's Next|科技早知道

    176 Listeners

    硅谷101 by 硅谷101

    硅谷101

    184 Listeners

    东亚观察局 by 东亚观察局

    东亚观察局

    209 Listeners

    商业就是这样 by 商业就是这样

    商业就是这样

    272 Listeners

    声动早咖啡 by 声动活泼

    声动早咖啡

    262 Listeners

    半拿铁 | 商业沉浮录 by 潇磊&刘飞

    半拿铁 | 商业沉浮录

    291 Listeners

    边角聊 by Leftover Talk

    边角聊

    42 Listeners

    硬地骇客 by skoowoo

    硬地骇客

    17 Listeners

    42章经 by KaiQu

    42章经

    9 Listeners