德塔赛

主动学习的几种策略


Listen Later

主动学习的几种策略

现实生活中的绝大部分数据都是没有标签的。在收集整理了数据后,如果人工对每一条数据一一标注,时间成本和经济成本都会非常高。在本期节目中,张驰丞介绍了这个问题的一种解决方法:主动学习,由算法主动索要某一些数据标签的机器学习方法。我们将深入讨论不同的方法是如何判断哪些样本格外“困难”,需要手工标注。

本期提到的资源:

  • 张驰丞个人主页
  • 驰丞提到的一类主动学习方法,争议型准则的相关文章:Beyond Disagreement-based Agnostic Active Learning
  • 在讲到agnostic的设定下,我们提到了PAC Learning
  • 节目开始时提到的可以用来标识数据的众包平台 Amazon Mechanical Turk
  • ...more
    View all episodesView all episodes
    Download on the App Store

    德塔赛By 德塔赛

    • 5
    • 5
    • 5
    • 5
    • 5

    5

    6 ratings