霍金的最后著作《重大问题简答》里,阐述了他对于科学和社会所面临的最大问题的思考,关于人工智能,霍金表达了他的担忧。
“The concern is that AI would take off on its own and redesign itself at an ever-increasing rate. Humans, who are limited by slow biological evolution, couldn’t compete and would be superseded.”
—《Brief Answers to the Big Questions》
他的担忧,并不是AI取代人的工作。
从历史发展进程来看,从工业革命以来,蒸汽、电、计算机的发明,每一次都取代了一部分的工作,但同时创造了更多的工作,在这个维度,AI和人类发明的很多工具一样,将成为人能力的延伸和扩展,可以使得人从重复低效的劳动中解放出来,做更为重要的事情。
霍金所担心的,是人工智能具备自我学习和迭代能力。
一旦AI可以发展出自己的意愿,我们无法保证“AI的意愿”和人类保持一致。
近年的《西部世界》等科幻片,已经在描绘这样的场景,然而,科学家霍金的担忧,不仅仅是科幻,更不会是空穴来风。
这期节目,我给大家介绍一下,在这个领域最前沿的研究:通用人工智能(Artificial General Intelligence)
首先介绍一下通用人工智能的概念:
从本专辑之前的节目中,大家可以知道,人工智能的基本方法是通过标注数据对模型进行训练,图像识别要用海量图片作为数据输入,而语音识别要用海量语音作为数据输入,训练出来的人工智能,都是某一领域的专家。比如AlphaGo下棋很厉害,但是无法像Siri一样与人对话。不能跨领域的AI,是所谓的“弱”人工智能。
如何训练出既能读书写字又会唱歌跳舞,琴棋书画样样皆通的“强”人工智能,是一项很大的挑战。
通用性,是“弱”人工智能与“强”人工智能的分水岭。
为了解决通用的问题,采用的方法也有所不同。
比如,马斯克投资的OpenAI,采用了一种叫做Universe的结构,它包含了三个组成部分:环境environment、接口interface和智能代理agent。我在文稿中给出了示意图,听音频的朋友,可以想象眼前有三个方框,从左到右依次是环境、接口、智能代理。
- 环境是真实世界问题的抽象,比如,浏览网页、PS照片、编辑文稿等等
- 接口包含了输入与输出两类,Universe采用了信息时代我们最为熟悉的接口:键盘、鼠标和屏幕。
- 智能代理,则是人工智能的算法模型,这里主要是深度强化学习这一类的自我产生训练数据的方法。
值得注意的是,这个结构已经具备了通用性。今天我们使用个人电脑、手机、平板来处理各种问题,显示屏用于提供系统状态和反馈,鼠标键盘触屏用于提供控制,这是我们非常熟悉的方式,如果把人换成智能代理,就变成了Universe的结构。
有了方法论以后,Universe在左侧的环境中,导入了真实世界中的很多问题。
其中电竞游戏,因其玩法策略的复杂性,成为了主要研究内容之一。
从当年乔布斯曾参与设计研发的雅达利游戏(Atari Games)到近期风靡全球的星际争霸、DOTA等大型网络游戏,都与Universe环境进行了集成。
在右侧的智能代理,则是各种类型的算法和模型。
比如,著名的演员与批评家方法(Actor-Critics),演员选择表演行为,批评家评判行为提供反馈,演员根据反馈对行为进行改进,以此迭代。
其中,深度强化学习,结合了深度学习在数据特征提取方面的优势,和强化学习在序列决策任务方面的优势,是目前通用人工智能领域最有效的方法。
在上一期节目中,我介绍了“左右互搏”的阿尔法狗,通过自我迭代升级,成为了棋类领域的通用人工智能。
而DeepMind在今年宣布的Impala,采用一个通用算法,通过自我迭代升级,已经可以完成30项不同的认知任务,采用更少的数据,却在性能上超越了之前的智能代理。
媒体报导则更加惊人:说原来预计在2035年左右才会出现的第一代通用人工智能,已经整整提前了18年!
当然,我们也不必杞人忧天,所谓
“滚滚长江东逝水,浪花淘尽英雄…古今多少事,都付笑谈中”
展望明天,同时也要活在当下。
今天的这期节目,我们回顾了霍金先生的担忧:人工智能的自我迭代能力,并介绍了通用人工智能的前沿进展。
其实,人的核心能力,也是一样,从2018走向2019,我们具备这种能力,才能不断地迭代进步。
祝大家在2019年迭代升级!