国际在线消息:3月18日,成都大运会倒计时100天之际,由大运会执委会主办,腾讯承办的“世界大学生数智竞技邀请赛”正式启动。这次邀请赛将融合科技、文化、竞技的赛场精神,以《王者荣耀》和腾讯AI Lab共同研发的AI开放研究平台——开悟为载体,为全球大学生提供一个AI科技交流的顶级舞台。
以世界大学生数智竞技邀请赛的举办为契机,我们也从游戏的产生、AI与游戏结合等角度,了解这个领域背后的历史、现状和对于人类未来的意义。
荷兰的语言学家和历史学家说:游戏是人类文化中的固有成分,游戏所代表的竞赛精神和创新精神,促进了社会发展。
在科教影片《动物世界》里,有一个温馨画面令人难忘:两只小狮子在母亲慈爱目光的注视下,相互嬉戏、打闹,无忧无虑、快乐地成长。从专家的解说我们得知,这种游戏、打闹并不是毫无意义的,正是通过这种游戏,小狮子们逐渐掌握了生存技能,获取独立生活的能力。
如同狮子一样,地球上所有的动物,包括我们人类,他们的成长、生息所需的技能和知识,都是得益于幼年、童年乃至成年时期的游戏,游戏是人类历经百万年进化过程中形成的最本能的、最自然的学习方式。
几千年来,人们创造出不计其数的各类游戏,比如围棋、象棋、国际象棋、跳棋、扑克、麻将、桌游、篮球、足球、乒乓球等。半个多世纪前,当改变人类历史的互联网诞生时,一位名叫瑞克·布罗米的美国人为PLATO远程教学系统编写了第一款网络游戏-《太空大战》,可以支持两人远程连线。
互联网上早期诞生的游戏,主要是为了满足人类的娱乐休闲,到20世纪末出现的MUD游戏,开始有了更多社交属性。21世纪以来,随着教育、科研、工作等属性越来越多的加入到互联网的游戏世界中,游戏的社会价值得到了凸显。人类对网络游戏的品质和价值的追求也不断刺激着前沿科技的发展,从对显示技术、计算速度的追求到交互技术,智能水平的追求。由此成为互联网的网络速度、存储空间、计算能力、交互技术、智能技术的最重要推动力之一。
AI通过游戏与人类竞赛的30年简史
在网络游戏产生的所有推动力中,人工智能技术与游戏的结合最为引人关注,人类不断强化参与游戏博弈的AI对手的能力,希望能从它与人类竞赛的过程中找到技术启示。在过去的30年中,这种梦想不断得到实现和突破,并一次次震惊人类。
1997年,IBM的Deep Blue深蓝以4:2战胜了国际象棋世界冠军卡斯帕罗夫。虽然最后深蓝“惨遭肢解”,一半送进史密森尼博物院,另一半归美国计算机历史博物馆,但却给整个世界极大的震撼。
2016年3月,Google旗下DeepMind公司开发的人工智能程序AlphaGo,以4:1战胜世界围棋冠军李世石。2017年5月,AlphaGo又以3:0战胜人类排名第一的选手柯杰。而后面DeepMind也迅速的发布了AlphaGo Zero和AlphaZero,基于深度强化学习自我对弈的方式,完全抛弃人类知识,只从棋类的规则出发,不单在围棋上,也在国际象棋和将棋上同样达到了世界最强的水平。
除了棋类游戏之外,牌类游戏也是游戏AI关注的一个焦点。相比于棋类这样的完全信息博弈游戏,牌类这样的非完全信息博弈游戏有一定的运气因素,同时还牵扯到和对手的博弈,不完全是计算智能所关注的方向,更多的可能要和博弈论相结合。2017年1月,在美国宾夕法尼亚州匹兹堡的河流赌场,一个名为Libratus的AI程序,在共计12万手的一对一无限注德州扑克比赛中,轮流击败四名顶尖人类高手,斩获20万美元奖金和约177万美元的筹码。
在AI电子竞技领域,2015年,谷歌DeepMind在《自然》杂志上发表了著名的文章《通过深度强化学习达到人类水平的控制》,提出了著名的深度Q网络(DQN)。面对策略类电脑游戏,挑战难点不仅仅是像素点阵组成的画面,更在于高级认知水平的表现,考察AI能否综合对多种单位、多种要素等的分析,设计复杂的计划,并随时根据情况灵活调整计划,尤其是即时类策略游戏,被视为AI最难玩的游戏。星际争霸(StarCraft)就是一款这样的游戏,
在平台方面,DeepMind在成功使用深度学习攻克Atari游戏后,宣布和暴雪公司合作,将StarCraft II作为新一代AI测试环境,发布SC2LE平台。在此后的数年里,AI程序员建立的AI玩家通过星际争霸与人类玩家进行了激烈的对抗,在不断对抗中成长。
30年来AI与人类在游戏中的竞赛,场景不断从简单走向复杂,从确定性强走向不确定强,从规则明确走向规则不明确。使得AI在游戏中的应用也逐步走出了纯粹的娱乐,开始向着教育、科学研究和产业探索拓展。
中国AI与游戏平台结合的进展
腾讯是中国一家特征鲜明的互联网科技公司,丰富的数据和应用场景使得它拥有了良好的人工智能发展基础,其提出的科技向善理念也使得腾讯不断加码在人工智能领域的投入。
在过去5年时间里,腾讯分别在社交AI,内容AI和平台AI领域取得的重要进展,同样腾讯作为中国最重要的游戏平台之一,其AI与游戏结合也将是腾讯AI最为鲜明的特征。在腾讯AI与围棋结合产生的“绝艺”在2018年的世界人工智能围棋总决赛获得冠军后,腾讯AI与游戏平台结合,由《王者荣耀》和腾讯AI Lab共同研发的人工智能开放研究平台——开悟,便是腾讯AI接下来重点打造的AI产品之一。
开悟作为中国为数不多的研究多智能体博弈的开放算法平台,一方面,以多智能体作为核心研究问题,依托《王者荣耀》模拟环境,结合算法、数据、算力优势,为学术研究人员提供AI研究应用探索平台。另一方面,开悟以游戏AI为切入,携手高校与研究机构共同推动多智能体研究发展,共同打造AI+游戏产学研新生态。目前,以开悟为平台基础,两届“腾讯开悟多智能体强化学习高校邀请赛”已经成功落地,国内20+名校积极响应,成为国内高校顶级AI竞赛。
《王者荣耀》作为多智能体测试的绝佳环境,其游戏中所测试的AI智能体,具备自主决策、自主启动、共同协作以达成统一目标等强化学习技能。这也意味着,《王者荣耀》中的英雄控制AI技术,可以应用到如智能制造、智能电网、智慧物流、智慧交通、车路协同、车车协同、无人驾驶的应用中去。
腾讯天美L1工作室总经理、《王者荣耀》项目执行制作人黄蓝枭曾表示:“我们开放了《王者荣耀》核心机制,提供标准接口、核心算法、脱敏的测试数据、评估工具和计算集群等,给高校老师和同学们进行多智能体的机器学习算法研究、学习成果交流,对算法成果反复迭代升级。期待这些研究成果能够落地其他产业环境,为工业机器人、救灾机器人等提供助力。”
在科学家和行业专家带领团队探索将AI游戏策略转换为产业价值的同时,也必然会提高团队学生或学员的创造力与研究才能,为生态贡献跨学科技术、跨界人才和多方资源。
其次,《王者荣耀》开悟平台在帮助解决科研技术瓶颈,突破基础科学壁垒,加速“通用人工智能”研究也有重要的价值。现阶段,逼近或超越人类的“通用人工智能”仍是一个构想,但在人类不断向这个目标冲击的过程中,将可以涌现出智能领域的基础科学突破,智能产业技术的创新。利用《王者荣耀》作为科学与技术的实验田,链接科学院所、科技企业和政府机构,储备人才与技术资源,深耕底层技术发展,为未来埋下可以引发“智能爆炸”的种子。
在中国除了腾讯外,网易、搜狐、世纪华通、完美世界、IGG、哔哩哔哩也都在AI+游戏的领域里不断突破,形成不同特色的应用场景。对于他们在这个领域的进展,我们将在后续进行详细分析。
AI与游戏结合的未来
游戏是信息革命的最重要发动机之一,是庞大的软件和硬件产业皇冠上的明珠,而人工智能的加入为它添加了可以翱翔的翅膀,使游戏的意义不仅仅局限在娱乐和休闲,而是可以拓展到为产业,为教育,为科学,为人类的未来提供支持。
游戏提供了定义和构建复杂AI问题的平台。传统学术界的AI问题都是单一、纯粹的,每个问题面向一个特定任务,比如图片分类、目标检测、商品推荐等。走向通用AI,迟早要摆脱单一任务设定,去解决多输入、多场景和多任务下的复杂问题。从这点看,游戏是传统学术问题无法媲美的。
处理在科学上的应用,游戏世界也向AI全领域发出了挑战。很多电子游戏都有一个虚拟的时空世界,各种实时的多模态的时空信号,在人与机器间频繁传送,如何融合这些信号做出更好的预测,是信号处理科学的一个难题。
正如《百面机器学习》里人工智能在游戏领域的应用一节中提到的,游戏世界与现实世界独立,既可以模拟现实世界的物理规则,也可以打破物理规则,看智能体的应对策略。前者对现实世界高度仿真,有助于在开展硬件实验前,如无人车、机器人,先期探索适用的AI模型和算法,大大降低耗费在硬件上的成本。后者呢?在我们尚未抵达或尚未了解的极端物理世界、网络世界或其他世界,进行假设性试验,先假设一些未知的规则,再看智能体的进化轨迹,为人类的未来作打算。由此可见游戏与AI的结合不但可以娱乐人类,让人类在轻松中前行,它的未来发展对于人类的未来命运也将起到越来越重要的作用。(中国科学院虚拟经济与数据科学研究中心研究组成员,南京财经大学教授,远望智库数字大脑研究院院长 刘锋)