您的位置 首页 得到头条

AI怎样学会打王者荣耀?

这里是《得到头条》,我是徐玲。

今天我们从两个话题出发,为你提供知识服务。一是人工智能公司DeepMind研发AI足球运动员,二是零售系统“多点”获得中物联科技进步一等奖。

来看今天的第一条。最近,英国人工智能公司DeepMind在最新一期的《科学·机器人》杂志上发表了一项最新研究成果,是一款AI足球运动员。你知道,之前名震天下的AlphaGo围棋程序就是由DeepMind公司开发的。这款AI足球运动员,是比AlphaGo更高级、更复杂的AI程序。为什么这么说?

从策略上,围棋是1V1,只需要考虑两个人之间的博弈;而足球是多对多,既要考虑个人技巧,又要考虑各个成员之间的协作配合。从即时性上,围棋是回合制的,一方走棋时另一方只能看;而足球是即时竞技,双方都在运动,可能反应慢一秒就错失良机。从操作上,围棋只需要考虑走棋步骤,而足球涉及带球突破、身体对抗、精准射门等多个动作,需要强大的运动策略系统。这些差异决定了,AI足球运动员的算法要比AlphaGo复杂得多。

事实上,AlphaGo作为“上一代AI网红”,它是单体智能的代表;而AI足球运动员属于多智能体,这是当下最热的人工智能研究领域之一,有可能成为“下一代AI网红”。

消息就是这样,来看看能学到什么知识。

你可能不知道,其实在2016年AlphaGo横空出世时,仅仅过了半年,腾讯的AI实验室就推出了自己的AI围棋程序,取名叫“绝艺”。他们请柯洁和“绝艺”对弈,“绝艺”在让柯洁两子的情况下还能完胜,表现不输于AlphaGo。不过,当时AlphaGo大战李世石名震天下,已经拔得头筹,“绝艺”终究是慢了半拍,再厉害也只能算是“跟随者”,引不起公众太大关注了。

而这次不同。早在DeepMind公司研发出AI足球运动员之前,腾讯AI实验室就已经搞出了很厉害的多智能体,而且你没准儿还和它对打过。对,《王者荣耀》游戏在2020年上线了一个新模块,叫“挑战绝悟”,这个“绝悟”就是多智能体AI。它和AI足球运动员一样,打法上要考虑团队配合,因为《王者荣耀》的游戏规则是5V5,也就是10个角色分成两队来打群架;操作上,也有复杂的走位和动作技巧。

为了快速提高“绝悟”的战斗力,腾讯AI团队决定把它放出来,邀请上亿游戏玩家来群殴它,帮助它进步。如果你也挑战过“绝悟”,那厉害了,世界上最先进的多智能体AI的发展有你一份功劳。“绝悟”花三年时间,从一开始连地图小怪都打不过的“弱鸡”,到后来可以完爆《王者荣耀》职业联赛冠军,成为目前世界上最先进的多智能体AI之一。

听到这儿,不知道你会不会有个疑问:BAT三巨头中,在人工智能领域投入最大的是百度,为什么这个多智能体AI是由腾讯做出来的?我看到科技记者史中在他的公众号“浅黑科技”里的报道,原来,腾讯开发“绝悟”不是一时兴起,而是为了解决一个现实问题。

你知道,《王者荣耀》游戏会不断推出新的英雄角色,这个新角色的武力值需要和原来的老角色保持平衡,既不能太强也不能太弱,胜率在50%左右最好。怎么保证这个胜率呢?

一般的做法是,在新角色发布前,找很多专业游戏测试员,用新角色跟老角色组队打上几千场,各种技能和场景都尽量测试一遍。但是,这个方法人力成本高、效率低,还有新角色被提前泄露给公众的风险。能不能干脆搞一个AI系统,由它操控各种角色来自动测试?对,这就是“绝悟”的来历。

从数学上说,想要搞清楚胜率,需要采用穷举法,也就是把每一步中所有可能出现的变数全部推演一遍,自然可以得出结果。不过,这种做法只在理论上可行,现实中它需要的算力是个天文数字,超越了计算机的极限。就连简单的围棋程序都没法采用穷举法,更别说更复杂的多智能体了。

事实上,绝悟1.0版本和AlphaGo一样,是采用“模仿学习”的办法。AlphaGo学习的是人类棋谱,而“绝悟”是学习《王者荣耀》职业联赛的比赛录像。不过,单纯把这些录像信息灌到系统里,还不够精准。因为高手也有出昏招的情况,“绝悟”在初期还无法分辨哪些是高招哪些是昏招。腾讯AI团队就找了一帮游戏高手,手动标记比赛录像中,哪些是华而不实的花架子,哪些是真正的神来之笔,把经过“提纯”后的武功秘籍输入给“绝悟”。

通过“模仿学习”,绝悟的水平相当于一个比较厉害的业余选手,可以挑战游戏主播,但是和真正的职业选手没法比。从“模仿学习”的原理来看,“绝悟”是跟在职业选手屁股后面学,最多能学到七八成功力,就像孙悟空再厉害也赶不上菩提老祖。那后来“绝悟”是怎么做到完爆职业选手的呢?

这就要说到绝悟的2.0版本,它和AlphaGo的下一代,也就是AlphaZero一样,不再是“模仿学习”,而是完全抛开人类经验,从一张白纸开始,通过自己跟自己对战、左右手互搏,自己总结战斗经验。这在人工智能领域叫做“强化学习”。

不过,前面我们提到,多智能体AI面对的情况比围棋这样的单智能体复杂得多,这意味它的模型里有海量参数,“强化学习”的结果,可能越来越强,也可能是“学废了”,模型无法收敛,表现越来越差。就好像教游泳直接把娃扔水里,会的就会了,不会的就淹死了。

事实上,绝悟2.0就遇到了这种情况:一开始学习曲线很漂亮,后来大起大落,然后突然掉头向下。“强化学习”和“模仿学习”不同,机器“强化学习”的过程是个黑匣子,人类无法理解,更无法干预和引导。怎么办?眼睁睁看着“绝悟”被“淹死”?

研究团队苦苦琢磨,最后才想到:虽然无法帮它,但是可以给它降低难度啊!他们为“绝悟”制定了一个从易到难的训练计划:不是一开始就让它进行5V5的混战,而是先从1V1练起,再做固定组队训练,最后再打乱编队训练。

在这样循序渐进的训练计划之下,“绝悟”终于又活过来了,学习曲线噌噌向上。最终,在2019年《王者荣耀》世界冠军杯上,绝悟战胜了顶尖职业选手,一战封神,成为游戏界的AlphaGo。

更重要的是,AlphaGo是专门用于下围棋的单智能体,现实应用场景有限;而“绝悟”作为多智能体代表,它的现实应用场景要多得多。比如,“把《王者荣耀》的英雄们换成汽车,把地图换成街道,就变成了一个智能驾驶问题”;还有我们在第281期节目中提到的,把《王者荣耀》的英雄变成小行星,就可以让小行星们自动组队进行天文观测。

从这个意义上说,《王者荣耀》早就超出了一款游戏的范畴,它是一个由上亿游戏玩家共同参与的多智能体AI研究平台,也是一项通往未来的基础设施。

来看今天的第二条。

最近,中国物流与采购联合会公布了本年度的科学技术奖,这是物流行业最具影响力的科技奖项。我注意到,物美旗下的“多点”(Dmall)系统获得了最高奖项科技进步一等奖。

你也许用物美的多点App买过东西,不过你可能不知道,多点不仅是物美超市自用的线上App,它也是一个面向B端的数字零售解决方案,包括了会员、营销、门店管理等子系统。目前,包括麦德龙、广东的7-Eleven、武汉中百、重庆百货等100多家零售企业,都在使用多点系统来管理业务。据有关报道,多点系统能够帮助商家平均人效提升35%,线上订单增长90%,平均库存周转天数下降20天。

听起来,这是一个我们熟悉的第二曲线增长方式:物美先把自己的数字化系统做起来了,再把这个系统单独拿出来,作为一个B端产品卖给同行。不过,我要说的是,这其实是一个相反的故事:物美的创始人张文中本来就是做数字系统的,只是后来阴差阳错才干起了超市。

张文中拥有南开大学系统工程博士学位,斯坦福大学博士后,留学回来之后,他创办了一家IT公司,主要做零售业解决方案,包括POS机、信息化系统等软硬件。但那是在1990年代初期,大多数零售企业还没有信息化意识,他的零售业解决方案卖不出去。

无奈之下,张文中决定,亲自开一家超市来做示范,展示信息系统的重要性,这就是在1994年诞生的物美超市翠微店。率先装备了信息化武器的物美超市果然一骑绝尘,开业第二年的销售额就突破了亿元大关,这个业绩把张文中自己都吓了一跳,这可比卖信息化系统顺利多了。张文中果断转轨,一心一意经营物美超市,物美2003年在香港上市。

有了这个背景你就能理解,物美一直就比别的超市更具数字化基因。它在传统超市中最先推出自己的多点App,并且把多点发展成为零售业的通用解决方案,就不奇怪了。

说起来,“国民辣酱”老干妈,也是这样一个无心插柳柳成荫的故事。老干妈创始人陶华碧本来是开小店卖凉粉的,为了让自家的凉粉更好吃,她捣鼓出了独家秘制辣酱。结果很多客人吃完后,都觉得她家的辣酱太惊艳了,提出能不能直接买点辣酱带走?甚至隔壁凉粉店的竞争同行,也来买她的辣酱。陶华碧果断决定,别卖什么凉粉了,直接卖辣酱吧。

再给你补充一个最新的案例。这两年睡眠App流行开来,它有催眠、记录睡眠质量、唤醒等功能,其中蜗牛睡眠是比较有代表性的头部App。据蜗牛睡眠的创始人介绍,他们一开始并没有想到要做睡眠App,而是想要做一款智能睡眠枕头。

他们投入大把资金、花了整整八个月时间来搞产品研发,结果产品开发出来后,根本卖不动。智能枕头在消费者心智中是一个全新的品类,睡不着的时候,大家可能想着要买点褪黑素吃,但不会主动想起来说,哦,我该买个智能枕头了。如果想通过商场、机场等线下场景来主动接触客户,枕头的个头又太大,坪效低,渠道不愿意卖。

就在他们一筹莫展的时候,突然发现,他们给智能枕头配套开发的睡眠App,在没有做刻意推广的情况下,下载量一直往上涨。他们误打误撞,发现市场上存在“睡眠App”的需求,而且还是一片蓝海。他们果断调转方向,把公司重心转移到App的开发上,做成了市场头部。

你看,就像蜗牛睡眠创始人说的那样,“创业不是想明白的,而是做明白的。”

来说说咱们得到的事儿。

今天,我们上线了一门新课——《方建勋·中国书法通识》,主讲人方建勋老师,是课程主编李倩老师专门回北大,给咱们得到同学挖来的。

我还记得去年夏天,李倩老师就特别兴奋地跟我说,可找到了一位宝藏老师,咱们能开书法课了。她在连追了方老师广州和北京两场书法展之后,下定决心,一定要请到方老师来得到开课的。

为什么开书法课,非方老师不可?首先,当然是方老师字写得好,篆书、隶书、草书、行书、楷书,每一种字体都能写,而且功力深厚。第二,方老师理论功底还很扎实,本科、硕士读的是书法专业,博士读美学,博士后读艺术史,所以,他对书法的理解,不光有40年的亲身实践,更有系统的理论高度。第三,方老师的课还讲得特别好,他在北大的公选课,常常是一座难求。这么三位一体的老师,在书法圈还真是不多见。

如果你心里也有懂点书法的期待,或者你正在练字,想要突破和提高,再或者你像我一样,想带着孩子一起听,让全家人一起得到中国传统文化的熏陶,这门课就是为你准备的。后天晚上,方老师还会来得到直播间,你可以现在就预约观看,感受书法的魅力。

今天就聊到这儿,《得到头条》,明天见。

附:方建勋书法课开学直播预约链接

 

发表回复

返回顶部