150｜大模型下半场：不比写诗，只比做事

今天，我将从两个话题出发，为你提供知识服务。第一个是，升级版华为盘古大模型，登上《自然》杂志。第二个是，迪士尼100周年，推出反派纪念套装。

先来看今天的第一条。我们说一个挺争气的事。就在7月9日，也就是上周，《自然》杂志上发表了一篇文章，主要内容是介绍华为的盘古气象大模型，这是一种用于气象预测的大模型。为什么说争气？因为这是目前第一篇，中国科技公司作为唯一署名单位，发表在《自然》正刊上的论文。

我们先说论文的主要内容。核心可以用一句话概括，叫，AI天气预报，终于超过了数值天气预报。

什么意思？在目前的天气预报领域，最主流的预测方式，叫数值预测。你可以把它理解成，用解方程的方式，来预测天气。

这就好比，你要判断老王今天几点吃饭，你就要搜集很多信息。比如，老王早上是几点吃饭的？吃了多少？再比如，老王今天中午有没有应酬？有没有人约他吃饭？等等。这些信息，就叫数值。同时，有一个非常懂老王的人，设计了一个方程式。只要你把这些数值代入方程，就能算出老王几点吃饭。

数值天气预报的原理，就跟这个过程有点像。你搜集了很多关于天气的数值，代入方程，再求解，算出天气。换句话说，你看到的绝大多数天气预报，其实是用方程式算出来的，并不是来自，西边来了一片云，因此今天要下雨，这种直接的观测。

当然，你可能也发现了，数值预报，经常不准。怎么办？有人就想，全程用AI来做预报，具体的技术细节就不展开了。但问题是，AI预报的，更不准，而且慢。而这回，盘古气象大模型之所以能登上《自然》杂志，就是因为，作为AI预报，它第一次在精度和速度上，都超过了传统的数值预报。而且速度比数值预报，提升了大概10000倍。在一张V100专业显卡的支持下，大概只需要1.4秒，就能预测出全球24小时的天气。

听到这，你可能会说，这顶多算是气象领域的进展，跟我有什么关系吗？别着急，咱们要说的重点，并不是气象AI，而是它背后的华为盘古大模型。

就在上周末，华为刚刚举办了2023年开发者大会。假如把不同行业比作武林里的不同门派，那么开发者大会，就像一场针对武林人士的兵器展。给你看看今年出了哪些称手的新工具。而今年华为开发者大会最重要的事，就是发布升级版的盘古大模型。盘古大模型在2020年就已经开始研究，比GPT-3还要早一点。这回公布的，是最新的升级版。

当然，估计今天提起大模型，很多人都有点麻木了。毕竟，今年关于大模型的新闻太多了。但是，这回的盘古大模型，还真不太一样。借用华为自己的话说，这回的盘古大模型，是一个产业大模型，它不会写诗，只会做事。

要想弄清盘古大模型背后蕴藏的新机会，我们需要搞懂这么三件事。

第一，大模型的下半场，拼的是什么能力？你可以这么理解，大模型的能力，正在从解决困难型问题，转变成解决复杂型问题。

注意，难和复杂，这是两个不同的概念。

难，指的是这个问题在知识层面上要求很高。比如，写一首诗、画一幅画、做一道数学题。这个过程就像跳高，目标虽然高，但落实到动作上，无非就一个字，跳。现在的很多大模型，核心能力都在于解决这类困难型问题。这类问题的特点就是，回答起来有难度，但问题的链条很短，一问一答，就结束了。

但是，你肯定也发现了，在现实世界中，大多数真实挑战，它的链条都很长。我解决第一个问题，又会衍生出第二个问题。解决第二个，后面还有第三、第四个。现实世界的挑战，往往是一组问题的集合。就好比教小孩子写字，看起来简单，但是，你不可能一开始就设计好所有的方案。你得先教完一部分，看看小孩子写得怎么样，再根据他的表现调整后面的方案。说白了，就是得走一步看一步，根据实际情况随时调整。

这类环环相扣的问题集，就叫复杂。解决它需要的不仅是抽象的知识，更是来自前线的一手经验。

说白了，你能执行一个具体任务，能干成一件具体的事，这个应对复杂问题的能力，也许是很多行业更需要的。

而这回的盘古大模型，核心就在于这个解决具体问题的能力。盘古大模型，是一组预训练大模型和工程应用平台的统称。所谓预训练，指的是它已经预判到了将来可能遇到的问题，并且储备了相应的解决问题的能力。

具体看，盘古大模型，内部包括三个能力段位，分别是，L0、L1、L2。

L0能力段位，指的是大模型的通用能力。就好比，这人天生是个练武奇才，骨骼清奇，天赋极高，而且已经打通任督二脉，练什么功夫都快。你想让它练什么，比如，学怎么做天气预报，怎么做药物研发，好，你可以稍微教教它，一学就会。

L1能力段位，指的是更针对具体行业、具体企业的大模型。就好比练武，这个大模型已经精通独孤九剑、降龙十八掌，具体的功夫已经练好了。

L2能力段位，就更具体了，它针对的是具体的业务场景，比如，让一个懂降龙十八掌的人，去做保镖，护送一个人从上海到北京。你看，这就是非常具体的任务。L2级别的大模型，具备的就是这类解决具体任务的能力。

简单说，假如L0是个通才，L1是个专才，那么，L2就是精通某件事的老师傅。企业需要哪个，就可以调用哪个。借用华为自己的话说，通用大模型是人类的大脑，而工业领域大模型，就是手和脚。它的核心能力，在于做成具体的事。

这是盘古大模型背后的第一个重点。我们能从中看到，大模型的未来方向，正在从解决困难问题，转向解决复杂问题，执行具体任务。

第二个重点是，这回的盘古大模型，实现了算力的国产化。说白了，这回盘古大模型用的芯片，是咱们自己的。我们都知道，AI的训练有三个关键要素，算力、语料、训练方法。而且其中最底层的能力基座，就是算力。这也是为什么在这一轮AI热中，英伟达成了最大赢家。而这回，华为训练盘古大模型用的，包含GPU在内的芯片，全部是华为自研的昇腾芯片。

说到训练，在这还得特别强调一句。按照华为开发者大会上的说法，未来的大模型训练，将出现一个新趋势，端云协同。也就是，有分布在各处终端的无数双手，同时执行各种各样的任务，积累各式各样的经验。而这些经验，最终将沉淀到同一个云端的大脑。

比如，某一条工业流水线上的质检，这个场景看起来非常小，很难积累出大规模的经验。但事实上，它并不是小，只是分散。假如能把每一个企业，每条流水线上的质检经验加在一起，就能形成一套稳定的解决方案。从这个角度看，大模型的应用部署，更像是一场新训练的开始。

第三个重点是，大模型未来的研究趋势。按照这回开发者大会上的说法，未来在行业应用方向，大模型的发展重点主要有这么几个。

首先，是垂域数据标注与模型微调将成为重点。也就是，大公司提供基础大模型，而细分行业里的公司，为大模型提供垂直细分领域里的数据，通过微调，让它们在细分任务上有更好的表现。

其次，是大小模型协同。也就是，在遇到复杂任务时，需要通用型的大模型，与专家型的小模型配合解决。这个解决方案可能不是一步到位，可能每个环节，需要调用不同的模型。

其实，这些重点，可以概括成一句话。过去说起大模型，它的优点是，够聪明。但是未来说起大模型，它需要的是，有本领。够聪明，指的是你针对一个问题，有足够的知识存量。而有本领，指的是你能面对挑战，把事办成。

再来看今天的第二条。今年，是迪士尼成立100周年。这么大的事，迪士尼肯定要推特别产品。而就在6月初，迪士尼联名乐高，推出了一个很特别的100周年纪念套装。特别在哪？它的主角不是白雪公主、小美人鱼、米老鼠这些主角，而是，全都换成了反派。比如《白雪公主》里的皇后。当然，尽管是反派，但销量都还不错。

其实，这件事仔细想想挺奇怪的。你看，我们明明知道，电影里的反派不是好人，但是，有时候，你就是忍不住喜欢他。比如，《蝙蝠侠》里的小丑，就在2009年获得了奥斯卡男配角奖，后来还出了单人电影，又获了大奖。再比如，年初大热的电视剧《狂飙》，大家最津津乐道的角色，也是反派人物高启强。

那么，反派为什么这么迷人呢？今天，我们就来回答这个问题。

今年5月，《自然》杂志上刊登了一篇研究，来自美国几所大学的心理学家和神经科学学家。文章的标题，叫做《人们对不道德和道德模糊的人感到好奇》。主要内容就是，大家为什么喜欢反派？

这个研究，分成三个阶段。

第一个阶段，是验证阶段。也就是要证明，是不是大多数人都喜欢反派？还是只是偶然现象？研究人员做了一个统计，找出奈飞上面最受欢迎的电视剧。先让志愿者给主角的道德水平打分，然后把主角们分成两类，好人和坏人。结果发现，这些最热门的电视剧里，有59%，也就是接近六成，主角都属于低道德水平，也就是所谓的坏人。

接着，研究人员统计了针对不同剧集的观看时长，结果发现，主角的道德品质，和观众的观看时长之间存在着一种显著的负相关关系。一句话总结，主角越坏，观众观看的时间就越长。这说明，观众确实会被反派吸引。

第二个阶段，是量化阶段。也就是，一个反派，坏到什么程度最迷人？

研究人员这回把人物角色，按照道德水平从高到低，分了四类。第一类，道德水平高，通常是英雄或者大好人；第二类，道德水平一般，也就是普通人；第三类，道德水平模棱两可，也就是亦正亦邪的角色；最后一类，道德水平低下，也就是大坏蛋、大反派。

结果发现，观众对道德表现极端的角色最感兴趣，也就是那些特别好的角色和特别坏的角色，比如大英雄和大反派。观众对亦正亦邪的角色也很感兴趣，并且觉得他们的神秘性是最强的。而观众最不感兴趣的，是道德水平平均的普通人。

实验的第三阶段，研究的是观众为什么对反派感兴趣？

研究过程很复杂，咱们直接上结论。因为反派，往往能激发观众寻求解释的好奇心。也就是，他到底为什么这么做？图个什么？观众会特别热衷于探索他们的动机。而对于正派，大家关注的重点不是动机，而是行为。换句话说，对于超人，大家不关心动机，大家只想看他拯救世界的行为，用了哪些超能力？救了多少人？而对于邪恶博士，大家就关心，他为什么这么坏？到底是什么把他变成了这样？

研究人员认为，这体现出的，其实是一种学习倾向。越是跟我们不同的人，我们越想了解他们的内心世界，他们的行为越偏离我们的想法，我们越想知道他们为什么要这么做。当你不知不觉被反派吸引，其实是对跟自己完全不同的人产生了兴趣。换句话说，反派之所以吸引人，是因为它在一定程度上，激发了人的探索本能。

最后，总结一下。今天说了两个话题，大模型发展的新趋势，以及反派受欢迎的原因。假如你的身边有人对这两个话题感兴趣，推荐你把今天的节目分享给他。

好，以上就是今天的内容。《得到头条》，明天见。

有价值分享

150｜大模型下半场：不比写诗，只比做事

发表回复取消回复

相关文章

377｜一米奇迹：怎样让你的工位更健康？

376｜科幻级大模型发布，与AI“交个朋友”？

375｜怎样成为“征服市场的人”？

374｜新质生产力：从“新答案”到“新卷子”

373｜周鸿祎，是怎么成为“车圈C位”的？

372｜县城旅游，是怎么成为“五一”赢家的？

发表回复 取消回复

发表回复取消回复