傅盛:应用生态决定大模型公司的商业价值
2023-10-10 15:13:56语义理解
人工智能技术的皇冠
我在 2016 年就开始投入人工智能,在数据训练上我大概投了 1 亿美金在视觉识别、语音识别上。可能大家都不太知道,小米的小爱同学、喜马拉雅的语音都是我们提供的服务,包括在冬奥会上,我们也是语音服务机器人供应商。但那时候遇到一个难题,就是语义识别,核心是智能的问题。
什么叫智能?生物都有智能,都有对现实的预测,不少生物也会使用工具,猴子、猩猩,乌鸦喝水等。但如果看过《人类简史》的话,就会知道人类独有的智能是描述虚拟事物的语言,描述虚拟事物就是逻辑。
只有OpenAI
试图让AI自学文本
为什么OpenAI能做到?当时最开始做语义理解的时候,大家本能地认为,我们应该教计算机识别知识图谱,像学习外语一样,理解单词、主谓宾以及语法规则等。后来发现它很快就可以回答问题,但是答非所问。
只有 OpenAI 觉得,应该像教小孩子一样,把文本给它,让它自学。这个自学不像自媒体所描述的,「OpenAI 有一天会灭掉人类」什么的,这是不可能发生的。GPT 的学习是学习文本之间的规律,产生基本的认知和推理能力。最早我们试图教机器逻辑思维,觉得它能学会,但是后来发现它学不会。语言学教授乔姆斯基就认为,语言的语法结构其实没啥用,都是事后总结,语言本身是一件很复杂的事情。
在 GPT 之前,人工智能更像是鹦鹉学舌,那时候的对话系统本质是把已有的对话和用户的提问进行匹配。用知识图谱、回答增强来判断大模型不太靠谱,它是真正基于对词的理解,去理解这个世界。业内普遍认为 ChatGPT 的出现意味着通用人工智能时代的到来,OpenAI 的创始人就称之为 AGI,AGI 应该是一个模型可以满天下用的,也就是从底层逻辑上说大一统大模型的时代到来。
把GPT看成
一个大号计算器
理解语言这件事对于计算机来说非常难,对于人类来说习以为常,这也是我们引以为豪的地方。所以现在突然发现系统可以理解语言的时候,大家就开始恐慌了。其实,我觉得GPT可以被看成一个大号计算器,知道它是每个词每个词的预测,预测的词和之前的问题都相关。理解了它的原理,就会对它的很多方面慢慢理解。比如,为什么GPT对于人类的回答,别人问的和你问的会不一样?因为问法可能不一样,问法很重要,理论上问的越多越深入,就越不一样。
首先被替代的
是在电脑前坐得最久的人
ChatGPT出现,我觉得有两件事会深刻影响这个行业,第一个是容易被忽略的,也就是对于交互的影响。
交互一旦发生变化,很多范式也会发生变化。有些工作就会被替代掉,AI将导致电脑层工作价值下降。我前两天看到一幅漫画说未来 AI 会给我们洗衣服做饭,我们去追求诗和远方。但现在反过来了,我们看到真正首先被替代的,是在电脑前坐的最久的人。老板很少坐电脑面前,所以他没那么容易被替代。逻辑很简单。大家用电脑只是把自然语言翻译成机器能懂的指令。程序员、做PPT的人工作本质都是这样。一旦机器不需要人来完成自然语言的翻译,原本这些工作的价值就会急剧下降。
30刀的Copilot
非常划算
前两天微软公布了Copilot售价,盘中飙升6%,你要知道微软已经是一个两万亿美金的公司了。微软以前说要让每个家庭都有一台电脑。它们以后可能就是要让每个人都有1个或者几个Copilot。Copilot售价是每个月30美金,看上去还挺贵,换算下来1个月200多块钱。但你想想,你每个月雇一个员工肯定不止这点钱吧。而且它的效率非常高,全天24小时都待命,几分钟内就能给出交付结果,也不会跟你闹脾气,也不会辞职。从这个角度来看非常划算。
面对AI
两种不同的态度
未来「人族」会有两种人,一种是保持着极强的好奇心,拥有主动和开放学习的心态;善于思考,提问,思考,创造。他们就是AI的驾驭者。还有一种人非常被动,封闭,这种人就是单纯的躺平享受者。
Sam Altman(OpenAI CEO)的人生理想就是搞一个巨大的智能体,能替我们做很多工作,然后人类就不用工作了,他还会给你发世界币,你们领钱去追求诗和远方就可以了。我认为不会是这样,还是会有很多人会去成为AI的驾驭者。如果我们把大模型想象成一个大号计算器,有些恐惧就没有必要了。因为它只是个计算器,它没有好奇心,没有主动性,它还是需要输入,需要各种优化,所以人类还是有大量工作是可以做的。大模型技术不会吞噬一切。
技术门槛越高
竞争越激烈
模型创业的机会在哪里?我总结了四个层次。第一层是角逐千亿大模型。我觉得这个难度比较大。
那天我女儿跟我说,为什么一件简单的奢侈品就能卖几千块钱?苹果那么一个复杂的手机才卖几千块钱。这是人类社会特别有意思的一件事,就是看上去技术投入越多,竞争越激烈,但越激烈反而越挣不着钱。所以角逐千亿大模型这事没那么划算。第二层是开发行业垂直大模型。几个月前大家还不太认可垂直模型会和通用大模型一样强,现在大家已经慢慢转变了看法。第三层是开发大模型应用。结合大模型做开发应用是很大的一块。第四层是应用大模型。既不是技术公司也不是数据公司,只是一般的公司,就把大模型应用用好就可以了,使用数字员工,私有化部署大模型。这是最大的一块。就像电刚发明的的时候,很多人在用驴拉磨的时候你已经开始用电拉磨了,生产效率肯定更高。互联网刚出现的时候,刘强东还在中关村卖光盘,后来发现网站机会很大,就做成了中国最大的电子商业公司。这就是创业者的机会。创业者和投资人之间本质上是互相成就的关系,不存在谁指导谁的问题,尤其投资人对创业者的创业方向应该多加尊重。真正慷慨的都是创业者,这也是为什么行业怎么发展取决于行业生态的原因。
做企业要找到
互联网上没有的知识价值
做应用如果数据不足,所有的努力都没有价值。今天所有书本上的知识只占了所有知识的一小块。比如你要跟牛顿学东西,你只能从《自然哲学的数学原理》当中学,但如果有一天你能和他喝咖啡,那每天的知识涨幅绝对比只读书多太多了。但话又说回来,这些知识只是冰山下面的基础,我们今天做企业肯定不是把头埋在MBA的教材里就能学着做好的。只有每天密集的会议讨论,形成共识,这些都不是在教材、在互联网上找到的,才能给予你最大的知识价值。所以今天大模型虽然有了很强的推理能力,甚至在某些方面超过了人类,但它的知识储备只要还是基于互联网,能学到的还是人类知识的一小部分。大模型现在在写文案之类的工作上还有点用,但你真让它给你给一些工作建议,行业建议,它肯定还是不行,这个就和它的知识构建有关。
开源
是AI行业的巨大金矿
开源社区极大地降低了模型的开发成本,三个月前大家觉得 OpenAI 要统治全世界了,现在回过头来一看这个世界还是太复杂,一个公司不可能做到。开源就是 AI 行业的一个巨大的金矿,有太多为了人类理想,技术理想,极客精神而战的人加入其中。Llama 2 也刚刚宣布开源,可谓是「忽然一夜开源来,千模万模智能开」。我们都很兴奋,大模型白菜价的时候到来了,每个公司每个人都有大模型的时代到来了。对于应用开发者来说,以前应用太薄的话,大模型一增长你的应用就没了。如果你的应用真的很好,你就能在用户那里找到很多需求点,现在你就可以做你自己的大模型。所以 Llama 2 的这波操作就体现了大公司的优势,它只要做出正确的战略判断,就可以组织你想象不到的资源,从而实现行业的变化。创业者一定要敬畏大公司,大公司的战斗力不是体现在某一点的穿透上,而是体现在它整体的逻辑上。
如果创业者
只学习大模型的一个技术点
现场有很多的创业者,我就分享一个点,就是如果大家只学习大模型的一个技术点,应该是什么?就是 Prompt 提示词。这件事一开始的时候,我就注意到了。但有一天我跟我的程序员聊,他突然跟我说这东西挺有意思的。我说你们怎么到今天才觉得挺有意思的?
做技术的同学有时候会这样,认为「我掌握的技术才是重要的,你这个东西不咋地」。还有一些投资人认为 Prompt 不就是提示词嘛,有什么厚度?其实我觉得 Prompt 是被忽略的一个点,因为它学起来容易,所以大家觉得这东西不深入。我就想起一个比喻,这就有点像郭德纲说的相声。所有人都觉得自己能说相声,但是其实要说好不容易。因为人人都会说话,好像也都会说相声,其实里面差别很大。
自然语言本身
就是知识的压缩
从原理上说,自然语言就是一个压缩。比如说我现在讲了 200 字的内容,但是你要知道这 200 字在我脑海里是一个很庞大的行业知识,然后贡献出来、压缩过去,到你这再一解压,就不一样了。所以我做人工智能,最大的一个痛苦总结下来就是,招的都是中国人,但互相听不懂对方说什么。做硬件的时候,说我们跟做软件的不一样;做人工智能的时候,说我们跟互联网不一样;互联网又说我们跟他们不一样。我说你们都不一样,就我一个人站在上面,花了大量时间去 Prompt。所以我们为什么每天有那么多会?为什么要写成邮件,还要大家一起讨论一下?这就是因为自然语言的压缩性。所以这种提示是非常关键的。然后行业有专属词,一个词在你这个行业是这个意思,在我们行业就是另一个意思。大家肯定都经历过。你觉得这是好的,我也觉得好的,等到一看,我们对好的理解不一样。所以 Prompt 就是一个桥梁,不可或缺,非常重要,而且可以做得很「厚」。
那天我就在想怎么跟我的程序员讲 Prompt 很重要呢?我想起一本书——《自然哲学的数学原理》。谁写的?牛顿牛爵爷,他是 Prompt 的大师。如果你们去翻一下这本书,前几十页讲的全是定义。为了证明他的三定律,他写了很多定义,因为他怕我的理解会和你的理解不一样。在场有多少人看过吴恩达的 Prompt 课程?我建议每个人都去看一下, 3 小时就看完了,然后反正我都看完了。这个课程不看,本质上是「不知道自己不知道,以为自己知道」。这么一个人工智能的大牛,会专门花 3 个小时讲Prompt,你觉得意味着什么?因为今天 Prompt 本质上就是对大模型能力的一个深度挖掘和微调。以后C这些编程语言都会变得非常少,Prompt就会是编程。你要写一个程序,就写一段话,让人工智能得出一个你要的结果。大家都说,以后要培养会问问题的人,那什么叫会问问题?没有标准。因为现在每个大模型都是不同的系统,不同的推理,有这样那样的不同。你要花很多时间去沟通,当你知道 Prompt 对于不同大模型适配情况的时候,你就是行业专家。所谓专家就在一个点上比别人深。还有一个就是应用层面。我觉得未来应用的生态反而可以决定大模型公司的商业价值,因为开源已经极大拉低了大模型本身的商业价值。我的另外一个预测是,巨头和开源社区的竞争会难分伯仲。
别纸上谈兵
猎豹做了什么?
最后讲一下猎豹做了什么。讲了这么多,不能只是纸上谈兵。
第一个是数字员工。我们内部已经挂了很多横幅说“取代你的不是 AI,而是会 AI 的同事”。然后第二个是大模型应用,我等会展示两个应用。第三个就是我们也做了行业信息大模型,但我不遮住眼睛,我肯定是是拿开源的模型去训练的。第四个,千亿大模型,这件事我们没有做。展示一个我们团队内部做的项目,现在效果说实在还不够好,但雏形已经实现了。
我们用AI智能体为极客公园输出一个大会方案,这是我们设计的角色,它有不同的视角。开会过程特别有意思,就看几个机器人吵来吵去,说你这个没有注册那个怎么样。开一次会,这几个机器人大概要跑 20 分钟左右。有人说大模型做不到否定自己,这个观点太错了,大模型完全可以否定自己。因为它就是计算器,他为什么不能否定自己呢?所以你找几个不同角色,互相否定、挑战,最后还可以生成几十页的报告。我们这个项目有 4、5 个同学写 Prompt,写了两个月,不停地写、改,然后看什么样的数据奏效。
创业者的本质
把细节做得足够好
通用大模型为什么不能直接用到企业的流程上?因为没有私有化,没有数据隐私安全问题,无法贯通业务数据。所以我们在上面做了一个集成,猎户星空打磨的企业应用聚言,帮你做一些专业的数字员工。
第一个主打的就是推销员,每个网页都配了一个聊天机器人。我们自己的网页上配了之后,发现成单率提高了3倍。在线下,我们的机器人真的可以开始推销了。成为机器人促销员,在燕之屋、双汇落地,帮助客户转化成单。创业者真正的本质,就是把细节做得足够好。有一天我和我的团队说「做人工智能就跟我当年做杀毒是一样的」。我的员工说:「老板你不懂,别乱讲。」我说这不一样吗?人工智能是来个数据用模型发下去,以前我们做杀毒也是来了很多样本,变成病毒库发下去。这中间比拼的是什么?是谁更快,谁能把每一个点做得更细。其实我们在问答机器人上投入了大量精力,看哪些回答用户觉得不满意,哪个策略出问题了。所以我们做应用一定要记住一句话:魔鬼都在细节里。大模型很大,但是做应用必须很小很深。
小参数的智能涌现
行业大模型是有机会的
OpenAI 推出 ChatGPT 之后,全世界都懵了,因为没有人觉得这件事能做成。但是从原理看,「今天为什么会有这些智能」是没有被证明的,中间没有推倒过程。只是输入一个数据,大概知道可能的结果是什么。所以今天有个词叫「涌现」。但问题又来了,为什么只有 1000 亿参数的模型可以涌现智能?500 亿可不可以?100 亿可不可以?所以今天学界在做一件事,叫做大模型的「白盒化」,就是把大模型运行的过程给推倒出来。一旦推倒出来,可能就不需要这么大量级的参数,用很小的参数就能实现现在的效果。当然今天没有白盒化之前,各种开源的迭代版本也都用很小的参数慢慢实现了一定的效果。那到最后我们可能发现,工作岗位里不需要一个「爱因斯坦」,一个中专生就可以胜任了。所以未来,每个行业可能都会有自己的专业大模型。
创业者要相信
这就是最好的时代
但其实我也不知道这个行业会怎么发展,因为它变得太快了。我觉得最好的办法就是靠进去,动起来,很多东西只有在实践中才能得到。其实我每天都生活在一种恐惧中,就是警醒自己,千万不要觉得自己有经验;千万要觉得自己是傻x;千万要认为这些年轻人真的会去超越你。经验其实一点都不重要,有好奇心、有行动力,才能创造未来。最后给大家分享一句话:现在是过去的未来,因为它已经发生了,但它不是未来的过去。什么意思?就是未来不是一个必然性,今天所有的创业者都要相信「王侯将相、宁有种乎」,相信在一个点上大力可以出奇迹。大家都在起跑线上,这就是一个最好的时代。竞争肯定很激烈,大家达成共识也很快,所以我建议大家保持好奇心,深入学习,把细节做好,相信每个人都有机会成功。谢谢大家。