作为开幕式最后一个环节的嘉宾、月之暗面ceo杨植麟刚走下台就被团团围住,杨植麟一边为难地重复着“以后还有机会”,一边在工作人员的帮助下匆忙离场。
这是外行爱看的热闹。6月14日,北京智源大会开幕。我们在离杨植麟最近的地方,见证了一次大模型的“追星”现场。
当天,杨植麟和百川智能ceo王小川、智谱ai ceo张鹏、面壁智能ceo李大海进行了一场尖峰对话。我们在离ai领域最炙手可热的创业者们最近的地方,听到了对agi的讨论,对scaling law的“信仰”,对大模型价格战的“认可”。
这是内行爱听的门道。两个场景,是中国ai市场由表及里、由外向内的写照。两者相连,既是现在,也是未来。
什么是agi
大模型的突破,让人类通往agi的终极幻想有了更大的可能。但对于agi本身,业内似乎并没有统一定义。
杨植麟认为,当下agi或许并不一定需要一个精确的、量化的定义,它也可能是一个定性且感性的存在,它的意义在于让社会或者人类对接下来要发生的事情有一个准备。不过杨植麟认为,在短期内,确实需要这样一种量化的定义,“因为如果完全没有量化,也自然无法衡量agi开发的进度,从而影响整体发展”。
张鹏也更愿意相信,agi是一种信念,一种符号,其内涵外延是在不断变化的。如果能把一件事情说的非常量化、非常清晰,那么天花板估计也就触手可及了。张鹏认为,对人工智能的发展而言,没人能够说清楚什么是agi,反而可能是一件好事,这意味着还有更多未知空间等待探索。
王小川试图从“人”的角度理解agi,即大模型能不能“造医生”。之所以选择这一指标,是因为agi的第一个变化是大模型开始具有思考、学习、沟通、共情甚至多模态处理能力,就像是医生,既需要多模态,也需要减少幻觉,同时需要有强大的记忆能力、查文献能力、推理能力,如果把行业上能共识的能力都投射到做医生的标准中,那么这便可以成为一个指标——“人造医生”就是agi。
李大海则尝试从经济学的角度定义agi。在他看来,一个理想中的agi,就是去执行任何任务的时候,边际成本都已经降为0。去年行业里大家推动大模型落地时,很多场景还需要做微调,这个过程的边际成本就很高。“我们相信,随着模型能力的提升,大模型门槛越来越低,成本也越来越接近于0的时候,agi基本也就到来了。”
scaling law还是“信条”吗
北京智源大会上,一个词被反复提及——scaling law,这个类似于大模型版的“大力出奇迹”的法则,成功塑造出了openai。但随着时间的推移以及ai的发展,这个参数越多模型越强的黄金法则,也逐渐陷入了摩尔定律一般是否接近失效的讨论。
谈及scaling law,杨植麟认为,scaling law本质上没有问题,只要有更多算力、更多参数,就会持续演进。但在这个过程中,如果一直沿用现在的方法,上限是很明显的,更关键的在于如何更高效地实现scaling law。
王小川也认为,在scaling law之外,一定要在数据、算法、算力等方面寻找范式上新的转化,“不论是战略上还是信仰上,我认为scaling law之外都还有范式变化的可能,不只是去简单的变成压缩模式,而是会走出一个体系,这样才有机会走向agi,才有机会与前沿技术较量”。
“到目前为止,还没有看到scaling law会失效的预兆,未来相当一段时间之内scaling law仍然会有效,当然这个有效也是一个动态概念,关键在于它本身所包含的事情会不断演进”。张鹏也赞同王小川的观点,称scaling law早期关注参数规模,现在慢慢扩展,参数量、数据量以及数据质量的重要性也被逐渐重视,“随着大家对规律的认知越来越深,逐渐揭示规律的本质,也就能逐渐掌握通往未来的钥匙”。
推动大模型在端侧的落地是面壁智能目前的重点工作之一,“小钢炮”minicpm是一个重要抓手。scaling law在轻量级模型上是否依然有效,成为一个新的问题。
对此,李大海选择依然坚信scaling law。李大海称,scaling law是一个经验公式,是行业对大模型这样一个复杂系统观察后的经验总结,随着训练过程中实验越来越多,认知越来越清晰,也会有更细颗粒度的认知。比如模型训练方法和数据质量对scaling law和智能的影响较为显著。
价格战是好是坏
5月下旬,当国产大模型激战“价格战”的时候,王小川曾表现出过一种“他强任他强,清风拂山岗”的淡定。当时被外界反复引用的一句话是王小川说的,“创业公司不在大厂射程内”。
从以“厘”为计算单位,到“掀桌子”全面免费,整个5月,大模型都陷入了被价格战支配的热潮之中,特别是阿里、百度、科大讯飞、腾讯云先后跟进,让大模型的价格战进入了白热化阶段。
但现在,王小川的态度有了些微妙的变化。北京智源大会上,王小川明确表示,当下的价格战对中国发展大模型而言是非常特别的一件事,“我积极看待这件事”。
在王小川看来,价格战通常是以竞争为导向的市场行为,这会让更多公司、更多人用上大模型,使大模型能够迅速普及。另一方面,之前鉴于行业的“焦虑”,很多本该是大模型使用方的企业,也都想转型成为大模型的供给方,造成人才、资金等方面的浪费。价格战之后,很多企业也开始清醒,思考自己的竞争优势,进而退回成为大模型的用户,减少浪费的同时,让更多企业找到适合自己的发展定位。
李大海也认同,当前的价格战,虽然多少存在一定的营销成分,但未来一定会比现在的价格更低,“大家都有利润,才是健康的方式,才能真正让千行百业的应用落地”。
早于字节跳动大张旗鼓的降价,智谱ai一度被认为是这轮价格战的发起方。大会现场,张鹏笑着澄清,“子虚乌有”。
张鹏说,从宏观角度看,降价能够促进大模型成为真正的基础设施,但张鹏也提到,不能多过地注意、甚至宣扬这件事,“做亏本买卖不是正常的商业逻辑,不可持续,最终还是要回归用户价值、生产力价值”。
回归价值本身,也是杨植麟的核心看法。他给出了三个判断,首先未来一个很重要的节点,是推理上的算力显著超过训练算力,这标志着价值开始得到释放。第二的重要节点,是c端推理成本显著低于获客成本,与之前的商业模式有了显著区别。在这两个前提之下,第三个关键在于,ai能做的事情可能会超过人做的事情,进而产生新的商业模式。
“这可能不是像今天谈到的,在b端用api做价格战,而是一种普惠ai,同时根据产生的价值形成商业模式。这三个点可能会是改变大模型商业模式本身或者roi问题很重要的途径”。杨植麟说。
在接受北京商报等媒体群访时,智源研究院院长王仲远也不可避免地被问到了价格战的问题。王仲远认为,降价是件利弊并存的事。
一方面降价对于开发者开发应用场景,接入大模型做更多尝试,存在价值。但另一方面,如果降价持续且低于实际成本的话,很可能得不偿失。
“毕竟大模型迭代仍然需要巨大资金投入,而中国的大模型也不应该停留在gpt-4的水平,我们更乐于看到一个良好的产业生态健康地发展,这也意味着它需要找到自己的产业模式、商业模式”。王仲远说。
而对开发者,王仲远认为,选大模型应该优先考虑的不是性价比,而是性能。王仲远说:“在此基础之上,我相信价格最终都会回归到合理的水平。而且对于好用的大模型来说也存在规模效应,如果使用规模上去了,工程师们自然有条件做工程系统上的优化,价格也会自然而然下降,从而避免出现劣币驱逐良币”。
北京商报记者 杨月涵