发布时间:2024-09-19
5月21日, 阿里云宣布其通义千问GPT-4级主力模型Qwen-Long的API输入价格降至0.0005元/千Tokens,直降97% 。同日, 百度智能云宣布文心大模型两款主力模型ENIRE Speed和ENIRE Lite全面免费 。这场突如其来的价格战,标志着中国大模型行业进入了一个全新的阶段。
这场价格战的导火索,是 5月6日国内创业公司幻方旗下的大模型公司“深度求索”开源的第二代MoE模型DeepSeek-V2 。 这款模型不仅性能强大,推理成本更是低至1元/百万token,仅为GPT-4 Turbo的七十分之一 。这一举动在业界引起了巨大反响,直接引发了后续各大厂商的降价潮。
价格战的背后,是大模型技术的快速进步。 百度官方透露,相比一年前,文心大模型的算法训练效率提升了5.1倍 ,周均训练有效率达到98.8%,推理性能提升了105倍,推理成本降至原来的1%。这种技术进步为价格下降提供了可能。
对于大模型厂商而言,降价并非单纯的市场竞争行为,更是一种战略选择。阿里云智能集团资深副总裁刘伟光表示, 降价的目的是“普惠于市场”,“要真正加速市场的提前爆发” 。猎豹移动董事长兼CEO傅盛则认为, 大模型降价的目标不是为了用户直接使用,而是为了吸引开发者 。
这种策略转变反映了大模型厂商正在从单纯追求技术领先,转向更注重应用落地和生态建设。阿里巴巴原副总裁贾扬清指出,“站在整个AI业界的角度,降价是个拍脑袋就可以做的简单策略,但是真正的To B商业成功更难。”他认为,企业使用AI时,首要考虑的不是成本,而是如何产生业务价值。
然而,这场价格战对AI创业公司构成了严峻挑战。一些投资人表示,“这波降价对一些创业公司TO B模式影响较大。”过去很多公司选择与初创公司合作,主要是看重其API价格比大厂便宜。但 现在,创业公司已经失去了这一优势 。
面对这种情况,一些创业公司不得不重新思考自己的商业模式。 一些公司开始探索垂直领域的细分应用机会 ,开发全新的AI应用。这种转变可能会引发一轮行业洗牌,但同时也为AI应用的多元化发展创造了条件。
展望未来,大模型的发展趋势将更加注重应用落地和生态建设。正如元始智能COO罗璇所言,现在的降价和免费并不解决当前大模型落地的核心问题,更关键在于模型计算效率要提升10-100倍,算力芯片成本尤其是推理要下降到1/10-1/100,以及解决可解释性的问题。
这场价格战标志着中国大模型行业进入了一个新的发展阶段。它既是技术进步的必然结果,也是市场竞争的产物。对于整个AI行业而言,这既是挑战,也是机遇。如何在价格战中保持创新活力,如何在激烈的竞争中找到差异化的发展路径,将是每个参与者都需要思考的问题。