大模型开启价格战？没有最低只有更低？

发布时间：2024-09-19

5月21日，阿里云宣布其通义千问GPT-4级主力模型Qwen-Long的API输入价格降至0.0005元/千Tokens，直降97% 。同日，百度智能云宣布文心大模型两款主力模型ENIRE Speed和ENIRE Lite全面免费。这场突如其来的价格战，标志着中国大模型行业进入了一个全新的阶段。

这场价格战的导火索，是 5月6日国内创业公司幻方旗下的大模型公司“深度求索”开源的第二代MoE模型DeepSeek-V2 。这款模型不仅性能强大，推理成本更是低至1元/百万token，仅为GPT-4 Turbo的七十分之一。这一举动在业界引起了巨大反响，直接引发了后续各大厂商的降价潮。

价格战的背后，是大模型技术的快速进步。百度官方透露，相比一年前，文心大模型的算法训练效率提升了5.1倍，周均训练有效率达到98.8%，推理性能提升了105倍，推理成本降至原来的1%。这种技术进步为价格下降提供了可能。

对于大模型厂商而言，降价并非单纯的市场竞争行为，更是一种战略选择。阿里云智能集团资深副总裁刘伟光表示，降价的目的是“普惠于市场”，“要真正加速市场的提前爆发” 。猎豹移动董事长兼CEO傅盛则认为，大模型降价的目标不是为了用户直接使用，而是为了吸引开发者。

这种策略转变反映了大模型厂商正在从单纯追求技术领先，转向更注重应用落地和生态建设。阿里巴巴原副总裁贾扬清指出，“站在整个AI业界的角度，降价是个拍脑袋就可以做的简单策略，但是真正的To B商业成功更难。”他认为，企业使用AI时，首要考虑的不是成本，而是如何产生业务价值。

然而，这场价格战对AI创业公司构成了严峻挑战。一些投资人表示，“这波降价对一些创业公司TO B模式影响较大。”过去很多公司选择与初创公司合作，主要是看重其API价格比大厂便宜。但现在，创业公司已经失去了这一优势。

面对这种情况，一些创业公司不得不重新思考自己的商业模式。一些公司开始探索垂直领域的细分应用机会，开发全新的AI应用。这种转变可能会引发一轮行业洗牌，但同时也为AI应用的多元化发展创造了条件。

展望未来，大模型的发展趋势将更加注重应用落地和生态建设。正如元始智能COO罗璇所言，现在的降价和免费并不解决当前大模型落地的核心问题，更关键在于模型计算效率要提升10-100倍，算力芯片成本尤其是推理要下降到1/10-1/100，以及解决可解释性的问题。

这场价格战标志着中国大模型行业进入了一个新的发展阶段。它既是技术进步的必然结果，也是市场竞争的产物。对于整个AI行业而言，这既是挑战，也是机遇。如何在价格战中保持创新活力，如何在激烈的竞争中找到差异化的发展路径，将是每个参与者都需要思考的问题。