DeepSeek-R1的出现,带动大模型竞争进入“免费普惠阶段”,AI技术普及的门槛再次降低,一大波产业应用升级大幅提速。
——————————
DeepSeek引发的“鲶鱼效应”还在持续,这次的主角是AI(人工智能)大模型的价格。
要知道,2024年12月,OpenAI的会员费已经涨至每个月200美元,是全球最贵;文心一言虽然已有部分模型宣布免费,但其专业版的付费使用门槛依然不低。多位业内人士对中青报·中青网记者表示,这次国内外AI厂商纷纷在价格上转向,意味着AI大模型的竞争进入了“免费普惠阶段”,DeepSeek的影响不容忽视。
“在同样性能的不同大模型中,C端(个人消费者)用户向来喜欢选择免费的。”快思慢想研究院院长、原商汤智能产业研究院创始院长田丰对记者说,2022年年底的“ChatGPT时刻”让每一个普通人都能体验到AI的魔力。如今,DeepSeek的横空出世促使大模型“免费潮”在全球涌动,将AI技术普及的门槛再次降低。“未来,AI大模型的发展,将推动一大波产业应用升级,如医疗、法律、教育等。”
大模型“免费潮”
纵观过去这几年,AI大模型的商业运营模式大多是围绕付费使用展开的。
2023年2月1日,OpenAI推出付费订阅计划“ChatGPT Plus”,首次将AI大模型的C端用户使用价定在每月20美元。2023年3月,百度发布文心一言并宣布免费试用,当年11月,文心一言上线专业版并在国内首先开启付费模式;2023年9月,腾讯混元大模型对外开放,其收费标准为每1000个token(模型输入和输出的基本单位)收费0.14元……此时,大模型的使用还是“按分计价”。
直到2024年5月,国内AI企业深度求索旗下的DeepSeek-V2模型将大模型的价格降至GPT-4的1%后,阿里、腾讯、字节跳动等多家企业迅速跟进,AI大模型“按厘计价”时代正式开启,并激起一波模型“降价潮”。DeepSeek-R1的出现,则将这一进程直接推向“零成本”的临界点。
2025年1月20日,深度求索发布开源AI大模型——DeepSeek-R1,其API服务定价远低于OpenAI的o1模型。1月底,OpenAI免费开放推理模型o3-mini。而后,便是此次百度和OpenAI同天宣布“免费”,大模型价格战再升级。
从“按分计价”到“按厘计价”,再到如今“零元购”,在中国科学院科技战略咨询研究院研究员周城雄看来,上述转变的发生,与相关技术的进步和规模效应有关。他提到,随着算法和硬件技术的不断进步,以及更多企业和个人参与到大模型的研发中,大模型的训练成本正逐渐降低。“DeepSeek-R1就是一个例子。”
据了解,DeepSeek-R1通过优化算法采用MoE(混合专家模型)架构、MLA(多头潜在注意力机制)等技术,使得GPU集群使用效率远超行业平均水平,模型训练的算力需求显著降低。公开数据显示,DeepSeek-R1的模型训练成本仅为560万美元左右,“相比OpenAI的GPT-4模型高昂的训练费用,大模型应用的成本可以说降到了‘白菜价’。”周城雄说。
“过去百年,创新的本质就是成本下降和生产力提升,在AI、IT乃至更多领域,大多数创新都与降低成本有关。”在日前举行的2025年世界政府峰会上,百度创始人李彦宏透露,如今,大模型推理成本已经实现了每年降低90%以上。以文心大模型为例,2024年,其日均调用量达15亿次,显著的规模效应降低了单位成本;同时,文心一言的深度搜索功能还支持调用外部工具来处理复杂任务,也能有效降低成本。
“人工智能是一项通用型技术,按照摩尔定律,其成本会持续降低,直到所有AI应用都可以不用太关注用户规模和算力成本之间的关系。”田丰认为,2025年会是大模型的“成本年”。他说,大模型成本的降低有赖于基础设施、软件工程等方面的技术创新。之前,各个AI企业比的是谁的模型更领先,现在要比的则是在领先的前《巧克力直播网体育wwe2022》提下,谁的模型更便宜。“又便宜又好,这是当下所有市场用户的呼声,DeepSeek也正打到了这个点。
新的AI竞争
除了成本降低,业内还普遍认为,大模型“免费潮”背后,其实是相关企业希望通过“免费”来巩固自身的市场优势,换句话说:争取更多的用户和流量。
周城雄表示,如今,国内外的通用大模型在性能上趋同,比较难通过技术差异来建立产品的壁垒,那就要靠“价格”来竞争,“免费”策略能够满足大模型企业快速积累用户规模、通过流量入口抢占生态位的市场扩张需求。至于为何在此时发生集中式的转向,这与今年一开年,DeepSeek系列模型在AI界的强势破局不无关系。
如今,免费且开源的DeepSeek兼具较强的复杂任务推理能力和联网搜索能力,其搜索深度能达到50个相关网页左右。田丰对记者表示,这一方面吸引了大量C端用户,还在一定程度上抢占了搜索引擎的用户和流量。“如果此时其他App应用还继续坚持付费使用,很难获得中国用户的青睐。”
相关数据也证明了DeepSeek的巨大吸引力。国内数据服务机构QuestMobile的报告显示,1月28日,DeepSeek应用程序的日活跃用户数首次超越了豆包App;2月1日,DeepSeek的日活跃用户数突破3000万大关,成为史上最快达成这一里程碑的应用。
在田丰看来,DeepSeek系列模型实现了两项突破。一方面,开源模型性能追平了闭源模型;另一方面,面向C端用户的应用程序即时推出,吸引了海量的用户需求。“这也就迫使部分AI企业要重新考虑,改变或调整原本的商业模式和策略,尤其是那些昂贵的闭源模型企业。”
DeepSeek在全球掀起新一轮AI热潮后,奥特曼曾公开表示,其公司在AI模型技术闭源问题上站在了“历史的错误一边”,现在需要想出一个不同的开源策略。而就在2月14日,百度宣布将在未来几个月内陆续推出文心大模型4.5,并从6月30日起开源。对此,李彦宏过去数个月的感受是“开源模型能够帮助大模型传播”。“(开源)帮助这项技术传播更快,因为我们在生成式AI的早期阶段,传播得更快意味着更多人尝试,从而在应用层促成创新。”他说。
如今,越来越多企业也开始拥抱DeepSeek。记者从工信部了解到,目前,我国3家基础电信企业已全面接入DeepSeek。此外,手机、PC等终端厂商,云服务商、应用服务商等也都在积极行动。2月16日,腾讯公司公开表示,微信搜一搜已于近日正式灰度测试接入DeepSeek,DeepSeek生态圈持续扩大。
日前,中关村科金的智能客服全系产品也完成了DeepSeek的全面接入,并在不同行业超过30个大模型应用场景进行全面评测。在金融行业复杂文本问答场景中,通用开源大模型准确率约79.8%,而DeepSeek-V3(通用型)准确率高达95.1%,DeepSeek-R1(推理型)为94.9%,整体提升15%。“这有效降低了金融行业客户咨询转人工率,让AI客服承担更多咨询任务,减轻了人工客服压力。”中关村科金总裁喻友平对记者说。
“基础大模型的免费开放,对相关业务具有显著的促进作用,尤其是在降低直接成本和增加客户选择方面。”喻友平表示,一方面,DeepSeek等免费开放的基础大模型显著降低了企业在模型调用上的直接费用,尤其对于中小型企业,这大幅降低了技术门槛和初期投入;另一方面,模型免费也提供了更多技术创新的可能性,“尤其是在行业大模型的优化和场景化应用上,能够以更低的成本探索更多创新方向”。
在周城雄看来,“免费”也是AI企业商业模式的一次重构。他提到,免费用户的行为数据可反哺模型迭代,实现数据与场景沉淀,而应用场景的拓展则为未来商业化提供可能性。同时,这也是资本市场的常规博弈策略。“头部企业可以凭借融资优势,以短期亏损换取长期市场优势地位。”
应用端探索提速
大模型走向“免费”,能吸引更多用户和开发者,推动AI技术的普及和应用。也有业内专家向记者提到,上述变化也将会促使相关企业持续跟进,进一步探索新的商业模式。
中国银行深圳市分行大湾区金融研究院研究员郭燕表示,AI大模型开启新一轮降价甚至是免费,将进一步降低AI应用的开发门槛,使开发者可往B端(企业)和C端更多产品方向探索,加快AI应用落地和商业化进程。“比如在AI消费硬件领域,包括DeepSeek在内的开源技术已推动国内AI眼镜、智能戒指、助听器等产品的创新浪潮。”
在田丰看来,沿着工程技术创新和开源策略,未来,AI大模型企业的发展着力点将主要集中在以下两方面:一是“向下”,做基础模型的研发突破,包括开发下一代AI操作系统等,“这将是一个AII in One(超级聚合)的基础底座,少数几家企业可以通过重资金投入来保持领先性”;二是“向上”,找到垂直领域的商业模式和应用机会,在细分领域形成智能商业闭环,“这是每个行业、每个企业都有机会分一杯羹的方向”。
值得注意的是,DeepSeek出现后,企业接入AI大模型的速度明显提升,相关应用产品层出不穷。田丰解释说,这是因为随着技术的迭代,基础模型已经做到了低成本、小尺寸,大家都专注于模型的应用以及与应用有关的数据集的训练,“未来还可能会进一步带来闭源模型的‘瘦身’和低成本,包括向开源转变”。
田丰还特别强调,“现在对中小型AI企业来说,是一个难得的机会”。他说,如今算力门槛降低,中小企业可以在国产开源大模型的基础上,低成本“蒸馏”开发适合自己硬件终端的小模型、行业应用小模型等。同时,大厂会聚焦自己核心业务的AI升级,中小创企则可以聚焦垂直领域的训练数据加工、模型调优、AI项目交付服务等,“这样就可以躲开巨头的锋芒,或者成为巨头产业链、传统产业链上的一环”。
此外,AI眼镜、机器狗、机器人等软硬结合的AI服务新终端,有完全不同于手机App的交互体验,需要新交互、新服务、新入口。“创业企业没有历史遗留资产,可以轻装上阵自由发挥。”田丰说。
12月4日晚,神舟十四号载人飞船返回舱在东风着陆场成功 ♌着巧克力直播网体育wwe2022陆。第一财经从中国科学院获悉 ☼,4日当天 ♌,随舱下行的载人空间 ⏩站第三批空间科学实验样品在着陆场交付空间应用系统,并于5日凌 ♈晨返回北京 ➧,顺利交接相关实验科学家。
三大因素引发业绩下滑风险
本报记者 杨震 【编辑:米拉蒙特斯 】