在国产大模型竞争日益激烈之际,AI初创公司北京月之暗面科技有限公司(以下简称“月之暗面”)日前发布全新开源模型Kimi K2(以下简称“K2”),试图重新争夺市场领先地位。7月13日,美国AI搜索初创公司Perplexity CEO阿拉温德(Aravind Srinivas)发文称,K2模型在测试中良好表现,后续可能会基于K2进行后训练。

Perplexity的CEO阿拉温德(Aravind Srinivas)点赞Kimi
有业内人士对此次K2模型的发布表示看好,他认为“Kimi现在在走一条比之前更正确的道路,具备深度研究能力才是大模型提供真正价值的核心”。该业内人士进一步向澎湃科技表示,大模型此前依靠Token(词元)低价竞争的策略并不会长久。
前述业内人士分析指出,大模型的研发和运营成本非常高,包括巨大的计算资源消耗、电力成本以及顶尖人才的投入,低价竞争策略会让企业难以收回成本,无法持续投入在研发上。从长远来看,这种模式并不利于行业发展。

Kimi K2 在自主编程(Agentic Coding)、工具调用(Tool Use)和数学推理(Math & Reasoning)三大能力维度的基准性能测试。 来源:月之暗面
月之暗面此次发布的K2模型具备更强的编程能力,在执行通用智能代理任务与工具整合方面表现出色,能更高效地拆解复杂任务。该模型总参数达到一万亿,激活参数为320亿。K2的API服务支持最长128K上下文,具备更强的通用性与工具调用能力,每百万输入tokens 4元,每百万输出tokens 16元。
而在此之前,国产大模型市场经历了一轮激烈的价格战,DeepSeek、豆包、文心一言、通义千问等头部厂商纷纷大幅下调模型服务价格。今年2月,DeepSeek宣布在每日00:30至08:30的夜间时段大幅降价:DeepSeek-V3输入价格降至每百万tokens 0.25元、输出价格1元,较原价下调50%。2024年5月,阿里云也将其Qwen-Long API的输入价格从0.02元/千tokens降至0.0005元,输出价格约为0.002元/千tokens,整体降幅最高达97%。
在模型性能上,K2在自主编程、工具调用及数学与逻辑推理三大核心能力的基准测试中表现良好。在前端开发任务中,K2擅长生成兼具设计感与视觉表现力的代码,支持粒子系统、可视化和3D场景等表现形式,具备较强的图形能力与交互性。此外,在Agent(智能体)任务执行方面,K2 Agent现已具备稳定的复杂指令解析能力,完成复杂任务或自动化编码。
月之暗面成立于2023年,由清华大学毕业生杨植麟创办,获得阿里巴巴等多家互联网巨头支持。该公司在2024年因推出具备长文本分析和AI搜索功能的Kimi模型而迅速走红,吸引大量用户关注。
不过,随着竞争对手DeepSeek今年初推出低成本、高性能模型R1并重塑全球AI市场格局,月之暗面的市场反响和热度略有所下滑。据追踪人工智能产品的中国网站aicpb.com称,月之暗面的Kimi应用程序去年8月在月活跃用户中排名第三,但到6月份却跌至第七位。
在沉寂数月之后,6月中旬,月之暗面推出Kimi-Research(深度研究)功能内测。据介绍,Kimi-Researcher是基于端到端自主强化学习(end-to-end agentic RL)技术训练的新一代Agent模型,也是一个专为深度研究任务而生的Agent产品。
转载请注明来自夏犹清建筑装饰工程有限公司,本文标题:《月之暗面推出新模型,业内人士:大模型低价竞争策略不会长久》
还没有评论,来说两句吧...