
北京时间11月11日,人工智能初创公司月之暗面Kimi CEO杨植麟等人在社交平台Reddit上解答网友提问,回应关于模型训练成本等问题。
Kimi近半年时间持续投入开源模型的研发与更新。11月6日发布了最新版本的开源思考模型Kimi K2 Thinking。彼时有消息称,Kimi K2 Thinking的训练成本为460万美元,低于DeepSeek V3模型的560万美元和OpenAI GPT-3的数十亿美元。
针对该数据,杨植麟在此次对话中回应称:(460万美元)不是官方数字,由于大部分投入都花在研究与实验上,因此训练成本很难量化。
网友也提出Kimi K2 Thinking推理长度过长、榜单成绩与实际体验不符等质疑,杨植麟表示现阶段该模型优先考虑绝对性能,token效率会在后续得到改善,榜单高分与实测的脱节问题也会在模型通用能力得到补齐后被逐渐消解。
当下,越来越多的中国开源大模型在国际市场中被调用。记者搜索OpenRouter模型调用榜单,最新一周内,排名前二十名的模型产品中,中国开源模型产品占五席,具体包括MiniMax M2、DeepSeek V3、GLM4.6、DeepSeek V3.1、DeepSeek V3.2 Exp。Kimi因OpenRouter平台接口问题,目前只能以API形式被使用。
持续的模型更新与庞大训练量需要算力资源支持,Kimi团队表示所使用的芯片是携带InfiniBand(一种面向高性能计算和AI训练的网络互连技术)的H800 GPU,性能虽然比不上美国的高端卡,数量也处于劣势,但每张卡都被用到了极致。

整体来看,月之暗面Kimi未来很长一段时间内仍将坚持开源策略,重点推进Kimi K2 Thinking模型的应用与优化。在优先文本模型前提下兼顾多模态模型推进,避开与OpenAI等头部厂商在AI浏览器等具体赛道的直接竞争,通过架构创新、开源策略与成本控制尝试建立差异化优势。
举报 第一财经广告合作,请点击这里此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。如需获得授权请联系第一财经版权部:banquan@yicai.com 文章作者
吕倩
相关阅读
DeepSeek开源新模型!单张A100日处理可超20万页数据新研究对于处理超长上下文将是个巨大突破。
324 10-20 20:25
AI进化速递丨支付宝推出“车机AI扫码支付”解决方案支付宝推出汽车行业首个“车机AI扫码支付”解决方案;智元参与筹建开源鸿蒙具身智能 PMC,以灵渠 OS 共筑机器人开源生态;混元图像3.0正式发布:开源,免费使用。
120 09-28 20:07
中国在全球大模型开源生态的贡献度达到18.7%中美两个国家的贡献总比例超过55%。
69 09-13 10:26该模型将在近期完全开源。
104 09-12 10:44
阿里云、美团同时出手,开源能成为机器人行业“催化剂”吗?只有当“开源”变成能跑得起来、落得下去的工具配资头条官网,行业才有望真正迎来通用具身智能的时刻。
127 09-08 16:41 一财最热 点击关闭元鼎证券_元鼎证券登录入口_配资平台官网提示:本文来自互联网,不代表本网站观点。