人工智能月度跟踪:全球最大参数模型Kimi K2发布
投资要点:
2025年7月11日,月之暗面(MoonshotAI)发布采用MoE架构的大模型KimiK2,并同步开源。这款模型总参数量达1万亿,每次推理仅激活320亿参数,在代码能力和通用Agent任务处理上表现突出,同时凭借架构优化实现了性能与成本的平衡,输入输出价格更具优势。
月之暗面由杨植麟于2023年4月创立,聚焦探索能源转化为智能的最优路径,其产品迭代轨迹清晰。2023年10月推出首款智能助手Kimi,以Transformer-XL等算法实现20万汉字输入的长文本处理突破;2024年持续升级,先后实现200万字无损上下文能力、拓展多模态场景及工具调用功能,同年年底发布对标OpenAIo1的k0-math数学模型与k1视觉思考模型;2025年1月推出的k1.5多模态模型,在LongCoT模式下能力达o1水平,ShortCoT模式下领先GPT-4o和Claude3.5。2025年7月11日,公司发布KimiK2大模型并同步开源。
KimiK2采用64头注意力+384专家MoE设计,相比DeepSeekV3/R1更具效能。这一设计减少了自注意力计算负担,在加快推理速度、提升128K长文本处理效率的同时,扩展了知识覆盖范围和多任务适配性。训练端,借助MuonClips优化器完成15.5万亿Tokens的高效训练,全程无峰值且持续提升Token利用效率;此外,为解决工具交互数据稀缺问题,它采用大规模Agentic数据合成策略,学习复杂工具调用能力。
KimiK2是性能与成本平衡的大规模模型(总参数量达1万亿,每次推理仅激活320亿参数)。其训练成本覆盖算力(如GPU集群)、数据准备、算法调优等核心环节,相较于GPT-4.5、SparkDesk-v1.1、Llama-3.1等模型,KimiK2通过更精准的参数激活与架构优化控制成本,设计更聚焦实际落地效率。目前KimiK2输入、输出价格分别为0.6$/MillionTokens、2.5$/MillionTokens。
KimiK2在自主编程、工具调用、数学推理等复杂任务上表现突出,应用场景广泛。代码生成速度与软件开发效率显著提升,数学推理与科研计算精度加速研究进程,创意写作质量(文学评测SOTA)更是高居榜首。技术落地推动硬件升级,既拉动高性能GPU/TPU及边缘计算设备的需求与性能跃升,又优化电子供应链、降低中小企业AI应用门槛。
KimiK2的发布标志着国产AI在全球竞争中的全新突破。KimiK2强大的代码能力、Agent任务处理能力和开源策略,为开发者与用户提供了无限可能。无论是科研人员、开发者还是普通用户,都可以通过KimiK2探索AI的更多潜力。
风险提示:1)先进算力芯片限制加强2)下游应用需求不及预期3)国产模型迭代升级迟缓
本站内容源自互联网,如有内容侵犯了您的权益,请联系删除相关内容。 本站不提供任何金融服务,站内链接均来自开放网络,本站力求但不保证数据的完全准确,由此引起的一切法律责任均与本站无关,请自行识别判断,谨慎投资。