月之暗面重返基模战场:发布首个开源万亿模型,押注“模型即Agent”
炒股就看,权威,专业,及时,全面,助您挖掘潜力主题机会!

蓝鲸新闻7月12日讯(记者 朱俊熹)时隔半年,“大模型六小龙”之一的月之暗面终于推出新一代基座模型Kimi K2。据官方介绍,Kimi K2是一款具备更强代码能力、更擅长通用Agent任务的MoE架构基础模型,总参数达1万亿,激活参数为320亿。
7月11日发布并同步开源的新模型包括两个版本:基础模型Kimi-K2-Base、更适合通用聊天和智能体任务的后训练模型Kimi-K2-Instruct。在自主编程、工具调用和数学推理相关的能力评测中,Kimi K2均取得了较优的表现。以SWE-bench Verified、AIME 2025等评测集为例,Kimi-K2-Instruct的得分超过了同为开源模型的DeepSeek-V3、阿里Qwen3,逼近甚至能够反超OpenAI GPT-4.1、Anthropic Claude 4 Opus等领先闭源模型。
结合6月底开启内测的新Agent“Kimi-Researcher”不难看出,月之暗面的思路正转向“模型即Agent”。模型自身就集成了自主决策和执行任务的能力,能够作为智能体解决复杂任务。
在官方释出的用例中,用户要求Kimi K2帮忙规划参加Coldplay乐队巡演的行程。该模型通过17次工具调用,涵盖搜索、日历、邮箱、航班、餐厅预订等环节,制定出一份完整的机酒与旅游规划,并形成可视化报告。
智能体能力正在成为国内外大模型厂商竞相押注的进化方向。本周,马斯克旗下的人工智能初创公司xAI发布新一代大模型Grok 4,包括单智能体、多智能体两个版本,具备工具使用、实时搜索等功能。Anthropic在推出Claude 4系列模型时也强调,在编程、推理和Agent方面“树立了全新标准”,能够处理复杂且长时间运行的任务。
月之暗面在Kimi K2的技术博客里分享了对构建开放智能体智能的看法。其指出,预训练是智能体智能的关键基础,它让模型拥有基本的知识、理解和推理能力,从而在后续的强化学习中更有效地学习。但“人类数据就像是有限的‘化石燃料’”,因此如何在预训练阶段提升对有限数据的利用效率,成为当前AI扩展的关键挑战。
而在后训练阶段,大模型不再只依赖人类数据,开始从自己的行为和结果中获得奖励、进行自我优化,以实现超越人类能力的可能。
“Kimi K2正是在这些洞见之上锻造而成的。”月之暗面表示。其同时强调,Kimi K2是构建通用Agent能力的坚实基础,但通用Agent还需要更高级的能力,比如思考和视觉理解,计划未来为该模型加入这些能力。此外,长文本处理能力曾是Kimi的核心优势,此次Kimi K2的上下文长度为128k,不及部分新发布的模型。
值得注意的是,Kimi K2是国内首个开源的万亿参数级别模型。此前虽有其他大模型厂商训练出万亿参数模型,如腾讯混元Turbo、MiniMax abab 6.5等,但都采取了闭源路线。
在训练Kimi K2这样的万亿参数级别的大模型时,月之暗面采用了自主创新的Muon优化器。与传统的Adam优化器相比,Muon在token利用效率上表现更优,能让大模型学得更快、更有效率。同时为解决Muon在超大规模训练时遇到的不稳定问题,团队还提出了MuonClip这一稳定性增强技术,支撑Kimi K2顺利完成15.5万亿tokens的预训练,未出现训练损失值的异常峰值。
自年初DeepSeek横空出世以来,月之暗面虽然陆续释出了一些技术或产品上的更新,但始终未能重拾外界对其的热切期待,一度表现得颇为低调沉寂。而此次Kimi K2的发布,让这家明星创企终于重回基模舞台的聚光灯下,这场牌局仍未见定论。
- • 心肌炎的早期症状:如何早期发现并预防
- • 地方新闻精选 | 世界第一头体细胞克隆牦牛在拉萨诞生 湘潭大学投毒案二审将择期宣判
- • 谷歌母公司Alphabet启动首次欧元债券发行 拟筹资至少25亿欧元
- • 小升初简历模板Word免费下载:助您轻松打造个性化简历
- • 《LOL冠军之夜:荣耀绽放,梦想成真》
- • 《第五人格CC直播:兔菲的精彩表现,带你领略游戏魅力》
- • 《黄书漫画:探讨其文化内涵与影响》
- • 揭开南京大屠杀的真相:历史不容遗忘
- • 《斗罗大陆2:绝世唐门荣耀篇》漫画全集免费来袭,带你领略热血青春的传奇故事!
- • 报道:美国防部暗中阻止乌克兰对俄罗斯的远程导弹打击
- • 海外考古大家访谈|勒洪·奥利维:凯尔特人与古代中欧的制盐业
- • 中国恒大:申请在公司清盘中不成立审查委员会的聆讯将在9月16日进行
- • 日本央行行长植田和男:将密切关注超长期国债收益率走势
- • 民营房企重返土拍市场,多家“黑马”竞逐热点城市核心地块
- • 核心分歧仍难消除之际 美国与伊朗开启第四轮核谈判
- • 解析“4+4” 医学教育模式:招生标准是什么,毕业生水平与去向如何?
- • 《小埋本子H:揭秘二次元萌少女的治愈魅力》
- • 界面晚报 | 海关总署:前4个月我国货物贸易进出口同比增长2.4%;欧盟就美国关税向WTO申诉
- • 《冰雪奇缘》主题曲英文版:一曲动人心弦的冬日颂歌
- • 加拿大华人网官网:连接海外华人,展现多元文化的桥梁
- • 诺诚健华首次实现季度盈利
- • 言短意长|考生放弃清北转投他校并非坏事
- • 起火20天后,载有3000辆汽车的货船在太平洋沉没
- • 2家百亿锂电巨头天赐材料及永太科技打“诉讼战”,一审已送前员工吃“牢饭”!
- • 为什么是Labubu?从玩具到成年人的情绪消费|编辑部聊天室
- • 8月10日增减持汇总:暂无增持 孚能科技等12股减持(表)
- • 马斯克旗下xAI成本不断攀升 据悉每月消耗10亿美元
- • 沟通从心开始——家长会,构建和谐家校关系的新篇章
- • 健身新势力挤压,威尔仕上海仅剩两家门店
- • 印度尼西亚特产:探寻东南亚岛国的独特魅力
- • 一艘载有“电石”的集装箱船在印度南部海域沉没,引发环境危机担忧
- • 环着沙漠看新疆丨沙雅县多措并举推进生态保护与绿色发展
- • 探寻淮河源头:千年河流的起源之谜
- • 作物种质资源“天书计划”发布,开启AI解码种质资源新纪元
- • 百度智能云:过去一年助力20家创企获亿元融资
- • 构建全球深海微生物资源库,联合国这项大科学计划全球总部设在上海
- • 柳岩晒健身照,展现健康生活新风尚
- • “科创板八条”后百单产业并购发布,披露交易金额超247亿
- • 古代女子杖刑臀部:历史记忆中的残酷与反思
- • 全国继教网教师培训:助力教师专业成长,提升教育教学质量
- • 榆林嫌犯脱逃后杀人事件引发社会广泛关注
- • 德国经通胀调整后的房价 4 月同比上涨 0.6%
- • 高中英语单词听力下载:提升英语水平的必备利器
- • 一条做饭视频招致45万“天价罚单”
- • 揭秘网络世界中的“镜像劫持”:黑客如何利用镜像技术窃取数据
- • 简易拉线烟雾弹制作方法:居家必备的应急技能
- • 陕西省农业厅官网:助力农业现代化,服务农民新平台
- • 特朗普向洛杉矶增派2000名国民警卫队士兵
- • 柳岩晒健身照,展现健康生活态度,网友:身材太惊艳!
- • 《畅游天下:探索旅游频道的魅力与价值》
- • 快舟十一号:中国航天事业的新星
- • 白宫就以色列 - 伊朗冲突发表关键表态
- • 麦子金服财富官网登录:开启您的财富之门
- • 特朗普政府解雇美国工人健康与安全机构的员工
- • 华尔街资讯直播室:金融市场的实时窗口
- • 广东佛山:8月7日全市将开展爱国卫生运动统一行动
- • 《读文哄睡电台:用文字编织的浪漫爱情梦》
- • 宁德时代旗下即将诞生的百亿独角兽,是家什么公司?
- • 英国推出5亿英镑计划,支持多元化及代表性不足的投资者与创业者
- • 哈马斯:已对美方加沙停火提案作出正式回应
- • 大显神威于海阳县:一场惊心动魄的海战传奇
- • 《岁月如歌:我的父亲和母亲的故事》
- • 体坛联播|弗鲁米嫩塞晋级世俱杯半决赛,张帅晋级女双16强
- • 巴西央行再度加息 但加息幅度下降
- • 歼-10b:中国空军新一代高性能战斗机
- • 黄浦江畔飞来一群“男鹅”,马修·伯恩版《天鹅湖》又回上海
- • 揭秘美国真人春画全图:历史、艺术与道德的冲突
- • 长江后浪推前浪,继往开来谱新篇
- • DeepSeek被写入市政府工作报告,杭州将支持算法模型企业发展
- • 广东高校科技成果转化中心生物医疗基地在广州揭牌
- • 精品消费“精”在哪?多在体验上下功夫
- • 灵耀13:引领未来科技潮流的轻薄笔记本电脑
- • “五一”假期余额不足两天,多地景点已约满、限流
- • 欧洲领导人拟在美俄首脑会晤前与特朗普会商,讨论乌克兰局势
- • 临床医师三基考试试题及答案:全面解析与备考指南
- • 广州再加码夜经济,挖掘消费新增长极
- • 口交动图:揭秘网络传播中的敏感话题
- • 广发银行南昌分行被罚85万元:违反账户管理规定等
- • 榆林嫌犯脱逃后杀人事件:警民齐心协力,罪犯终落网
- • 中外对话|中国引领智能绿色转型,合作是唯一通路
- • 网易对战平台官方网站:打造全新电竞体验的数字战场
- • 全球文明对话部长级会议:外国嘉宾最想要什么中国礼物?
- • 探寻AJ6大巴黎的时尚魅力:街头潮流的象征
- • 轻松掌握MSN帐号注册步骤,开启您的网络社交之旅
本文 快租网 原创,转载保留链接!网址:https://www.kuaizu.me/post/19056.html