首页 > 生活学习 > 生活学习 > DeepSeek-V3 & R1 合体,快手开源 \"Auto Think\" 大模型

DeepSeek-V3 & R1 合体,快手开源 \"Auto Think\" 大模型

发布时间:2025-06-05 17:45:57来源: 15510183920
6 月 4 日消息,快手 Kwaipilot 团队近日开源了 KwaiCoder-AutoThink-preview 自动思考大模型,针对近期深度思考大模型存在的“过度思考”问题进行了深入研究。团队提出了一种全新的自动思考模型训练范式,同时基于传统强化学习算法(GRPO),提出了带有过程监督的强化学习方法 Step-SRPO,以进一步提升模型在复杂任务中的表现。
 
 
  据介绍,该模型融合了“思考”和“非思考”能力,号称“DeepSeek-V3 & R1 合体”,具备根据问题难度自动切换思考形态的能力。通过进行这种思考形态训练,模型在多个“思考”和“非思考”评测榜单上均实现了性能提升,其中在部分代码和数学类的任务上,开启自动思考模式下的模型得分提升高达 20 分左右。官方表示,在部分榜单中,即使模型没有开启思考模式,受益于更优的推理形态,性能也有小幅上涨。
 
 
 
  快手技术表示,Kwaipilot 未来将基于 preview 版本模型,进一步增强推理能力,支持更完善的思考中工具使用能力,也会将全部技术细节、训练方法开源

生活学习更多>>

韦东奕一条5秒作品抖音涨粉超118万:评论区成高考许愿池 荣耀上市已经板上钉钉了?荣耀的上市路该咋看? 安兔兔发布性价比排行榜:3K档荣耀GT Pro断崖式第一! 荣耀400正式开售 标配2亿主摄+超大电池 最低2499元 如何让废旧手机从“电子垃圾”变成“绿色资源”? 借记卡长期不用是否会产生费用?手机转账限额如何提升?定期存折流水不按时间顺序打印是何原因?交通银行大庆分行上线答复 ↘ 索尼对“顽皮猫”商标提出反对,称和自家“顽皮狗”商标混淆 魅族 22 系列手机入网:有望搭载骁龙 8 至尊版、下月发布 继“魅力指数”第一后,小米 SU7 拿下 J.D. Power “消费者之声”奖 小米高考加油站上线:10 万份“答案之水”免费领 疑似小米手环10渲染图出炉:正面四等边且无下巴,但功能升级乏善可陈 雷军官宣小米汽车高阶驾驶培训课开课:SU7实车训练、演练打滑失控等场景 雷军官宣小米汽车高阶驾驶培训课今日开课:价值1999元,首批10000人免费 小米辣920:直播界的“全能才女”,用才华点亮每一个舞台 华为Pura 80系列5小时预约破6万 华为泰山2280服务器国产信创 AI 大数据热卖 小鹏汽车携手华为发布“追光全景”AR-HUD,定义全球AI智驾“第一屏” 2025华为鸿蒙智家设计大赛启动:智美融合,共赴空间智能化浪潮 厉害了!OPPO宣布:向大众汽车全球授权5G通信标准必要专利 三星新机现身 Geekbench:预计为 Galaxy Z Fold 7 全球版,多核最高 9226 分 12.7 英寸 2.9K 144Hz 显示屏:联想 YOGA Pad Pro 平板 2129 元(骁龙 8 Gen 3) DeepSeek-V3 & R1 合体,快手开源 \"Auto Think\" 大模型 云南支持毕业生等青年返乡做电商 商务部:将继续扩大优质特色产品进口,深化电商产供链合作 买一得二:京东 PLUS + 芒果 TV 联合会员年卡 108 元限量发车 京东618“时尚焕新日”惊喜开启 运动爆款单品低至5折 天猫618“国补免单”政策落地,叠加平台优惠催生消费热潮 淘宝天猫联合顺丰推出“极速上门”物流服务:次日达 + 送货上门 荣耀HONOR 200 5G手机限时特惠1246元 荣耀Magic V5配置细节曝光:搭载骁龙8领先版+6000mAh以上电池