中华网家电

设为书签Ctrl+D将本页面保存为书签,全面了解最新资讯,方便快捷。
业 界/ 互联网/ 行 业/ 通 信/ 数 码/ 手 机/ 平 板/ 笔记本/ 相 机
当前位置:频道首页 > 快讯 > 正文

最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一

最新一期权威大模型榜单:豆包1.5、商汤日日新V6并列国内第一
2025-05-30 20:02:24 来源:财讯网

5月28日,权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》全新出炉!

豆包1.5·深度思考模型(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模型(SenseNova-V6 Reasoner)共同摘得金牌,超越Gemini 2.5 Flash Preview,在国内大模型第一梯队领跑。

位居第二梯队的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。

图片1.png

来自SuperCLUE

报告指出,国内外第一梯队大模型在中文领域的通用能力差距正在缩小。在国产大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表现最为亮眼。国内推理模型竞争格局初露端倪。

SuperCLUE是行业权威的通用大模型的综合性测评基准。本次2025年5月报告聚焦通用能力测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精确指令遵循、文本理解与创作六大任务,总量为1579道多轮简答题。

责任编辑:kj005

文章投诉热线:157 3889 8464  投诉邮箱:7983347 16@qq.com

关键词:

好孕“医”夏|郑州长江中医院举办第二期京豫名医不孕不育疑难病

2025-05-30 18:01:22好孕“医”夏|郑州长江中医院举办第二期京豫名医不孕不育疑难病

2025广州家长最信赖的中小学课外辅导机构出炉 第一名是谁?

2025-05-30 17:50:072025广州家长最信赖的中小学课外辅导机构出炉 第一名是谁?

国内TOP10正规手机版炒伦敦金投资软件综评排名(2025年版)

2025-05-30 16:37:16国内TOP10正规手机版炒伦敦金投资软件综评排名(2025年版)

探索俄罗斯医学明珠:伊尔库茨克国立医科大学

2025-05-30 16:17:03探索俄罗斯医学明珠:伊尔库茨克国立医科大学

差旅管理中的“灰色地带”:企业如何有效杜绝违规行为?——程多多商旅

2025-05-30 15:58:50差旅管理中的“灰色地带”:企业如何有效杜绝违规行为?——程多多商旅

无创神经调控技术开拓早泄治疗新方向,“电及乐”亮相男科专业大会引发关注

2025-05-30 15:50:46无创神经调控技术开拓早泄治疗新方向,“电及乐”亮相男科专业大会引发关注

相关新闻