欧洲杯体育国内推理模子竞争模样初露眉目-开云「中国」kaiyun网页版登录入口

5月28日欧洲杯体育,巨擘大模子测评机构SuperCLUE《汉文大模子基准测评2025年5月禀报》全新出炉!
豆包1.5·深度想考模子(Doubao-1.5-thinking-pro)和商汤日日新 V6多模态模子(SenseNova-V6 Reasoner)共同摘得金牌,越过Gemini 2.5 Flash Preview,在国内大模子第一梯队领跑。
位居第二梯队的大模子包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。
禀报指出,国表里第一梯队大模子在汉文界限的通用智商差距正在收缩。在国产大模子中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner进展最为亮眼。国内推理模子竞争模样初露眉目。
SuperCLUE是行业巨擘的通用大模子的概括性测评基准。本次2025年5月禀报聚焦通用智商测评,涵盖数学推理、科学推理、代码生成、智能体Agent、精准领导衔命、文本交融与创作六大任务,总量为1579谈多轮简答题。
南边+记者 郜小平
