8月5日,腾讯科技的最新报道揭示了中文多模态大模型SuperCLUE-V基准的最新排名,腾讯的混元大模型以71.95分的高分,在国内大模型中独占鳌头。
腾讯科技自豪地宣布,其混元大模型不仅能够精确识别图像中的各种元素,还能生成流畅的自然语言描述,展现出全方位的理解和对细节的深刻洞察。在这次评估中,共有12个国内外知名的多模态理解大模型参与,腾讯混元模型在基础和应用能力上均取得了71.95分的优异成绩。
据榜单显示,8月的排名中包括了12个具有国际影响力的多模态理解大模型。腾讯混元大模型在总排名中位列第二,仅次于GPT-4o,后者以74.36分的成绩领跑整个榜单。GPT-4o在基础多模态认知和应用能力上均获得了超过70分的高分,显示出在技术和应用层面的显著领先。
SuperCLUE的评价指出,在基础能力方面,国内大模型与海外模型相比仍有提升空间,特别是在细粒度视觉认知任务上,国内外顶尖模型之间存在5分的差距,这表明国内模型需要在多模态深度认知能力上进行进一步的优化和提升。
此次评估特别选取了4个海外模型和8个国内具有代表性意义的多模态模型进行比较。为了全面评估开源与闭源模型的不同发展状况,参与评估的模型中包括了4个开源模型和8个闭源模型。