news 2026/4/15 15:44:57

多模态大模型年度收官之战,商汤「日日新V6.5」摘得国内榜首

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
多模态大模型年度收官之战,商汤「日日新V6.5」摘得国内榜首

12月29日,权威大模型评测基准 SuperCLUE 发布《中文多模态视觉语言模型测评基准12月报告》,商汤日日新V6.5(SenseNova V6.5 Pro)以75.35的总分位列国内第一,斩获金牌,并在视觉推理维度上拿下国内最高分。

商汤日日新V6.5领跑国内阵营,全球竞争力凸显

本次评测涵盖基础认知、视觉推理与视觉应用三大维度、二十项细分任务。测评结果显示,商汤SenseNova V6.5 Pro最新版以75.35分拿下国内模型第一,领先Doubao-seed-1.6-vision、ERNIE-5.0、Qwen3等。同时,以商汤日日新为代表的国产模型,正在大幅拉近与国外头部模型的距离,全球竞争力得到显著提升。

在各维度能力对比中,报告指出,商汤日日新V6.5等国产模型在基础认知维度方面已接近头部平均水平,部分甚至看齐Gemini 3.0 Pro。而在视觉推理维度上,国产模型中只有商汤日日新V6.5超过了头部平均,处于行业领先地位,其余国产模型仍有明显差距。

具体而言,商汤日日新V6.5共在七个细分任务中取得国内第一,其中物体描述、文本识别、环境辨识、逻辑推理、代码设计、自动驾驶领域六大细分任务并列国内第一,科学推理任务斩获79.17分为国内最高。

此外,在表情识别、3D物体识别、数学推理、工业应用能力、医疗影像分析、图形界面理解、内容审核等细分任务中,商汤日日新V6.5也有优异表现,综合位居国内模型第一梯队,展现出全面的多模态认知、推理和应用能力。

坚持底层创新,以用户价值牵引模型迭代

多模态领域的突围,是商汤坚持“多模态通用智能”技术战略,以底层创新突破产业发展瓶颈的有力印证。从创新的模型架构、到数据壁垒的打通,再到训练范式的革新,商汤日日新大模型不断拓展多模态大模型的能力边界。

在今年,商汤还发布并开源的NEO多模态架构,重构了视觉与语言的融合机制,实现内生多模态能力,仅用1/10的数据就达到了同量级多模态模型的最佳水平;同时,通过结合多模态数据整合与超越Next Token Prediction的突破性跨视角预测(Cross-View Prediction)训练范式,商汤日日新在空间智能表现上超过了GPT-5、最新的Gemini-3 Pro,以及Cambrian-S。另外,商汤还基于算法、系统、模型、架构多层面的联合创新,实现了成本与效率的双重突破。

本月「商汤产品发布周」上,商汤发布了多个基于日日新大模型的AI应用与产品,为视频创作、AI办公、电商直播、具身智能以及人们的日常生活等,带来效率提升与智能化体验升级,让AI实现从“生产力工具”向“生产力”的跃迁。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/10 21:48:35

Jupyter timeit测量TensorFlow操作执行时间

Jupyter 中使用 timeit 精确测量 TensorFlow 操作执行时间 在深度学习模型开发过程中,我们常常会遇到这样的问题:两个看似等价的运算写法,实际运行速度却相差显著。比如用 tf.matmul 还是 tf.einsum 做矩阵乘?自定义层是否引入了不…

作者头像 李华
网站建设 2026/4/15 2:27:48

(10-5-05)基于MCP实现的多智能体协同系统:检索增强生成工具

文件agent_mcp/tools/rag_tools.py是本项目中的 RAG(检索增强生成)工具模块,主要功能是提供一个自然语言查询接口,让已认证的代理可以向项目RAG系统提问。它通过验证代理身份、接收查询文本,调用核心RAG系统逻辑处理查…

作者头像 李华
网站建设 2026/4/15 13:46:43

SSH agent避免每次输入passphrase连接TensorFlow主机

SSH Agent:让远程 TensorFlow 开发更流畅且安全 在深度学习项目中,开发者常常需要频繁连接远程 GPU 服务器——这些主机通常运行着基于 TensorFlow-v2.9 的容器化开发环境。为了保障安全性,我们普遍采用 SSH 密钥认证,并为私钥设…

作者头像 李华
网站建设 2026/4/15 12:10:04

电商平台高并发支付安全测试:构建可靠防线的技术实践‌

在数字经济时代,电商平台的高并发支付场景(如双11大促或节日活动)已成为常态,但这也引入了支付安全风险——包括数据泄露、交易欺诈和系统崩溃等。对于软件测试从业者而言,确保支付系统在高流量下安全可靠,…

作者头像 李华
网站建设 2026/4/8 19:49:50

基于Proteus的双踪示波器仿真操作完整示例

手把手教你用Proteus玩转双踪示波器仿真:从RC电路看透信号测量本质你有没有过这样的经历?想观察一个电容充电的全过程,却因为手头没有示波器而只能靠计算“脑补”波形;或者在讲授《模拟电子技术》时,学生一脸茫然地问&…

作者头像 李华
网站建设 2026/4/12 23:01:38

GLPI终极指南:从零开始掌握开源IT资产管理神器

GLPI终极指南:从零开始掌握开源IT资产管理神器 【免费下载链接】glpi glpi-project/glpi: 是一个用于管理 IT 资产和服务的 PHP 应用程序。适合用于 IT 资产管理和服务管理。特点是提供了简单的 API,支持多种 IT 资产和服务管理功能,并且可以…

作者头像 李华