news 2026/5/12 4:49:50

每日 AI 评测速递来啦(12.23)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
每日 AI 评测速递来啦(12.23)

司南·Daily Benchmark 专区今日上新!

SGI-Bench

一个面向科学通用智能的评测基准,由 1,000 余个经专家精心策划的跨学科样本构成,灵感来源于《Science》杂志提出的 125 个重大科学问题。

https://hub.opencompass.org.cn/daily-benchmark-detail/2512%2016969

3SGen-Bench

一个统一的图像驱动生成评测基准,提供标准化指标用于评估跨任务的生成保真度与可控性。

https://hub.opencompass.org.cn/daily-benchmark-detail/2512%2019271

LGBench

一个面向长篇、多目标图像生成任务的评测基准,包含 2,000 个任务,用于系统评估模型在复杂布局、局部对象、排版和标志精度等多目标指令下的执行能力。

https://hub.opencompass.org.cn/daily-benchmark-detail/2512%2019243

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/3 20:30:40

Axelspace与Exolaunch签署多批次发射安排协议并计划发射新卫星

致力于“让太空变得触手可及”的领先微卫星公司Axelspace Corporation (“Axelspace”)欣然宣布,已与全球发射整合商及发射任务管理、卫星整合与卫星部署技术领军企业Exolaunch签署多批次发射协议(MLA)。 这份多批次发射协议将加速Axelspace的业务发展。其中&#x…

作者头像 李华
网站建设 2026/5/3 18:28:29

LongCat-Flash-Omni:美团的全模态大模型

在多模态浪潮加速的 2025 年,美团再次交出了一份令人惊艳的答卷。 继 LongCat-Flash-Chat 与 LongCat-Flash-Thinking 之后,LongCat 系列迎来了新成员——LongCat-Flash-Omni。 它不仅是美团 LongCat 团队在大语言模型之后的重要升级,更是开源…

作者头像 李华
网站建设 2026/5/10 7:47:19

应用层自定义协议

自定义协议和序列化面向字节流全双工自定义协议序列化IO模块socket封装ServerserviceCalClient完整代码接下来我们实现一个网络计算器功能。自定义协议和序列化 前面我们的UDP套接字编程和TCP套接字编程都实现了应用层,但没有实现协议。是否会疑惑有没有协议有何不…

作者头像 李华
网站建设 2026/5/4 13:57:06

8个AI论文工具,助继续教育学生轻松完成写作!

8个AI论文工具,助继续教育学生轻松完成写作! AI 工具如何让论文写作更高效 在当前的继续教育环境中,学生和科研工作者面临越来越多的写作任务,而传统的写作方式往往耗时耗力。随着 AI 技术的不断进步,AI 工具正逐渐成为…

作者头像 李华
网站建设 2026/5/8 8:19:59

国内仿真云平台哪家强?该如何选择?

在数字化与智能化浪潮的推动下,仿真技术已成为工业设计、科学研究和教育培训等领域的重要工具。随着云计算技术的普及,仿真云平台凭借其弹性计算、高效协作和成本优化等优势,受到越来越多企业与机构的青睐。然而,面对国内市场上众…

作者头像 李华