news 2026/3/1 12:07:17

VARIATIONAL REASONING FOR LANGUAGE MODELS粗读

张小明

前端开发工程师

1.2k 24

文章封面图 — VARIATIONAL REASONING FOR LANGUAGE MODELS粗读

这是一篇推导很多的文章，有时间可以仔细读：

通过变分推断的方式给了一个lower bound
在Section 3中，我们还证明了现有的RFT以及RL (GRPO)训练框架有隐式的bias，会给简单问题更高的训练权重，并且结论可以泛化到更一般的reward shaping情况。

参考链接

https://arxiv.org/pdf/2509.22637
https://www.xiaohongshu.com/explore/68db566200000000030138ff?xsec_token=ABQQDE4evn6WsuhIRN3TfUAvaJeoUsP7bmNNh3M8tuJ3Q=&xsec_source=pc_search&source=web_search_result_notes

网站建设 2026/2/27 3:21:55

Focus-Scan-Refine From Human Visual Perception to Efficient Visual Token Pruning

Focus-Scan-Refine: From Human Visual Perception to Efficient Visual Token Pruning Authors: Enwei Tong, Yuanchao Bai, Yao Zhu, Junjun Jiang, Xianming Liu Deep-Dive Summary: Focus-Scan-Refine: 从人类视觉感知到高效视觉 Token 剪枝摘要视觉语言模型&#x…

李华

网站建设 2026/2/25 20:18:23

建设ChatBI必须先有指标平台吗？对比两种ChatBI技术架构的差异（附选型指南）

引言：ChatBI 的“先有鸡还是先有蛋”困境近年来，随着生成式人工智能的爆发，ChatBI 成为企业数字化转型的热门话题。企业希望通过自然语言交互的方式，让业务人员像聊天一样获取数据洞察。然而，企业在应用ChatBI前的一个…

李华

网站建设 2026/3/1 4:14:43

大模型应用开发，现在就是风口，不要悲观的说什么替代程序员，现在风起云涌，都是机会。说说这个观点。

大模型应用开发，现在就是风口，不要悲观的说什么替代程序员，现在风起云涌，都是机会。说说这个观点。🚀 大模型应用开发：现在就是风口，满眼都是机会与其沉浸在“AI替代人类”的悲观论调中&#x…

李华

网站建设 2026/2/21 21:19:21

【精度】【核间同步】torch_npu.fused_linear_online_max_sum概率性精度不达标问题

1、问题背景 torch_npu.fused_linear_online_max_sum接口在批量执行多个用例的过程中，存在几条用例精度偶现不达标的现象，且每次失败的用例位置可能不一致，接口的多个输出中仅predicted_logits_local输出参数存在精度问题(有精度问题的输出值…

李华

网站建设 2026/2/21 0:56:26

java+vue基于springboot的可追溯果园生产过程管理系统_数据可视化大屏分析系统2588t5zw

目录系统概述核心功能模块技术架构数据流设计扩展性设计开发技术源码文档获取/同行可拿货,招校园代理 ：文章底部获取博主联系方式！系统概述基于SpringBoot和Vue的可追溯果园生产过程管理系统，结合数据可视化大屏技术，旨在实现对…

李华

网站建设 2026/3/1 2:39:18

《写 Python 时，你该选 namedtuple、dataclass 还是 class？一篇文章彻底讲清楚》

《写 Python 时，你该选 namedtuple、dataclass 还是 class？一篇文章彻底讲清楚》在 Python 的世界里，“如何定义数据结构”是一个永恒的话题。你可以写一个普通类（class），你可以用轻量优雅的 namedtuple&…

李华