news 2026/3/10 13:22:19

大模型推理不确定性的根因和解决方法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
大模型推理不确定性的根因和解决方法

根因:

不确定性是浮点运算导致的

  • 浮点运算中顺序不同,计算结果会有微小差异,即 a + b ≠ b + a
  • 推理过程由于需要加速运算,导致计算顺序不是固定的

解决方法:

  • api调用层面:设置确定性相关的参数
  • 服务端层面:控制底层的模型部署

https://zhuanlan.zhihu.com/p/1961192621759242664

实践效果:

api调用层面

对于短问题,仅采用该方法确定性已经较高。对长问题,效果很差

req_body = { "model": deepseek-v3-0324, # 假设LLMConf是您的配置对象 "messages": [ { "role": "user", "content": "假如美联储有降息的倾向,黄金会增值还是贬值,简要回答" } ], "max_tokens": 500, "temperature": 0, # 设为0,完全消除随机性 "top_p": 1, #
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/5 18:27:28

k230部署yolo模型kpu无法运行,总是kpu run failed,如何解决?

🏆本文收录于 《全栈 Bug 调优(实战版)》 专栏。专栏聚焦真实项目中的各类疑难 Bug,从成因剖析 → 排查路径 → 解决方案 → 预防优化全链路拆解,形成一套可复用、可沉淀的实战知识体系。无论你是初入职场的开发者&…

作者头像 李华
网站建设 2026/3/8 14:27:58

基于STM32的疫情医护人员安全管理系统的设计实现

基于STM32的疫情医护人员安全管理系统的设计实现 第一章 绪论 疫情防控期间,医护人员面临接触风险高、行踪追溯难、健康状态监测不及时、应急求助响应慢等问题,传统人工登记、定期测温的管理方式效率低、易遗漏,难以满足闭环管理下的安全管控…

作者头像 李华
网站建设 2026/3/10 0:24:23

畜禽养殖环境智能监控系统解决方案:智能联动,自动启停养殖温控设备

在规模化、集约化畜禽养殖快速发展的今天,养殖环境的稳定性直接决定畜禽成活率、生长效率与产品品质,更是实现绿色养殖、保障食品安全的核心前提。传统养殖模式中,依赖人工巡检监测温湿度、有害气体等环境参数的方式,存在响应滞后…

作者头像 李华
网站建设 2026/3/3 22:47:43

深度测评9个降AI率平台,千笔AI助你轻松降AIGC

AI降重工具,帮你轻松应对论文查重难题 在当前的学术环境中,越来越多的高校和期刊开始采用AIGC检测系统来评估论文的原创性。对于专科生而言,如何高效降低论文的AIGC率、去除AI痕迹,同时保持语义通顺,成为了一个亟需解…

作者头像 李华
网站建设 2026/3/4 14:03:00

基于平扫CT的疾病诊断网络[python]-计算机毕业设计源码+LW文档

摘要:平扫CT作为一种常见的医学影像技术,在疾病诊断中发挥着重要作用。本文旨在探讨基于平扫CT的疾病诊断网络的相关研究。介绍了平扫CT的基本原理和特点,分析了其在疾病诊断中的应用需求,阐述了相关的技术如深度学习等在其中的应…

作者头像 李华