news 2026/4/24 23:37:40

ShortCut MoE模型分析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ShortCut MoE模型分析

1.模型结构

主要是让MoE部分和Dense部分并行起来,解决专家间的路由与数据传输成为性能瓶颈。

2.优势

2.1 计算-通信重叠扩展
ScMoE架构的核心突破在于计算-通信重叠机制。通过在专家模块间引入 shortcut 连接,模型能够在等待数据传输的同时并行执行部分计算任务。这种设计将传统MoE中串行的"路由-传输-计算"流程重构为并行处理,实测显示通信等待时间减少40%以上,显著提升了硬件资源利用率。

2.2 动态计算预算分配
配合ScMoE架构,零计算专家机制。该机制根据输入token的重要性动态分配计算资源,在保持5600亿总参数量的同时,仅激活186-313亿参数(约5-6%)。通过PID控制器调节专家偏置,确保每token平均激活约270亿参数,在精度与效率间取得完美平衡。

3. Zero Expert

主要解决MoE的负载均衡与计算效率问题,当某些Expert被选中负载太高时,多余的tokens被路由到Zero Expert,zero Expert不进行计算操作。这样可以平衡模型的激活参数量,以及scmoe部分的计算量与dense部分计算量均衡。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/24 23:34:12

Cadence IC617与Calibre 2019在Ubuntu 20.04上的避坑安装与集成指南

1. 环境准备与依赖安装 在Ubuntu 20.04上安装Cadence IC617和Calibre 2019前,系统环境配置是关键。我遇到过不少新手因为跳过这步导致后续安装失败的情况。首先确保你的系统是64位架构,可以通过uname -m命令查看,输出应为x86_64。 基础依赖安…

作者头像 李华
网站建设 2026/4/24 23:33:08

为什么STMicro最新STM32H7R/S系列被华为鸿蒙智联列为“唯一推荐LLM MCU”?:拆解其TrustZone-M + C语言安全执行域隔离的7层编译器级适配逻辑

第一章:嵌入式C语言与轻量级大模型适配的范式跃迁传统嵌入式开发以资源约束为铁律,C语言凭借零成本抽象、确定性执行和精细内存控制成为不可替代的基石。而当轻量级大模型(如TinyLlama、Phi-3-mini、MicroLLM)开始在MCU级设备&…

作者头像 李华
网站建设 2026/4/24 23:31:20

实测5款热门医药CRM,从合规到效能,哪款更适配国内药企?

在医药行业合规趋严、数字化转型提速的背景下,CRM已成为药企运营标配。面对市场上产品众多、宣传各异的现状,我们基于公开资料与实际应用体验,对决策易、销售易、纷享销客、医百科技、Veeva五款热门产品进行实测对比,排名不分先后…

作者头像 李华
网站建设 2026/4/24 23:27:23

TLS协议演进史:从TLS1.0的脆弱到TLS1.3的革新

1. TLS协议的前世今生:从SSL到TLS1.0的诞生 1994年,网景公司推出SSL协议时,可能没想到这个为电子商务设计的加密协议会成为互联网安全的基石。当时网上购物刚兴起,人们需要一种能保护信用卡信息不被窃取的技术。SSL 1.0从未公开发…

作者头像 李华