news 2026/5/2 13:15:05

Amazon EC2 G7e实例正式可用!推理性能最高提升2.3倍!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Amazon EC2 G7e实例正式可用!推理性能最高提升2.3倍!

Amazon EC2 G7e实例现已正式可用,为生成式AI推理和图形工作负载提供高性价比与卓越性能。

Amazon EC2 G7e实例搭载NVIDIA RTX PRO 6000 Blackwell服务器版GPU,适用于空间计算、科学计算等多种GPU加速型工作负载。相较于Amazon EC2 G6e实例,Amazon EC2 G7e实例的推理性能最高可提升2.3倍。

与前代实例相比,Amazon EC2 G7e实例的核心升级如下:

NVIDIA RTX PRO 6000 Blackwell GPU:相比Amazon EC2 G6e,Amazon EC2 G7e实例采用NVIDIA RTX PRO 6000 Blackwell Server Edition GPU,提供高达两倍的GPU显存和1.85倍的GPU显存带宽。借助Amazon EC2 G7e实例更大的GPU内存,用户可在单块GPU上以FP8精度运行参数规模高达700亿的中等规模模型。

NVIDIA GPUDirect P2P:对于单块GPU内存无法承载的模型,用户可将模型或计算任务拆分至多块GPU并行处理。G7e实例支持借助NVIDIA GPUDirect P2P技术,通过PCIe互连实现GPU间的直接通信,从而有效降低多GPU工作负载的延迟。这些实例还能在同一PCIe交换机下实现极低的GPU对等通信延迟。此外,与G6e实例搭载的L40s GPU相比,G7e实例的GPU间带宽最高可提升4倍,大幅增强了多GPU工作负载性能。这些优化支持用户在单节点内跨多个GPU运行大模型推理任务,并且这些GPU提供的GPU内存总容量可高达768GB。

网络性能:Amazon EC2 G7e实例的网络带宽是Amazon EC2 G6e实例的4倍,可满足小规模多节点工作负载的运行需求。同时,多GPU配置的Amazon EC2 G7e实例支持基于Amazon EFA实现NVIDIA GPUDirect远程直接内存访问(RDMA),有效降低多节点工作负载中远程GPU间通信的延迟。Amazon EC2 G7e实例还支持结合Amazon FSx for Lustre实现NVIDIA GPUDirectStorage,与Amazon EC2 G6e实例相比,实例吞吐量最高可提升至1.2Tbps,助力用户更快加载模型。

Amazon EC2 G7e规格参数

Amazon EC2 G7e实例最高可配置8块NVIDIA RTX PRO 6000 Blackwell服务器版GPU,GPU内存总量最高可达768GB(单块GPU配备96GB内存),并搭载Intel Emerald Rapids处理器,支持最高192个vCPU、1600Gbps网络带宽、2048GiB系统内存以及15.2TB本地NVMe SSD存储。

Amazon EC2 G7e实例具体规格参数如下:

您可借助Amazon Deep Learning AMIs(DLAMI)运行机器学习工作负载,启动Amazon EC2 G7e实例,并通过亚马逊云科技管理控制台、Amazon CLI及SDK进行操作,搭配Amazon ECS、Amazon EKS可获得托管式体验。该实例对Amazon SageMaker AI的支持功能即将上线。

现已可用

Amazon EC2 G7e实例现已在美国东部(北弗吉尼亚州)与美国东部(俄亥俄州)的亚马逊云科技区域可用。如需了解该实例区域部署情况及未来规划,请参阅亚马逊云科技区域功能页面的Amazon CloudFormation资源标签页中搜索。

Amazon EC2 G7e实例支持On-Demand Instances、Savings Plan及Spot Instances三种方式购买,以及Dedicated Instances与Dedicated Hosts两种部署模式。定价详情参阅Amazon EC2定价页面。

即刻前往Amazon EC2控制台上手体验!更多信息请参阅Amazon EC2 G7e实例页面

亚马逊云科技区域功能页面:

https://builder.aws.com/build/capabilities/explore?tab=cfn-resources&trk=d8ec3b19-0f37-4f8c-8c12-189f913e205c&sc_channel=el

Amazon EC2定价页面:

https://aws.amazon.com/ec2/pricing

Amazon EC2 G7e实例页面:

https://aws.amazon.com/ec2/instance-types/g7e/?trk=d8ec3b19-0f37-4f8c-8c12-189f913e205c&sc_channel=el

本篇作者

Channy

亚马逊云科技新闻博客首席博主、首席开发者布道师。

新用户注册海外区域账户,可获得最高200美元服务抵扣金,覆盖Amazon Bedrock生成式AI相关服务。“免费计划”账户类型,确保零花费,安心试用。

星标不迷路,开发更极速!

关注后记得星标「亚马逊云开发者」

听说,点完下面4个按钮

就不会碰到bug了!

点击阅读原文查看博客!获得更详细内容!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 9:00:38

虚拟储能 微电网优化matlab 采用matlab编程,通过改进粒子群算法得到基于虚拟储能的智...

虚拟储能 微电网优化matlab 采用matlab编程,通过改进粒子群算法得到基于虚拟储能的智慧楼宇模型,程序运行稳定 虚拟储能技术这两年火得不行,特别是和微电网搭上边之后。今天咱们直接上手看个实战案例——用MATLAB玩转虚拟储能的智慧楼宇模型…

作者头像 李华
网站建设 2026/4/22 3:14:41

基于OpenCVSharp技术的角点检测与物体平整度测量研究报告

06OpenCVSharp 角点检测 检测平整度。 代码仅供参考。工厂里检测金属板平整度这事可太常见了。老师傅拿个游标卡尺左量右测,咱们程序猿当然要琢磨怎么用代码搞定。今天说个骚操作——用角点检测判断平面平整度,听着不靠谱?别急,看…

作者头像 李华
网站建设 2026/4/30 14:23:40

LabVIEW硬核玩法:用UDL连接SQL数据库搞进出账管理

学习LabVIEW过程,做的一个demo,程序功能主要是记个 客户项目进出账,其实EXCLE也能做,但是身为学习者,岂能屈于那种东西。 主要是为了学习LabVIEW利用UDL方式与SQL数据库连接,然后做数据存储、数据插入、查询…

作者头像 李华
网站建设 2026/5/1 3:03:11

智能交通流量优化系统:让城市道路告别拥堵时代

智能交通流量优化系统:让城市道路告别拥堵时代 【免费下载链接】ml-agents Unity-Technologies/ml-agents: 是一个基于 Python 语言的机器学习库,可以方便地实现机器学习算法的实现和测试。该项目提供了一个简单易用的机器学习库,可以方便地实…

作者头像 李华
网站建设 2026/4/30 8:21:54

FSMN VAD实战案例:社交媒体音频内容审核

FSMN VAD实战案例:社交媒体音频内容审核 1. 引言:为什么需要语音活动检测? 你有没有遇到过这样的情况:平台上有成千上万条用户上传的音频,但其中很多是静音、广告、背景噪音,甚至违规内容?人工…

作者头像 李华
网站建设 2026/4/23 17:21:43

终极指南:用IPATool轻松下载iOS应用安装包

终极指南:用IPATool轻松下载iOS应用安装包 【免费下载链接】ipatool Command-line tool that allows searching and downloading app packages (known as ipa files) from the iOS App Store 项目地址: https://gitcode.com/GitHub_Trending/ip/ipatool 想要…

作者头像 李华