云服务器ECS:超级计算集群上
导读:云服务器ECS实例之超级计算集群上咨询热线 4006-333-292
本文介绍超级计算集群高主频型scch5、通用型sccg5和GPU计算型sccgn6的特点,并列出了具体的实例规格。
超级计算集群介绍
超级计算集群(Super Computing Cluster,简称SCC)在弹性裸金属服务器基础上,加入高速RDMA(Remote Direct Memory Access)互联支持,大幅提升网络性能,提高大规模集群加速比。因此SCC在提供高带宽、低延迟优质网络的同时,还具备弹性裸金属服务器的所有优点。
SCC主要用于高性能计算和人工智能/机器学习、科学/工程计算、数据分析、音视频处理等应用场景。在集群内,各节点间通过RDMA网络互联,提供高带宽低延迟网络,保证了高性能计算和人工智能/机器学习等应用的高度并行需求。同时,RoCE(RDMA over Convergent Ethernet)网络速度达到InfiniBand网络级的性能,且能支持更广泛的基于Ethernet的应用。
SCC与阿里云ECS、GPU云服务器等计算类产品一起,为阿里云弹性高性能计算平台E-HPC提供了极致性能的并行计算资源,实现真正的云上超算。
机型对比
SCC与物理机、虚拟机的对比如下表所示。其中,Y表示支持,N表示不支持,N/A表示无数据。
功能分类功能SCC物理机虚拟机
运维自动化分钟级交付YNY
计算无性能损失YYN
无特性损失YYN
资源无争抢YYN
存储完全兼容ECS云盘系统YNY
使用云盘(系统盘)启动YNY
系统盘快速重置YNY
使用云服务器ECS的镜像YNY
物理机和虚拟机之间相互冷迁移YNY
免操作系统安装YNY
免本地RAID,提供更高云盘数据保护YNY
网络完全兼容ECS VPC网络YNY
完全兼容ECS经典网络YNY
物理机集群和虚拟机集群间VPC无通信瓶颈YNY
管控完全兼容ECS现有管控系统YNY
VNC等用户体验和虚拟机保持一致YNY
带外网络安全YNN/A
高主频型超级计算集群实例规格族 scch5
规格族特点
· 均为I/O优化实例
· 支持IPv6
· 仅支持SSD云盘和高效云盘
· 同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信
· 具备弹性裸金属服务器的所有特性
· 处理器:3.1 GHz主频的Intel Xeon Gold 6149(Skylake)
· 处理器与内存配比:1:3
· 适用场景:
· 大规模机器学习训练
· 大规模高性能科学计算和仿真计算
· 大规模数据分析、批量计算、视频编码
实例规格
实例规格vCPU内存(GiB)GPU网络带宽能力(出/入)(Gbit/s)**网络收发包能力(出/入)(万PPS)***RoCE网络(出/入)(Gbit/s)支持IPv6多队列****弹性网卡(包括一块主网卡)*****
ecs.scch5.16xlarge64192.0无10.045046是832
说明 更多SCC的信息,请参见 什么是超级计算集群。
回到目录 查看其他实例规格族。
通用型超级计算集群实例规格族 sccg5
规格族特点
· 均为I/O优化实例
· 支持IPv6
· 仅支持SSD云盘和高效云盘
· 同时支持RoCE网络和VPC网络,其中RoCE网络专用于RDMA通信
· 具备弹性裸金属服务器的所有特性
· 处理器:2.5 GHz主频的Intel Xeon Platinum 8163(Skylake),计算性能稳定
· 处理器与内存配比:1:4
· 适用场景:
· 大规模机器学习训练
· 大规模高性能科学计算和仿真计算
· 大规模数据分析、批量计算、视频编码
实例规格
实例规格vCPU内存(GiB)GPU网络带宽能力(出/入)(Gbit/s)**网络收发包能力(出/入)(万PPS)***RoCE网络(出/入)(Gbit/s)支持IPv6多队列****弹性网卡(包括一块主网卡)*****
ecs.sccg5.24xlarge96384.0无10.045046是832
回到目录 查看其他实例规格族。
GPU计算型超级计算集群实例规格族 sccgn6
规格族特点
· I/O优化实例
· 支持IPv6
· 处理器与内存配比为1:4
· 处理器:2.5 GHz主频的Intel Xeon Platinum 8163(Skylake),计算性能稳定
· 具备弹性裸金属服务器的所有特性
· 存储支持:
· 支持ESSD云盘(百万IOPS)、SSD云盘和高效云盘
· 支持高性能并行文件系统CPFS
· 网络互连:
· 支持25Gbps*2的VPC网络
· 支持RoCE V2网络,用于低延迟的RDMA通信
· GPU加速器:V100(SXM2封装)
· 创新的Volta架构
· 显存16 GiB HBM2
· CUDA Cores 5120
· Tensor Cores 640
· 显存带宽900 GB/s
· 支持6个NVLink链路,每个25 GB/s,总共300 GB/s
· 适用场景:
· 超大规模机器学习集群训练场景
· 大规模高性能科学计算和仿真计算
· 大规模数据分析、批量计算、视频编码
实例规格
实例规格vCPU内存(GiB)本地存储(GiB)*GPU网络带宽能力(出/入)(Gbit/s)**网络收发包能力(出/入)(万PPS)***RoCE网络(出/入)(Gbit/s)支持IPv6多队列****弹性网卡(包括一块主网卡)*****
ecs.sccgn6.24xlarge96384无V100*83045025*2是832
操作步骤
您可以按照 创建ECS实例 的描述创建超级计算集群实例。(单击创建)
在选择配置时,您需要注意以下几点:
· 地域:请根据表格提供SCC实例的地域和可用区选择地域和可用区。如果售卖页显示的地域和可用区和表格不一致,以售卖页为准。
· 网络:仅支持专有网络(VPC 网络)。
· 实例:支持scch5(高主频型超级计算集群实例规格族)、sccg5(通用型超级计算集群实例规格族)和sccgn6(GPU计算型超级计算集群实例规格族)。
· 镜像:选择 公共镜像。目前支持定制版的Linux CentOS 7.5。
【阿里云,阿里巴巴集团旗下云计算品牌,全球卓越的云计算技术和服务提供商。海商(www.hishop.com.cn)作为阿里云湖南唯一授权服务中心,国内知名商城系统及商城网站建设提供商,专为企业提供专业完善电商整体解决方案、微商云、视频云、医疗云等,咨询阿里云服务器详情可电联:18684778716(微信同号)】
相关推荐
云服务器ECS:超级计算集群上…
使用云服务器 ECS 时,显示无法连接到Windows实例上怎么处理…
云服务器ECS:弹性裸金属服务器下…
导读:为帮助新手伙伴快速入门,了解熟悉云服务器的相关内容,本文主要讲述 云服务器 ECS产品功能镜像篇。 ECS镜像提供了…
云服务器ECS:内存型实例…
阿里云服务器个人版入门介绍…