昇腾AI-910B平台使用文档¶

AI百科2个月前发布 快创云
25 0

Atlas800训练服务器(型:9000)

参数:

ssh方式(从π 2.0登录Ascend 910B计算节点),910B有两个计算节点,节点名分别为“ascend02”及“ascend03”

设置昇腾环境变量

若要进行多卡训练,需要使用新版的CANN软件。目前集群已经安装了7.0.RC1.alpha003版本的CANN,使用时需设置

查看集群使用状况使用如下命令

可以根据集群使用状况,使用以下命令指定使用的NPU

由于测试集群目前暂未配置slurm操作系统,为防止出现资源挤占,每天晚上11点会清理未释放的进程,请注意保存测试结果。

PyTorch配套支持的Python版本是:Python3.7.x(3.7.5

-3.7.11)、Python3.8.x(3.8.0 – 3.8.11)、Python3.9.x(3.9.0 – 3.9.2)。

利用PyTorch迁移工具能够代码中API的支持情况。

参数说明: – -i 要进行迁移的原始脚本文件所在文件夹路径 – -o

脚本迁移结果文件输出路径。 – -v 脚本迁移结果文件输出路径。

关于迁移工具的高级功能,请见昇腾文档中的”msFmkTransplt”章节。

目前节点仅支持单机多卡(最多8卡)

脚本命名为

© 版权声明

相关文章