Atlas800训练服务器(型:9000)
参数:
ssh方式(从π 2.0登录Ascend 910B计算节点),910B有两个计算节点,节点名分别为“ascend02”及“ascend03”
设置昇腾环境变量
若要进行多卡训练,需要使用新版的CANN软件。目前集群已经安装了7.0.RC1.alpha003版本的CANN,使用时需设置
查看集群使用状况使用如下命令
可以根据集群使用状况,使用以下命令指定使用的NPU
由于测试集群目前暂未配置slurm操作系统,为防止出现资源挤占,每天晚上11点会清理未释放的进程,请注意保存测试结果。
PyTorch配套支持的Python版本是:Python3.7.x(3.7.5
-3.7.11)、Python3.8.x(3.8.0 – 3.8.11)、Python3.9.x(3.9.0 – 3.9.2)。
利用PyTorch迁移工具能够代码中API的支持情况。
参数说明: – -i 要进行迁移的原始脚本文件所在文件夹路径 – -o
脚本迁移结果文件输出路径。 – -v 脚本迁移结果文件输出路径。
关于迁移工具的高级功能,请见昇腾文档中的”msFmkTransplt”章节。
目前节点仅支持单机多卡(最多8卡)
脚本命名为
© 版权声明
本网站上的所有资源均来源于本网站,所有网址和文章版权均归原作者所有。如有侵权行为,请将相关证明发送至以下电子邮件地址:dxsen@qq.com