AMD GPU  数据训练 平台全折腾记 (持续更新中,欢迎收藏 转发点赞和投币)

======================================================================================

先说结论:如果你不想折腾,只需要安装好rocm 3.1后直接用我的wheel包安装即可,轮子已经造好,无需重来:

安装环境:

https://github.com/RadeonOpenCompute/ROCm

下载造好的轮子:

https://download.csdn.net/download/znsoft/12246098

下载后,直接

pip install xxxx.whl #(此处的xx.whl是你下载的文件名)

=================================手弱党不用看下面,直接用上面的安装即可===========================

一、结论:

软件环境 :

Ubuntu 18.04, ROCm 3.1, pytorch 1.4, tensorflow 2.1, tensorflow 1.15.2

硬件平台:

intel 6700  64G内存

Radeon VII ( 雷七 希仕版 2020.3.12拿下 ,3529元)

在以上环境下,pytorch, tf1/tf2 测试通过,达到预期性能。

二、折腾篇

准备rocm环境,这个没啥好说的,按amd的官方手册处理:

https://github.com/RadeonOpenCompute/ROCm

三、编译、测试及打包安装

3.1 编译之大坑

编译时会有一个错误,导致编译不下去,大法就是强制类型转换成float 即可。

源码目录下/caffe2/operators/hip/relu_op.h 中会提示出错,见图中,直接在  ?号后面的变量前加(float)即可

如 __floats2half2_rn(xx.x >0.0f ? (float)xx.x :0.0f, ....

四、开干

2安装编译期间用到的依赖库

sudo apt update

sudo apt install rock-dkms rocm-dev rocm-libs miopen-hip miopengemm hipsparse  rccl rocthrust hipcub roctracer-dev

sudo apt install git python-pip libopenblas-dev cmake libnuma-dev autoconf build-essential ca-certificates curl libgoogle-glog-dev libhiredis-dev libiomp-dev libleveldb-dev liblmdb-dev libopencv-dev libpthread-stubs0-dev libsnappy-dev sudo vim libprotobuf-dev protobuf-compiler

pip install enum34 numpy pyyaml setuptools typing cffi future hypothesis

3 下载源码:

cd ~

git clone https://github.com/pytorch/pytorch.git

or

git clone https://github.com/ROCmSoftwarePlatform/pytorch.git

or

目前建议获取 下面的库编译。所有的库都会遇到前面的坑。

git clone -b v1.4.0 https://github.com/pytorch/pytorch.git

cd pytorch

git submodule update --init --recursive

4设置必要的环境变量

sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/rocsparse/lib/cmake/rocsparse/rocsparse-config.cmake

sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/rocfft/lib/cmake/rocfft/rocfft-config.cmake

sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/miopen/lib/cmake/miopen/miopen-config.cmake

sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/rocblas/lib/cmake/rocblas/rocblas-config.cmake

sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/hipsparse/lib/cmake/hipsparse/hipsparse-config.cmake

sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/rccl/lib/cmake/rccl/rccl-config.cmake

然后在pytorch/cmake/External/rccl.cmake 里添加set(RCCL_DIR "/opt/rocm/rccl/lib/cmake/rccl")

安装 nccl

https://blog.csdn.net/lwplwf/article/details/82788818

5 Hipify CUDA的函数转化

cd pytorch
python tools/amd_build/build_amd.py

设置环境变量:

export PYTORCH_ROCM_ARCH=gfx906
export HCC_AMDGPU_TARGET=gfx906

编译:

USE_CUDA=OFF USE_ROCM=1 USE_LMDB=1 USE_OPENCV=1 MAX_JOBS=16 python setup.py install --user

测试:

PYTORCH_TEST_WITH_ROCM=1 python test/run_test.py --verbose

造轮子:(保存于/root下)

python setup.py bdist_wheel -d /root/

最后一步就是安装啦

pip install /path/to/your/wheel

AMD yes! 平民炬丹师的卡皇Radeon VII,老年博士生的丹房修建记录:Rocm 3.1+ pytorch 1.4+tensorflow 2+tensorflow 1.15.2 折腾记相关推荐

  1. AMD推出7nm高端显卡Radeon VII,直指英伟达RTX 2080

    显卡战争已经发展到了2019年,并且变得比任何人预想的都要激烈. CES 2019大会上,AMD发布了第一款消费级的 7nm GPU,取名:Radeon VII.据了解,这不是 AMD 的第一颗 7n ...

  2. AMD 推出了适用于 AI 和 HPC 的 Radeon Instinct MI60 和 MI50 加速卡

    原文标题:AMD unveils Radeon Instinct MI60 and MI50 accelerators for AI and HPC 原文作者:Stephanie Condon 译文出 ...

  3. 英特尔挖走AMD首席独显架构师,曾是现任CEO基辛格老部下

    晓查 发自 凹非寺 量子位 | 公众号 QbitAI 英特尔的Arc独立显卡很快就要发售了,而在这背后,原来还有个巨大的人事变动. "人才流失(的局面)已经得到改变,现在人才回来了.&quo ...

  4. 各路丹师 调参[炼丹]经验小结

    作者:hzwer 链接:https://www.zhihu.com/question/41631631/answer/859040970 来源:知乎 总结一下在旷视实习两年来的炼丹经验,我主要做了一些 ...

  5. 丹妮在使用计算机计算,美国工程院院士丹妮拉•鲁斯:每个人都有自己的机器人...

    丹妮拉·鲁斯 (Daniela Rus) | 美国工程院院士,一手创办两个人工智能实验室,是全球最大的校园实验室--麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的掌门人.鲁斯开创的可编 ...

  6. amd 虚拟化怎么开_性能碾压7nm安培 AMD CDNA计算卡16日发布:Radeon不再-AMD,CDNA,7nm,MI100,加速卡 ——快科技(驱动之家旗下媒体)-...

    AMD前几天推出了Radeon RX 6000系列显卡,旗舰RTX 6900 XT性能超过了RTX 3090,同时7999元的价格还便宜了4000块,高端游戏卡市场已经反攻了. 再往下,AMD也要在计 ...

  7. UR首发丹宁无性别系列,并发布潮流丹宁大片及米卡限量礼盒

    广州2021年8月12日 /美通社/ -- 时尚的边界在不断拓展,无性别着装已成为当下潮流.极具先锋精神的快奢时尚品牌URBAN REVIVO(以下简称UR)首发丹宁无性别系列,同时携手品牌心动大使I ...

  8. 华中科技大学计算机学院冯丹简历,华中科技大学计算机学院副院长冯丹教授来我校讲学的通知...

    课程题目:智能存储技术 主讲人:华中科技大学计算机学院副院长冯丹教授 时间:2007年7月20-21日 早上8:30-12:30    下午2:00-6:00 面向对象:本科生.研究生.青年教师 地点 ...

  9. 帖个 AMD Radeon VII 与1080ti的对比

    Radeon vii/ 1080ti 前面的表示Radeon VII的数据,后面的是1080ti的数据.说明一下:仅从resnet50来看,Radeon VII 性能相当于2080ti水平. Rade ...

  10. 深度长文:AMD的崛起、衰落与复兴

    来源:内容编译自「techspot」,谢谢. AMD是最早的大型微处理器设计者之一,近50年来一直是技术爱好者之间争论的话题.它的历史构成了一个激动人心的故事--充满了英雄式的成功,愚蠢的错误.在其他 ...

最新文章

  1. ECCV 2018 | OR-CNN行人检测:为‘遮挡’而生
  2. 使用BigQuery分析GitHub上的C#代码
  3. [蓝桥杯2015决赛]五星填数-枚举+数论
  4. 【Java】数组的注意事项
  5. 更新Docker中的Jenkins版本
  6. 附下载,《爱分析·中国BI商业智能行业报告》
  7. 计算机基础竞赛知识试题,计算机基础知识及基本技能操作竞赛试题
  8. 矩阵键盘mega16 c语言程序,矩阵键盘实现16个按键操作原理及应该方案
  9. 神器-数学公式识别工具-mathpix
  10. c语言实现http下载功能
  11. OSChina 周日乱弹 —— 会后空翻算个屁,咱这卖艺卖身吃鱼干
  12. ie不能加载flash html,IE11无法显示flash?IE11无法播放视频的解决方法
  13. vue自定义封装全局组件与使用
  14. 关于SQL Server中left join on and 用法的介绍
  15. 【每日面试】2021北京联通Java一面
  16. JavaScript 日期操作我不知道的事情
  17. 【数理统计】假设检验
  18. GitHub——Gist
  19. lua_pcall 函数详解
  20. 运营(朋友圈内容):卖货的朋友圈,该发哪些内容?

热门文章

  1. idea 设置类的注释模板
  2. linux修改挂载文件系统权限,Linux配置启动挂载:fstab文件详解
  3. 南方CASS工程应用--道路断面土方计算实例教程
  4. Java初级程序员面试总结(五)--Redis篇
  5. Tensorflow2.0 之 SSD 网络结构
  6. Clark变换和Park变换仿真验证
  7. php多用户记账系统,PHP多用户记账程序V2.3发布
  8. 飞鱼crm接口,有没获取用户信息的接口和获取客户跟进信息的接口?是不是需要申请接口,等客服反馈。文档接口都看完了,没发现需要的接口信息!
  9. 计算机组装与维目实训内容,计算机组装与维实训报告书(原版).doc
  10. Session的详解与使用