AMD yes! 平民炬丹师的卡皇Radeon VII,老年博士生的丹房修建记录:Rocm 3.1+ pytorch 1.4+tensorflow 2+tensorflow 1.15.2 折腾记
AMD GPU 数据训练 平台全折腾记 (持续更新中,欢迎收藏 转发点赞和投币)
======================================================================================
先说结论:如果你不想折腾,只需要安装好rocm 3.1后直接用我的wheel包安装即可,轮子已经造好,无需重来:
安装环境:
https://github.com/RadeonOpenCompute/ROCm
下载造好的轮子:
https://download.csdn.net/download/znsoft/12246098
下载后,直接
pip install xxxx.whl #(此处的xx.whl是你下载的文件名)
=================================手弱党不用看下面,直接用上面的安装即可===========================
一、结论:
软件环境 :
Ubuntu 18.04, ROCm 3.1, pytorch 1.4, tensorflow 2.1, tensorflow 1.15.2
硬件平台:
intel 6700 64G内存
Radeon VII ( 雷七 希仕版 2020.3.12拿下 ,3529元)
在以上环境下,pytorch, tf1/tf2 测试通过,达到预期性能。
二、折腾篇
准备rocm环境,这个没啥好说的,按amd的官方手册处理:
https://github.com/RadeonOpenCompute/ROCm
三、编译、测试及打包安装
3.1 编译之大坑
编译时会有一个错误,导致编译不下去,大法就是强制类型转换成float 即可。
源码目录下/caffe2/operators/hip/relu_op.h 中会提示出错,见图中,直接在 ?号后面的变量前加(float)即可
如 __floats2half2_rn(xx.x >0.0f ? (float)xx.x :0.0f, ....
四、开干
2安装编译期间用到的依赖库
sudo apt update
sudo apt install rock-dkms rocm-dev rocm-libs miopen-hip miopengemm hipsparse rccl rocthrust hipcub roctracer-dev
sudo apt install git python-pip libopenblas-dev cmake libnuma-dev autoconf build-essential ca-certificates curl libgoogle-glog-dev libhiredis-dev libiomp-dev libleveldb-dev liblmdb-dev libopencv-dev libpthread-stubs0-dev libsnappy-dev sudo vim libprotobuf-dev protobuf-compiler
pip install enum34 numpy pyyaml setuptools typing cffi future hypothesis
3 下载源码:
cd ~
git clone https://github.com/pytorch/pytorch.git
or
git clone https://github.com/ROCmSoftwarePlatform/pytorch.git
or
目前建议获取 下面的库编译。所有的库都会遇到前面的坑。
git clone -b v1.4.0 https://github.com/pytorch/pytorch.git
cd pytorch
git submodule update --init --recursive
4设置必要的环境变量
sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/rocsparse/lib/cmake/rocsparse/rocsparse-config.cmake
sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/rocfft/lib/cmake/rocfft/rocfft-config.cmake
sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/miopen/lib/cmake/miopen/miopen-config.cmake
sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/rocblas/lib/cmake/rocblas/rocblas-config.cmake
sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/hipsparse/lib/cmake/hipsparse/hipsparse-config.cmake
sed -i 's/find_dependency(hip)/find_dependency(HIP)/g' /opt/rocm/rccl/lib/cmake/rccl/rccl-config.cmake
然后在pytorch/cmake/External/rccl.cmake 里添加set(RCCL_DIR "/opt/rocm/rccl/lib/cmake/rccl")
安装 nccl
https://blog.csdn.net/lwplwf/article/details/82788818
5 Hipify CUDA的函数转化
cd pytorch
python tools/amd_build/build_amd.py
设置环境变量:
export PYTORCH_ROCM_ARCH=gfx906
export HCC_AMDGPU_TARGET=gfx906
编译:
USE_CUDA=OFF USE_ROCM=1 USE_LMDB=1 USE_OPENCV=1 MAX_JOBS=16 python setup.py install --user
测试:
PYTORCH_TEST_WITH_ROCM=1 python test/run_test.py --verbose
造轮子:(保存于/root下)
python setup.py bdist_wheel -d /root/
最后一步就是安装啦
pip install /path/to/your/wheel
AMD yes! 平民炬丹师的卡皇Radeon VII,老年博士生的丹房修建记录:Rocm 3.1+ pytorch 1.4+tensorflow 2+tensorflow 1.15.2 折腾记相关推荐
- AMD推出7nm高端显卡Radeon VII,直指英伟达RTX 2080
显卡战争已经发展到了2019年,并且变得比任何人预想的都要激烈. CES 2019大会上,AMD发布了第一款消费级的 7nm GPU,取名:Radeon VII.据了解,这不是 AMD 的第一颗 7n ...
- AMD 推出了适用于 AI 和 HPC 的 Radeon Instinct MI60 和 MI50 加速卡
原文标题:AMD unveils Radeon Instinct MI60 and MI50 accelerators for AI and HPC 原文作者:Stephanie Condon 译文出 ...
- 英特尔挖走AMD首席独显架构师,曾是现任CEO基辛格老部下
晓查 发自 凹非寺 量子位 | 公众号 QbitAI 英特尔的Arc独立显卡很快就要发售了,而在这背后,原来还有个巨大的人事变动. "人才流失(的局面)已经得到改变,现在人才回来了.&quo ...
- 各路丹师 调参[炼丹]经验小结
作者:hzwer 链接:https://www.zhihu.com/question/41631631/answer/859040970 来源:知乎 总结一下在旷视实习两年来的炼丹经验,我主要做了一些 ...
- 丹妮在使用计算机计算,美国工程院院士丹妮拉•鲁斯:每个人都有自己的机器人...
丹妮拉·鲁斯 (Daniela Rus) | 美国工程院院士,一手创办两个人工智能实验室,是全球最大的校园实验室--麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)的掌门人.鲁斯开创的可编 ...
- amd 虚拟化怎么开_性能碾压7nm安培 AMD CDNA计算卡16日发布:Radeon不再-AMD,CDNA,7nm,MI100,加速卡 ——快科技(驱动之家旗下媒体)-...
AMD前几天推出了Radeon RX 6000系列显卡,旗舰RTX 6900 XT性能超过了RTX 3090,同时7999元的价格还便宜了4000块,高端游戏卡市场已经反攻了. 再往下,AMD也要在计 ...
- UR首发丹宁无性别系列,并发布潮流丹宁大片及米卡限量礼盒
广州2021年8月12日 /美通社/ -- 时尚的边界在不断拓展,无性别着装已成为当下潮流.极具先锋精神的快奢时尚品牌URBAN REVIVO(以下简称UR)首发丹宁无性别系列,同时携手品牌心动大使I ...
- 华中科技大学计算机学院冯丹简历,华中科技大学计算机学院副院长冯丹教授来我校讲学的通知...
课程题目:智能存储技术 主讲人:华中科技大学计算机学院副院长冯丹教授 时间:2007年7月20-21日 早上8:30-12:30 下午2:00-6:00 面向对象:本科生.研究生.青年教师 地点 ...
- 帖个 AMD Radeon VII 与1080ti的对比
Radeon vii/ 1080ti 前面的表示Radeon VII的数据,后面的是1080ti的数据.说明一下:仅从resnet50来看,Radeon VII 性能相当于2080ti水平. Rade ...
- 深度长文:AMD的崛起、衰落与复兴
来源:内容编译自「techspot」,谢谢. AMD是最早的大型微处理器设计者之一,近50年来一直是技术爱好者之间争论的话题.它的历史构成了一个激动人心的故事--充满了英雄式的成功,愚蠢的错误.在其他 ...
最新文章
- ECCV 2018 | OR-CNN行人检测:为‘遮挡’而生
- 使用BigQuery分析GitHub上的C#代码
- [蓝桥杯2015决赛]五星填数-枚举+数论
- 【Java】数组的注意事项
- 更新Docker中的Jenkins版本
- 附下载,《爱分析·中国BI商业智能行业报告》
- 计算机基础竞赛知识试题,计算机基础知识及基本技能操作竞赛试题
- 矩阵键盘mega16 c语言程序,矩阵键盘实现16个按键操作原理及应该方案
- 神器-数学公式识别工具-mathpix
- c语言实现http下载功能
- OSChina 周日乱弹 —— 会后空翻算个屁,咱这卖艺卖身吃鱼干
- ie不能加载flash html,IE11无法显示flash?IE11无法播放视频的解决方法
- vue自定义封装全局组件与使用
- 关于SQL Server中left join on and 用法的介绍
- 【每日面试】2021北京联通Java一面
- JavaScript 日期操作我不知道的事情
- 【数理统计】假设检验
- GitHub——Gist
- lua_pcall 函数详解
- 运营(朋友圈内容):卖货的朋友圈,该发哪些内容?
热门文章
- idea 设置类的注释模板
- linux修改挂载文件系统权限,Linux配置启动挂载:fstab文件详解
- 南方CASS工程应用--道路断面土方计算实例教程
- Java初级程序员面试总结(五)--Redis篇
- Tensorflow2.0 之 SSD 网络结构
- Clark变换和Park变换仿真验证
- php多用户记账系统,PHP多用户记账程序V2.3发布
- 飞鱼crm接口,有没获取用户信息的接口和获取客户跟进信息的接口?是不是需要申请接口,等客服反馈。文档接口都看完了,没发现需要的接口信息!
- 计算机组装与维目实训内容,计算机组装与维实训报告书(原版).doc
- Session的详解与使用