【安利向】入坑半年的GPU云平台,三分钟训练起飞!xiu~
大家好,我是Joyce,和小瑶一样,也是搞算法的,不过还在学术界摸鱼,偶尔能抓到一条顶会锦鲤,大多数时候,都是一些小鱼小虾,目前已被boss放养,每周组会都是隐形人...
转眼,暑假余额告警,低年级小盆友兴高采烈,等着食堂开门,高年级大盆友一脸平静,透露着打工人的自觉,没看完的代码,没复现的论文,在导师的一句问候下,突然进入冲刺阶段,ddl才是最强生产力,这句话没毛病。
文献看了多少篇了?毕设开题写好了吗?AAAI论文改完了吗?比赛进入复赛了吗......因为导师的关爱,开学前后这段时间,想必都是充实有意义的呢(成年人的微笑
前几天,突然紧张的疫情,又让何时回校成了未知,无法使用学校资源,或者学校GPU不够用,着实困扰着一批童鞋,为了让大家顺利赶上ddl,今天安利一个本人也在用的云平台,希望能解决大家的燃眉之急。
就个人踩坑经历来说, 恒源云 还是比较容易上手的,如果懒得看文档,又想迅速开启云端训练,让程序快快跑起来,请务必服用本篇教程,3分钟即刻见效(文末有粉丝福利,锁住它~
顺便搬了一个官方教程视频,配合观看效果更佳(热知识:本视频关注+点赞+评论后,可以领取20元羊毛券????
首先,注册登录gpushare.com,直奔新人礼包准没错,目前恒源云的 新人福利有100元礼券 ,代金券可以直接下单,如果跑4.5元/小时的3090,应该有近二十个小时吧。
要注意的是,有一些特价机器,比如1.8元/小时的2080ti 、6元/小时的V100,暂不支持代金券,需要先充值再租用,充值没有限制,100元以上就有返券,充值金额也是永久的。
计费模式的话,短租可以按量付费,按小时结算,长租可以包周/月,分别享受8.5/7折的优惠力度,学生还有专属折扣,以及 100元学生券 。
正式创建实例前,选择适合的GPU非常重要,如果模型耗显存,可以考虑16G的5000、24G的3090、32G的V100,如果耗内存,也有单卡分配了64G CPU的机型,具体参考下方的价格表(自己做的,有点简陋请忍住~
确定了GPU的类型、数量后,就可以搭建训练环境了,官方镜像里,主流框架TensorFlow、PyTorch、MXNet、PaddlePaddle等都预装了,可以直接勾选需要的版本。
如果没有合适的,进入实例后,也能自行安装软件包库,创建自定义镜像,实现长期保存环境,后续无论何时,通过自定义镜像,创建新的实例即可。
几秒完成实例创建后,就可以连接登录实例了,平台支持Xshell、PuTTY、MobaXterm之类的ssh终端登录,JupyterLab、PyCharm、VSCode等编译工具,文档也有详细的使用说明。
我一般用页面自带的JupyterLab,无论PC端、移动端,点击链接直接打开,轻松运行终端和代码,交互友好,一用就会,稍微提醒一句,关闭浏览器并不能停止训练,确认终端关闭了才行噢。
成功登录实例后,接下来的训练,都是在云端进行的,训练所需的代码和数据集,也需要提前传输上去,因此,本地数据传至实例内,这一步骤非常关键。
平台数据传输的方式,多种多样,Sftp、Filezilla等都支持,但数据太大的话,难免意外中断,而官方推荐的Oss工具,要靠谱得多,命令简单,速度又快,一分钟理论值3G左右,体验很香。
至于传输的流程,省钱又快的方式是,通过oss命令工具,先把数据从本地上传到个人数据空间,云盘容量限免50G,训练时,再从个人数据空间下载到实例里。
关于实例存放数据的目录,主要有两个,一个是NAS存储,限免50G,多实例共享的,而且长期保存,另一个机器本地盘目录,不限制数据大小,速度快,不过有一定的保存期限,注意备份训练结果就好。
另外,平台内置了几百个公共数据集,各种主流平台、竞赛平台的数据,每天都在更新,使用时,简单拷贝即可,省去了不少上传时间,若有需要帮助下载的,可以在社区发帖,平台反馈速度挺快的。
数据传输之后,把代码也复制过来,就可以跑起来了,训练过程中,注意关注显卡使用情况,nvidia-smi 或者 py3smi 命令查看,争取提高利用率,让训练达到最佳效果。
在这里,分享一些 个人使用的tips :
■ 平台团队功能,如果符合条件,一定要申请,真的很方便,之前我和组里成员,跑一个小课题,共享了实例和镜像,协作效率大大加成。
■ 平台有小程序,可以对实例进行操作,不用一直守着电脑,随时随地就能关机、重启等,公众号也有一些提醒服务,关注领取了代金券后,建议不要取关。
■ 恒源云应该是活动最多的GPU云平台了,自注册以来,本人参加过3090包周/月抽奖、分享笔记有奖励、200元竞赛赞助、视频号互动送代金券等等,如果希望一直有券白piao,可以在技术社区贴个邀请链接,每成功邀请一位注册,就有20元代金券。
■ 看到这里,你应该基本了解使用流程了,但平台的宝藏文档,也不容错过值得一看,Conda、Visdom、Spyder、MMCV等都有教程,总能发现惊喜哟。
▼ 扫码直达大型福利会场~
不知不觉码了这么多字...虽然本篇主要介绍GPU云平台的使用方法,但是比起训练工具,训练过程中的思考,如何设计优化模型,如何提高验证效果,并发现总结创新点,能真正解决一些实际问题,这才是深度学习科研的本质和追求吧。
临近开学,与其陷入内卷焦虑,不如先从复现一篇论文开始,打开github,登录 恒源云gpushare.com ,开始你的深度学习训练吧,一切从这一刻,就前进了一小步。
# 文末彩蛋 #
小可爱萌,转发本篇推送至朋友圈/社群(200人以上),保留2小时后截图发给客服,即可领取恒源云代金券(能直接下单跑训练噢),本号专属限量福利,先到先得!
本号粉丝转发可获得20元代金券,若完成恒源云学生认证,奖励升级为50元代金券,8.31前截止领取哈~
扫码联系客服领取福利
▼ 点击“阅读原文”,注册领取 100元新人礼券
【安利向】入坑半年的GPU云平台,三分钟训练起飞!xiu~相关推荐
- 入坑GPU云平台【个人感受】
作为一名初级深度学习者(炼丹师),用GPU跑模型必不可少,但是作为学生,而且刚好实验室里的GPU不够用怎么办? 当然,第一反应想到的肯定时Colab或者Kaggle,但是无奈数据上传的速度太慢(想当年 ...
- 主流深度学习GPU云平台租赁价格比较表
此表为本人接触过的主流GPU云平台租赁价格对比,以供广大深度学习同学和爱好者选型和对比之用. 此表中的"原价"基本没有什么用处,各大平台的"现价"即为按小时租赁 ...
- 使用极算GPU云的三个理由!?入门深度学习,还在自己配电脑?
当前人工智能的蓬勃发展已经是我们有目共睹的事实,人工智能在各个领域的应用也正全面的展开,然而,其应用开发过程中所需要用到的庞大运算资源,却早已超出了当今个人电脑的能力范围.应用极算云的GPU算力,可以 ...
- 【随笔】入坑半年后对嵌入式的一点认识
我们自动化系是一个就业非常轻松的专业,可以让我们从事的行业非常丰富: 电子/电气工程师.电气工程师/技术员.自动化工程师.电气工程师.自动控制工程师/技术员.研发工程师.电子工程师/技术员.软件工程师 ...
- 使用阿里云服务器三分钟搭建网站
目录 一.购买服务器 二. 配置云服务器 三.下载XShell编辑器 四.使用XShell与服务器建立连接 五.安装宝塔 六.配置宝塔 七.配置多个站点 一.购买服务器 注意一定要购买CentOS内核 ...
- ESP8266 快速入门(一):通过机智云平台 20 分钟实现开关与 adc 接口的电压测量功能(包含 ESP8266 固件烧写教程)
ESP8266 入门:使用机智云快速实现开关与 adc 接口的电压测量(包含固件烧写教程) 0. 需要准备的材料 硬件部分: 软件部分: 1.机智云的账号注册与 SOC 方案创建 2.对下载的机智云代 ...
- 慎入坑:腾讯云轻量2核2G3M服务器30元不建议选择
腾讯云轻量应用服务器2核2G3M带宽30元3个月不建议买,自带3M带宽,下载速度可达384KB/秒,100%CPU性能,系统盘为40GB SSD盘,200GB月流量,折合每天6.6G流量,地域节点可选 ...
- 塔王之王获取服务器信息0%,V0入坑半年小记
该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 春节入的坑,此间几次冲(充)动,最终还是保留了V0处子身,目前80级,魔王南蛮能保证前十,马上能无双貂蝉和夏侯惇.要当个v0不容易呀.纯攻略的话,精华帖营 ...
- 一些GPU云平台使用体验
20221114更新 之前提到会试试AutoDL,发现AutoDL的实例数据能保存30天,之前说过恒源云只会保存24小时,否则就直接清空了,这是比较麻烦的一点,有时用完就需要自己保存下来,或者在24小 ...
最新文章
- android density 和款高度,Android Density(密度)
- python资料txt下载-python全教程下载-哪里有Python教程txt下载
- C# .NET Web API 如何自訂 ModelBinder
- 广西2021高考成绩位次查询,2020年广西高考一分一段表及高考位次成绩排名查询(理科+文科)...
- Maven打包时去掉项目版本号
- 地震预警,生死十秒,我们能做些什么?
- 拓端tecdat|Mac系统R语言升级后无法加载包报错 package or namespace load failed in dyn.load(file, DLLpath = DLLpath,
- linux内核安全模块,对Linux内核的修改 - Linux 安全模块(LSM)简介_Linux安全_Linux公社-Linux系统门户网站...
- Jenkins 下载慢解决方法
- 关于嵌入式的学习和职业发展
- 24小时“凶宅试睡直播”去“凶”,阿里拍卖为卖凶宅有点拼
- java+mysql 基于jsp820志愿者管理系统sql
- EXTREME 设备操作手册
- 什么是CDN,为什么用CDN,如何用CDN
- android 手机 平板同屏,酷乐视Q6投影仪Android手机/平板同屏方法汇总
- Android任务栈的理解
- Java—将数据生成pdf表格
- 王者荣耀微信一区的服务器没了,王者荣耀微信区不出现保存回放 | 手游网游页游攻略大全...
- 【BZOJ2328】 [HNOI2011]赛车游戏
- 可由线性表示且表达式唯一_线性代数期末模拟题一8p
热门文章
- 【原】push过快的错误 (Pushing the same view controller instance more than once is not supported)...
- c++现在有一棵合法的二叉树,树的节点都是用数字表示,现在给定这棵树上所有的父子关系,求这棵树的高度
- 使用Adobe Audition生成基本音频
- oppo专用计算机,OPPO手机助手
- 2017年12月计算机一级c,2017年12月计算机二级C语言考试操作题冲刺卷(2)
- 爬虫实战学习笔记_6 网络请求request模块:基本请求方式+设置请求头+获取cookies+模拟登陆+会话请求+验证请求+上传文件+超时异常
- 【Pytorch神经网络理论篇】 09 神经网络模块中的损失函数
- uni-ui介绍uni-api
- 一、数据预处理——数据归一化 数据标准化
- Chapter7-1_Overview of NLP Tasks