大家好,我是Joyce,和小瑶一样,也是搞算法的,不过还在学术界摸鱼,偶尔能抓到一条顶会锦鲤,大多数时候,都是一些小鱼小虾,目前已被boss放养,每周组会都是隐形人...

转眼,暑假余额告警,低年级小盆友兴高采烈,等着食堂开门,高年级大盆友一脸平静,透露着打工人的自觉,没看完的代码,没复现的论文,在导师的一句问候下,突然进入冲刺阶段,ddl才是最强生产力,这句话没毛病。

文献看了多少篇了?毕设开题写好了吗?AAAI论文改完了吗?比赛进入复赛了吗......因为导师的关爱,开学前后这段时间,想必都是充实有意义的呢(成年人的微笑

前几天,突然紧张的疫情,又让何时回校成了未知,无法使用学校资源,或者学校GPU不够用,着实困扰着一批童鞋,为了让大家顺利赶上ddl,今天安利一个本人也在用的云平台,希望能解决大家的燃眉之急。

就个人踩坑经历来说, 源云  还是比较容易上手的,如果懒得看文档,又想迅速开启云端训练,让程序快快跑起来,请务必服用本篇教程,3分钟即刻见效文末有粉丝福利,锁住它~

顺便搬了一个官方教程视频,配合观看效果更佳(热知识:本视频关注+点赞+评论后,可以领取20元羊毛券????

首先,注册登录gpushare.com,直奔新人礼包准没错,目前恒源云的 人福利有100元礼券 ,代金券可以直接下单,如果跑4.5元/小时的3090,应该有近二十个小时吧。

要注意的是,有一些特价机器,比如1.8元/小时的2080ti 、6元/小时的V100,暂不支持代金券,需要先充值再租用,充值没有限制,100元以上就有返券,充值金额也是永久的。

计费模式的话,短租可以按量付费,按小时结算,长租可以包周/月,分别享受8.5/7折的优惠力度,学生还有专属折扣,以及  100元学生券 

正式创建实例前,选择适合的GPU非常重要,如果模型耗显存,可以考虑16G的5000、24G的3090、32G的V100,如果耗内存,也有单卡分配了64G CPU的机型,具体参考下方的价格表(自己做的,有点简陋请忍住~

确定了GPU的类型、数量后,就可以搭建训练环境了,官方镜像里,主流框架TensorFlow、PyTorch、MXNet、PaddlePaddle等都预装了,可以直接勾选需要的版本。

如果没有合适的,进入实例后,也能自行安装软件包库,创建自定义镜像,实现长期保存环境,后续无论何时,通过自定义镜像,创建新的实例即可。

几秒完成实例创建后,就可以连接登录实例了,平台支持Xshell、PuTTY、MobaXterm之类的ssh终端登录,JupyterLab、PyCharm、VSCode等编译工具,文档也有详细的使用说明。

我一般用页面自带的JupyterLab,无论PC端、移动端,点击链接直接打开,轻松运行终端和代码,交互友好,一用就会,稍微提醒一句,关闭浏览器并不能停止训练,确认终端关闭了才行噢。

成功登录实例后,接下来的训练,都是在云端进行的,训练所需的代码和数据集,也需要提前传输上去,因此,本地数据传至实例内,这一步骤非常关键。

平台数据传输的方式,多种多样,Sftp、Filezilla等都支持,但数据太大的话,难免意外中断,而官方推荐的Oss工具,要靠谱得多,命令简单,速度又快,一分钟理论值3G左右,体验很香。

至于传输的流程,省钱又快的方式是,通过oss命令工具,先把数据从本地上传到个人数据空间,云盘容量限免50G,训练时,再从个人数据空间下载到实例里。

关于实例存放数据的目录,主要有两个,一个是NAS存储,限免50G,多实例共享的,而且长期保存,另一个机器本地盘目录,不限制数据大小,速度快,不过有一定的保存期限,注意备份训练结果就好。

另外,平台内置了几百个公共数据集,各种主流平台、竞赛平台的数据,每天都在更新,使用时,简单拷贝即可,省去了不少上传时间,若有需要帮助下载的,可以在社区发帖,平台反馈速度挺快的。

数据传输之后,把代码也复制过来,就可以跑起来了,训练过程中,注意关注显卡使用情况,nvidia-smi 或者 py3smi 命令查看,争取提高利用率,让训练达到最佳效果。

在这里,分享一些  人使用的tips  :

■ 平台团队功能,如果符合条件,一定要申请,真的很方便,之前我和组里成员,跑一个小课题,共享了实例和镜像,协作效率大大加成。

■  平台有小程序,可以对实例进行操作,不用一直守着电脑,随时随地就能关机、重启等,公众号也有一些提醒服务,关注领取了代金券后,建议不要取关。

■  恒源云应该是活动最多的GPU云平台了,自注册以来,本人参加过3090包周/月抽奖、分享笔记有奖励、200元竞赛赞助、视频号互动送代金券等等,如果希望一直有券白piao,可以在技术社区贴个邀请链接,每成功邀请一位注册,就有20元代金券。

■  看到这里,你应该基本了解使用流程了,但平台的宝藏文档,也不容错过值得一看,Conda、Visdom、Spyder、MMCV等都有教程,总能发现惊喜哟。

▼ 扫码直达大型福利会场~

不知不觉码了这么多字...虽然本篇主要介绍GPU云平台的使用方法,但是比起训练工具,训练过程中的思考,如何设计优化模型,如何提高验证效果,并发现总结创新点,能真正解决一些实际问题,这才是深度学习科研的本质和追求吧。

临近开学,与其陷入内卷焦虑,不如先从复现一篇论文开始,打开github,登录 源云gpushare.com ,开始你的深度学习训练吧,一切从这一刻,就前进了一小步。

# 文末彩蛋 #

小可爱萌,转发本篇推送至朋友圈/社群(200人以上),保留2小时后截图发给客服,即可领取恒源云代金券(能直接下单跑训练噢),本号专属限量福利,先到先得!

本号粉丝转发可获得20元代金券,若完成恒源云学生认证,奖励升级为50元代金券8.31前截止领取哈~

扫码联系客服领取福利

▼ 点击“阅读原文”,注册领取 100元新人礼券

【安利向】入坑半年的GPU云平台,三分钟训练起飞!xiu~相关推荐

  1. 入坑GPU云平台【个人感受】

    作为一名初级深度学习者(炼丹师),用GPU跑模型必不可少,但是作为学生,而且刚好实验室里的GPU不够用怎么办? 当然,第一反应想到的肯定时Colab或者Kaggle,但是无奈数据上传的速度太慢(想当年 ...

  2. 主流深度学习GPU云平台租赁价格比较表

    此表为本人接触过的主流GPU云平台租赁价格对比,以供广大深度学习同学和爱好者选型和对比之用. 此表中的"原价"基本没有什么用处,各大平台的"现价"即为按小时租赁 ...

  3. 使用极算GPU云的三个理由!?入门深度学习,还在自己配电脑?

    当前人工智能的蓬勃发展已经是我们有目共睹的事实,人工智能在各个领域的应用也正全面的展开,然而,其应用开发过程中所需要用到的庞大运算资源,却早已超出了当今个人电脑的能力范围.应用极算云的GPU算力,可以 ...

  4. 【随笔】入坑半年后对嵌入式的一点认识

    我们自动化系是一个就业非常轻松的专业,可以让我们从事的行业非常丰富: 电子/电气工程师.电气工程师/技术员.自动化工程师.电气工程师.自动控制工程师/技术员.研发工程师.电子工程师/技术员.软件工程师 ...

  5. 使用阿里云服务器三分钟搭建网站

    目录 一.购买服务器 二. 配置云服务器 三.下载XShell编辑器 四.使用XShell与服务器建立连接 五.安装宝塔 六.配置宝塔 七.配置多个站点 一.购买服务器 注意一定要购买CentOS内核 ...

  6. ESP8266 快速入门(一):通过机智云平台 20 分钟实现开关与 adc 接口的电压测量功能(包含 ESP8266 固件烧写教程)

    ESP8266 入门:使用机智云快速实现开关与 adc 接口的电压测量(包含固件烧写教程) 0. 需要准备的材料 硬件部分: 软件部分: 1.机智云的账号注册与 SOC 方案创建 2.对下载的机智云代 ...

  7. 慎入坑:腾讯云轻量2核2G3M服务器30元不建议选择

    腾讯云轻量应用服务器2核2G3M带宽30元3个月不建议买,自带3M带宽,下载速度可达384KB/秒,100%CPU性能,系统盘为40GB SSD盘,200GB月流量,折合每天6.6G流量,地域节点可选 ...

  8. 塔王之王获取服务器信息0%,V0入坑半年小记

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼 春节入的坑,此间几次冲(充)动,最终还是保留了V0处子身,目前80级,魔王南蛮能保证前十,马上能无双貂蝉和夏侯惇.要当个v0不容易呀.纯攻略的话,精华帖营 ...

  9. 一些GPU云平台使用体验

    20221114更新 之前提到会试试AutoDL,发现AutoDL的实例数据能保存30天,之前说过恒源云只会保存24小时,否则就直接清空了,这是比较麻烦的一点,有时用完就需要自己保存下来,或者在24小 ...

最新文章

  1. android density 和款高度,Android Density(密度)
  2. python资料txt下载-python全教程下载-哪里有Python教程txt下载
  3. C# .NET Web API 如何自訂 ModelBinder
  4. 广西2021高考成绩位次查询,2020年广西高考一分一段表及高考位次成绩排名查询(理科+文科)...
  5. Maven打包时去掉项目版本号
  6. 地震预警,生死十秒,我们能做些什么?
  7. 拓端tecdat|Mac系统R语言升级后无法加载包报错 package or namespace load failed in dyn.load(file, DLLpath = DLLpath,
  8. linux内核安全模块,对Linux内核的修改 - Linux 安全模块(LSM)简介_Linux安全_Linux公社-Linux系统门户网站...
  9. Jenkins 下载慢解决方法
  10. 关于嵌入式的学习和职业发展
  11. 24小时“凶宅试睡直播”去“凶”,阿里拍卖为卖凶宅有点拼
  12. java+mysql 基于jsp820志愿者管理系统sql
  13. EXTREME 设备操作手册
  14. 什么是CDN,为什么用CDN,如何用CDN
  15. android 手机 平板同屏,酷乐视Q6投影仪Android手机/平板同屏方法汇总
  16. Android任务栈的理解
  17. Java—将数据生成pdf表格
  18. 王者荣耀微信一区的服务器没了,王者荣耀微信区不出现保存回放 | 手游网游页游攻略大全...
  19. 【BZOJ2328】 [HNOI2011]赛车游戏
  20. 可由线性表示且表达式唯一_线性代数期末模拟题一8p

热门文章

  1. 【原】push过快的错误 (Pushing the same view controller instance more than once is not supported)...
  2. c++现在有一棵合法的二叉树,树的节点都是用数字表示,现在给定这棵树上所有的父子关系,求这棵树的高度
  3. 使用Adobe Audition生成基本音频
  4. oppo专用计算机,OPPO手机助手
  5. 2017年12月计算机一级c,2017年12月计算机二级C语言考试操作题冲刺卷(2)
  6. 爬虫实战学习笔记_6 网络请求request模块:基本请求方式+设置请求头+获取cookies+模拟登陆+会话请求+验证请求+上传文件+超时异常
  7. 【Pytorch神经网络理论篇】 09 神经网络模块中的损失函数
  8. uni-ui介绍uni-api
  9. 一、数据预处理——数据归一化 数据标准化
  10. Chapter7-1_Overview of NLP Tasks