项目 内容
这个作业属于哪个课程 人工智能实战2019
这个作业的要求在哪里 OpenPAI与NNI的使用
我在本作业的目标 学习OpenPAI的使用

学习OpenPAI的使用

OpenPAI简介

​ OpenPAI用于管理计算资源,并对机器学习任务进行了优化。通过Docker技术,硬件计算资源与软件相分离。这样,用户能轻松的进行分布式计算,在不同的深度学习框架间切换,也能在完全一致的环境中重复运行作业。适用场景如下:

  • 在团队间共享强大的AI计算资源(例如,GPU,FPGA集群)。
  • 在组织内共享或重用AI资产(如模型,数据,运行环境等)。
  • 构建易于IT运维的AI计算平台。
  • 在同一个环境中完成模型训练过程。

OpenPAI使用体验

​ 在安装扩展OpenPAI VS Code后,可直接在VS Code中使用OpenPAI。

  1. Use shortcut key Ctrl+Shift+P to open command palette.

  2. input and look for PAI:Add PAI Cluster as below.

  3. press Enter,and it takes to input the host of OpenPAI.

  4. 之后,会弹出的集群配置文件,填写"username"和”password”并保存配置。

  5. 添加文件,文件夹需要包含以下项:

    • _init__.py: 用于调用filetrans.py
    • filetrans.py:实现hdfs和docker container之间的数据传输操作。主要实现数据download和upload
    • run_samples.py:实现整个训练过程,包括下载数据,训练模型,上传结果模型
    • train.sh: 训练模型的脚本命令
  6. 添加任务:

    • 双击Create Job Config…创建配置文件。本例中直接copy了实例中的JSON文件,修改了jobname(便于后面辨认出自己提交的任务)
     {"jobName": "jyh_test_couplet_001","image": "tobeyqin/pai.build.cu80:my","codeDir": "$PAI_DEFAULT_FS_URI/$PAI_USER_NAME/$PAI_JOB_NAME","dataDir": "$PAI_DEFAULT_FS_URI/Data/$PAI_JOB_NAME","outputDir": "$PAI_DEFAULT_FS_URI/Output/$PAI_JOB_NAME","taskRoles": [{"name": "test_001","taskNumber": 1,"cpuNumber": 2,"gpuNumber": 1,"memoryMB": 8192,"command": "pip3 --quiet install future && cd $PAI_JOB_NAME && chmod +x train.sh && python3 run_samples.py"}]}
  7. 提交任务:

    在配置文件中,单机鼠标右键,选择Submit Job to PAI Cluster,提交任务。

  8. 查看状态:

    提交任务后,PAI Client会在右下角提示Open Web Portal,点击可打开OpenPAI的web
    portal,查看任务的运行状态。


  1. 完成训练:

    当任务状态变成successed时,即完成训练过程。并且将训练模型结果传回hdfs。在程序中,我们编写的默认传回路径为output/目录下,以JobName命名的文件夹中。

  1. 下载模型:

    用户可以在PAI CLUSTER EXPLORER下的集群中,双击Open HDFS,打开HDFS explorer。在/Beihang_Couplet/output/目录下,右键单击JobName命名的文件夹,选择Download,下载模型文件。

OpenPAI使用心得

​ OpenPAI配合VScode客户端使用,操作非常简单便捷,Web UI界面也很简洁明了。在本例中用了两个半小时就完成了对联项目的数据训练,让我体验到了云部署的强大算力的便捷高效。

在使用中用到的问题

​ 在进入HDFS EXPlORER后想返回到PAI CLUSTER EXPLORER时要输入命令“EXPLORER: focus on PAI cluster explorer view",感觉比较麻烦(不知道是不是我操作有问题)

转载于:https://www.cnblogs.com/JiaoYh98/p/10855228.html

人工智能实战2019第七次作业(OpenPAI) 16721088 焦宇恒相关推荐

  1. 人工智能实战2019第七次作业(黄金点) 16721088 焦宇恒

    项目 内容 这个作业属于哪个课程 人工智能实战2019 这个作业的要求在哪里 黄金点游戏 我在本次作业的目标 体验黄金点游戏,构思AI策略 黄金点游戏 游戏介绍 ​ N个同学(N通常大于10),每人写 ...

  2. 人工智能实战2019 第五次作业 焦宇恒 16721088

    标题 内容 这个作业属于哪个课程 人工智能实战2019 这个作业的要求在哪里 逻辑与非门 这个作业在哪个具体方面帮助我实现目标 神经网络二分类法 逻辑与门训练样本 X1 X2 Y 0 0 0 0 1 ...

  3. 人工智能实战2019第六次作业 焦宇恒

    标题 内容 这个作业属于哪个课程 人工智能实战2019 这个作业的要求在哪里 练习调整超参 这个作业在哪个具体方面帮助我实现目标 体验超参对学习结果的影响 实验结果 本次实验,假设各个变量相互独立使用 ...

  4. 人工智能实战2019 第0次作业 焦宇恒

    项目 内容 这个作业属于哪个课程 buaa人工智能实战2019 这个作业的要求在哪里 作业 我在这个课程的目标是 理解人工智能基本算法,学会配置实验环境 这个作业在哪个具体方面帮助我实现目标 理清思路 ...

  5. 人工智能实战2019第八次作业 16721088 焦宇恒

    标题 内容 这个作业属于哪个课程 人工智能实战2019 这个作业的要求在哪里 Mnist手写数字识别项目拓展 这个作业在哪个具体方面帮助我实现目标 深入理解手写识别原理 思考:如何设计该计算器应用以识 ...

  6. 人工智能实战2019第六次作业——尹正超

    作业六 项目 内容 这个作业属于哪个课程 人工智能实战 这个作业的要求在哪里 第六次作业 我在这个课程的目标是 学习算法,积累项目经验,锻炼coding能力 这个作业在哪个方面帮助我实现目标 了解三重 ...

  7. 人工智能实战_第七次作业_杨佳宁(2)

    黄金点游戏 转载于:https://www.cnblogs.com/yjn200/p/10858316.html

  8. 人工智能实战2019 第二次作业 焦宇恒

    标题 内容 这个作业属于哪个课程 人工智能实战2019 这个作业的要求在哪里 作业要求 这个作业关于什么 双变量的反向传播 参考文献 参考文献 实验代码 w = 3 b = 4 delta_z = 1 ...

  9. 人工智能实战_第三次作业_陈泽寅

    第三次作业:使用minibatch的方式进行梯度下降 一.简要概述 项目 内容 课程 人工智能实战2019 作业要求 作业要求 我在这个课程的目标是 了解人工智能理论,提升coding能力 这个作业在 ...

最新文章

  1. 坐标架内转换到坐标架外的公式
  2. 商业周刊评出08年增长最快的美国科技公司
  3. Java_数组练习答案_Java数组练习题带答案.doc
  4. 《XXX重大技术需求征集系统》的可用性和可修改性战术分析
  5. 文末福利 | 学习如何构建行业知识图谱(以医疗行业为例)
  6. matlab定义和调用函数m,Matlab学习-自定义函数与调用
  7. HT for Web中3D流动效果的实现与应用
  8. java新职篇:面向对象之抽象
  9. Python web 框架:web.py
  10. java.io.serializable_java.io.Serializable浅析 | 学步园
  11. Atitit 软件与开发的未来趋势 attilax总结 1.1. Sdx软件重构世界 软件定义未来 1 1.2. 《软件和信息技术服务业发展规划(2016-2020年)》( 2 1.3. Iot物联
  12. matlab灰色关联分析,灰色关联度分析(为什么不显示图像)大佬们帮我看看
  13. Layui+阿里ICON,扩展图标|ICONFONT+
  14. XMind 2022 for Mac(思维导图软件)V12.0.3中文免费版
  15. 室内外地图切换(室内基于ibeacons三点定位)
  16. 广西艺术学院2012年本科招生专业考试通知
  17. VBA - 粘贴为数值型
  18. 阿里架构师:双十一「大促」,多亏了 Node.js
  19. C++11新特性 R字符串
  20. python严格使用缩进来体现代码的逻辑从属关系_Python 全国考级二级

热门文章

  1. html页面导出pdf截断问题,html2canvas 与 jspdf 相结合生成 pdf 内容被截断的终极解决方案...
  2. 内网信息收集——工作组/域信息收集
  3. stream流、数学类、String类的常用方法、date、密码等
  4. 看了 Google 大神 Jeff Dean 的传说,我拜服了~
  5. 【好文转载】产品经理做产品设计的九步法
  6. 运动控制器多工位位置比较输出在转盘式视觉筛选设备中的应用
  7. 今天看了you tu be 上面的舞蹈
  8. stm32 cubemx 新建项目一直报错的问题终于解决了
  9. PHP 开发社区微信服务号实战图解
  10. django arya插件对数据库操作使用,reverse发娘解析url的使用