运行容器

在每个机器上运行容器

docker run -it -v /data:/root/data/ --network host --name multi_learner hanjl/cuda:framework

修改 host 主机地址

在每台机器上进入容器,修改容器的 ip 地址

vim /etc/hosts

显示

127.0.0.1
127.0.1.1

比如在 4.7 服务器上,请把第二行改为主机地址:

***.**.4.7

修改 ssh 端口

在每台机器上进入容器,把 ssh 端口修改为 2233

sed -i 's/\(^Port\)/#\1/' /etc/ssh/sshd_config
echo Port 2233 >> /etc/ssh/sshd_config
service ssh restart

在每台机器上互相 ssh,保证各个机器之间可以无密码无确认直接连通

worker id 配置

在 master 上修改配置文件

vim  ~/.ssh/config

修改为

Host by08HostName ***.***.4.8Port 2233Host by07HostName ***.***.4.7Port 2233

下载文件

在每台机器上下载框架代码,保证框架的路径全部相同。

运行

只需在 master 上执行

horovodrun -np 4 -H by07:2,by08:2 python learner.py --config examples/ppo/walker2d_learner_multi.yaml

然后到每个 worker 上运行

python actor.py --config examples/ppo/walker2d_actor.yaml

清除显存

目前 learner 不会自动退出导致 horovodrun 一直占用显存。需要在每个 worker 上手动释放显存。

首先查看占用显存的进程

fuser -v /dev/nvidia0

然后执行 kill,注意有一个很明显是系统进程,不需要 kill

[framework] multi learner相关推荐

  1. OGRE 所有版本(从0.1到1.7) (SDK 及 源码 及 扩展库) 下载地址

    OGRE 所有版本 (SDK 及 源码) 下载地址 http://zh.sourceforge.jp/projects/sfnet_ogre/releases/ 或者SVN地址 https://svn ...

  2. robotframework安装包_Robot Framework零基础入门教程

    原作者:逆之時間軸 原出处:CSDN 原文链接:https://blog.csdn.net/yydoraemon/article/details/13847781 版权声明:本文为博主原创文章,转载请 ...

  3. Metasploit Framework(MSF)的使用

    目录 Metasploit Metasploit的安装和升级 MSF中加载自定义的exploit模块 漏洞利用(exploit) 攻击载荷(payload) Meterpreter MS17_010( ...

  4. 手把手引进门之 ASP.NET Core Entity Framework Core(官方教程翻译版 版本3.2.5)

    以下是手把手引进门教程,基于 ASP.NET Core, Entity Framework Core ,ABP 框架 创建Web 应用, PS: 自带自动的测试模块哦. 样例下载 (上 github  ...

  5. 代码字体mono_如何构建代码存储库:Multi,Mono或Organic?

    代码字体mono by Chetan Sharma 由Chetan Sharma 如何构建代码存储库:Multi,Mono或Organic? (How to Structure Code Reposi ...

  6. .net Compact Framework 程序设计起步(智能设备的程序设计)

    什么是智能设备?PDA,SmartPhone等MS一系列与手持设备相关的产品都可以叫做智能设备. 可以有很多方法开发与设计PDA等智能设备的程序,这里只讨论.net Compact Framework ...

  7. robotframework安装_Robot Framework零基础入门教程

    1.介绍 1.1.介绍Robot Robot Framework是一个基于关键字驱动的自动化测试框架.通过该框架,测试人员可使用python封装关键字,并在非代码环境下使用关键字构建可被执行的测试用例 ...

  8. XSSF - Cross Site Scripting Framework

    2019独角兽企业重金招聘Python工程师标准>>> 跨站脚本框架 (XSSF) 是一个设计用来快速发现网站存在XSS漏洞的一个安全工具集. 该项目是为了验证网站存在的XSS漏洞及 ...

  9. 【无标题】Metasploit Framework(更新中······)

    MSF 默认集成于Kali Linux 之中 使用postgresql数据库存储数据 – 早期版本需要先启动数据库再启动msf MSF架构 MSF架构 Rex – 基本功能库,用于完成日常基本任务,无 ...

最新文章

  1. RTSP协议-中文定义
  2. amazon mws api 获取所有产品_致跨境电商新卖家 - 如何确定一个产品的市场容量?...
  3. 安装SQL SERVER 2008时出现了SQL SERVER 2005 Express Tool Installed 的错误
  4. Centos7 Docker 目录挂载_入门试炼06
  5. linux无缝升级的版本,最近一周发布新版本的Linux发行版 - 2020-01-03
  6. script和scriptreplay命令实现终端录制和回放。
  7. LeetCode-27 移除元素
  8. 一行代码让 Python 的运行速度提高100倍
  9. IDEA 常用配置以及快捷
  10. 读书笔记《高性能网站建设指南:前端工程师技能精髓》
  11. 实现ls -l功能 和目录实现
  12. AutoCAD.net(一):更改AutoCAD窗口的标题和图标
  13. ueditor 禁止编辑_织梦ueditor百度编辑器div style被过滤解决办法
  14. oninput onpropertychange
  15. Outlook 2016 配置QQ邮箱
  16. 读书笔记-《Head First 软件开发》
  17. 算法——中国剩余定理
  18. 计算机文档里的圆圈,电脑怎么打出圆圈符号?利用word或者输入法打出圆圈的方法介绍...
  19. OpenCV-文字绘制cv::putText
  20. vue路由懒加载写法

热门文章

  1. 单位阶跃信号是周期信号吗_直流散热风扇的信号你知道如何控制吗?
  2. oracle+buffer+busy+wait,Oracle数据库buffer busy wait等待事件 (2)
  3. java 去掉 t_[Java教程]LocalDateTime去掉T
  4. textfield获取其中内容_用户认知视角下的产品信息获取体验度量体系研究
  5. PyTorch 学习笔记(三):transforms的二十二个方法
  6. 中文信息处理—已分词标注语料的抽取词表和文本还原
  7. Pycharm(windows)设置中文菜单
  8. 杨辉三角形(C语言)(使用一维数组的版本)
  9. 目标检测——SSD的学习笔记
  10. sqli注入前置知识