用 pytorch 训练 ABCNet 网络 【GitHub】,

OMP_NUM_THREADS=1
python tools/train_net.py \
--config-file configs/BAText/$confpath/attn_R_50.yaml \
--num-gpus 4 \
MODEL.WEIGHTS text_pretraining/attn_R_50/pretrain_attn_R_50.pth

报错

ValueError: Error initializing torch.distributed using tcp:// rendezvous: port number missing

原因:缺失端口
需要指定端口号或者 TCP 的 URL

当前系统有哪些端口可用呢?对于Linux 上 tcp 类型的端口,使用下面语句查看 【参考】

netstat -ntpl

训练时指定 TCP URL 即可

OMP_NUM_THREADS=1
python tools/train_net.py \
--config-file configs/BAText/$confpath/attn_R_50.yaml \
--num-gpus 4 \
--dist-url tcp://127.0.0.11:3806 \
MODEL.WEIGHTS text_pretraining/attn_R_50/pretrain_attn_R_50.pth

如果地址已被占用,就换个端口号,多试几个
RuntimeError: Address already in use

具体到其他训练语句,需要添加相应的命令行参数。

ValueError: Error initializing torch.distributed using tcp:// rendezvous: port number missing相关推荐

  1. 解决ValueError: Error initializing torch.distributed using env:// rendezvous:: environment variable 报错

    在命令行运行程序时候可成功跑通,但在程序调试过程中出现如下错误: 源代码: 修改后: import torch.distributed as dist import os os.environ['MA ...

  2. 解决pytorch多进程ValueError: Error initializing torch.distributed using env:// rendezvou...报错

    完整报错为:ValueError: Error initializing torch.distributed using env:// rendezvous: environment variable ...

  3. docker守护式安装tomcat(汤姆猫)报错:Error starting userland proxy: listen tcp 0.0.0.0:8888: bind: address alrea

    用docker安装tomcat的时候,运行镜像,安装tomcat容器出现报错 [root@localhost ~]# docker run -it -p 8888:8080 tomcat docker ...

  4. Windows11 Android Srudio无法连接手机,报错Error initializing ADB: Unable to create Debug Bridge

    1. 问题描述 手机确认开启了开发者模式后,Android Studio设备连接显示不出手机 Android Studio报错: Error initializing ADB: Unable to c ...

  5. Pytorch DDP分布式数据合并通信 torch.distributed.all_gather()

    文章目录 1. 官网介绍 2. all_gather()不进行梯度传播,用于模型test或eval状态 3. all_gather()需要进行梯度传播,用于模型train状态 4. 相关链接 1. 官 ...

  6. log4j:WARN Error initializing output writer. log4j:WARN Unsupported encoding?

    javaWeb在使用log.4j打印日志文件的时候提示: log4j:WARN Error initializing output writer. log4j:WARN Unsupported enc ...

  7. ValueError: Error when checking : expected input_1 to have 4 dimensions, but got array with shape (X

    ValueError: Error when checking : expected input_1 to have 4 dimensions, but got array with shape (5 ...

  8. 成功解决torch\cuda\__init__.py“, line 208, in check_error raise Cuda Error(res) torch.cuda.Cuda Error: C

    成功解决torch\cuda\__init__.py", line 208, in check_error raise Cuda Error(res) torch.cuda.Cuda Err ...

  9. Tomcat 初始化端点错误--Error initializing endpoint

    在Myeclipise 中,Tomcat 报错,Error initializing endpoint 初始化端点错误,是在别处打开了Tomcat ,关掉就可以.在myeclipse 中重试

  10. SparkContext: Error initializing SparkContext解决方法

    SparkContext: Error initializing SparkContext解决方法 Spark在配置高可用集群中,出现报错 ERROR SparkContext: Error init ...

最新文章

  1. 如何实现在H5里调起高德地图APP?(下)
  2. 【转载】WINCE物理和虚拟地址的问题
  3. 天天用 Spring,bean 实例化原理你懂吗?
  4. python综合学习一之多线程
  5. Effective Java之通过接口引用对象(五十二)
  6. Web:你知道我这十几年是怎么过来的吗?!
  7. 聊聊如何构建一支自驱团队(一)
  8. 蓝桥杯试题 算法提高 数组求和
  9. Centos6.4下zabbix的安装配置
  10. python int函数 向上取整_【Python小课】 print()函数
  11. [Asp.Net web api]基于自定义Filter的安全认证
  12. 22个HTML5和CSS3表单教程
  13. [计算机网络]七、IP地址规划和静态路由
  14. JavaScript调用pc和手机摄像头
  15. ViewPager及ViewPager
  16. 三线性插值(Trilinear Interpolation)详解
  17. oracle实验和代码
  18. 用什么语言开发的Matlab
  19. FL Studio居然可以用电脑键盘弹奏乐曲?一起来了解一下吧
  20. oracle常用 to_date()怎么转换带am pm的时间格式?

热门文章

  1. wifi连接一段时间才能上网_家里的WiFi老是突然断网,WiFi还是连着的,但是关WiFi又连不上去,必须重启路由器才能上网...
  2. 计算机维修.pdf,计算机维修(中).pdf
  3. 世界首富马斯克突然吟了一首中文诗
  4. pytest框架笔记(十三) : Pytest+Allure定制报告
  5. 关于Pytorch中detach
  6. app个人隐私合规检测内容
  7. mysql 共享_Mysql局域网共享
  8. 关于SQLite创建视图
  9. 盘点Google在2011年的重要收购
  10. 树莓派上3g模块的使用