ValueError: Error initializing torch.distributed using tcp:// rendezvous: port number missing
用 pytorch 训练 ABCNet 网络 【GitHub】,
OMP_NUM_THREADS=1
python tools/train_net.py \
--config-file configs/BAText/$confpath/attn_R_50.yaml \
--num-gpus 4 \
MODEL.WEIGHTS text_pretraining/attn_R_50/pretrain_attn_R_50.pth
报错
ValueError: Error initializing torch.distributed using tcp:// rendezvous: port number missing
原因:缺失端口
需要指定端口号或者 TCP 的 URL
当前系统有哪些端口可用呢?对于Linux 上 tcp 类型的端口,使用下面语句查看 【参考】
netstat -ntpl
训练时指定 TCP URL 即可
OMP_NUM_THREADS=1
python tools/train_net.py \
--config-file configs/BAText/$confpath/attn_R_50.yaml \
--num-gpus 4 \
--dist-url tcp://127.0.0.11:3806 \
MODEL.WEIGHTS text_pretraining/attn_R_50/pretrain_attn_R_50.pth
如果地址已被占用,就换个端口号,多试几个
RuntimeError: Address already in use
具体到其他训练语句,需要添加相应的命令行参数。
ValueError: Error initializing torch.distributed using tcp:// rendezvous: port number missing相关推荐
- 解决ValueError: Error initializing torch.distributed using env:// rendezvous:: environment variable 报错
在命令行运行程序时候可成功跑通,但在程序调试过程中出现如下错误: 源代码: 修改后: import torch.distributed as dist import os os.environ['MA ...
- 解决pytorch多进程ValueError: Error initializing torch.distributed using env:// rendezvou...报错
完整报错为:ValueError: Error initializing torch.distributed using env:// rendezvous: environment variable ...
- docker守护式安装tomcat(汤姆猫)报错:Error starting userland proxy: listen tcp 0.0.0.0:8888: bind: address alrea
用docker安装tomcat的时候,运行镜像,安装tomcat容器出现报错 [root@localhost ~]# docker run -it -p 8888:8080 tomcat docker ...
- Windows11 Android Srudio无法连接手机,报错Error initializing ADB: Unable to create Debug Bridge
1. 问题描述 手机确认开启了开发者模式后,Android Studio设备连接显示不出手机 Android Studio报错: Error initializing ADB: Unable to c ...
- Pytorch DDP分布式数据合并通信 torch.distributed.all_gather()
文章目录 1. 官网介绍 2. all_gather()不进行梯度传播,用于模型test或eval状态 3. all_gather()需要进行梯度传播,用于模型train状态 4. 相关链接 1. 官 ...
- log4j:WARN Error initializing output writer. log4j:WARN Unsupported encoding?
javaWeb在使用log.4j打印日志文件的时候提示: log4j:WARN Error initializing output writer. log4j:WARN Unsupported enc ...
- ValueError: Error when checking : expected input_1 to have 4 dimensions, but got array with shape (X
ValueError: Error when checking : expected input_1 to have 4 dimensions, but got array with shape (5 ...
- 成功解决torch\cuda\__init__.py“, line 208, in check_error raise Cuda Error(res) torch.cuda.Cuda Error: C
成功解决torch\cuda\__init__.py", line 208, in check_error raise Cuda Error(res) torch.cuda.Cuda Err ...
- Tomcat 初始化端点错误--Error initializing endpoint
在Myeclipise 中,Tomcat 报错,Error initializing endpoint 初始化端点错误,是在别处打开了Tomcat ,关掉就可以.在myeclipse 中重试
- SparkContext: Error initializing SparkContext解决方法
SparkContext: Error initializing SparkContext解决方法 Spark在配置高可用集群中,出现报错 ERROR SparkContext: Error init ...
最新文章
- 如何实现在H5里调起高德地图APP?(下)
- 【转载】WINCE物理和虚拟地址的问题
- 天天用 Spring,bean 实例化原理你懂吗?
- python综合学习一之多线程
- Effective Java之通过接口引用对象(五十二)
- Web:你知道我这十几年是怎么过来的吗?!
- 聊聊如何构建一支自驱团队(一)
- 蓝桥杯试题 算法提高 数组求和
- Centos6.4下zabbix的安装配置
- python int函数 向上取整_【Python小课】 print()函数
- [Asp.Net web api]基于自定义Filter的安全认证
- 22个HTML5和CSS3表单教程
- [计算机网络]七、IP地址规划和静态路由
- JavaScript调用pc和手机摄像头
- ViewPager及ViewPager
- 三线性插值(Trilinear Interpolation)详解
- oracle实验和代码
- 用什么语言开发的Matlab
- FL Studio居然可以用电脑键盘弹奏乐曲?一起来了解一下吧
- oracle常用 to_date()怎么转换带am pm的时间格式?
热门文章
- wifi连接一段时间才能上网_家里的WiFi老是突然断网,WiFi还是连着的,但是关WiFi又连不上去,必须重启路由器才能上网...
- 计算机维修.pdf,计算机维修(中).pdf
- 世界首富马斯克突然吟了一首中文诗
- pytest框架笔记(十三) : Pytest+Allure定制报告
- 关于Pytorch中detach
- app个人隐私合规检测内容
- mysql 共享_Mysql局域网共享
- 关于SQLite创建视图
- 盘点Google在2011年的重要收购
- 树莓派上3g模块的使用