做k线图网站,网站设计就业要求,在线呼叫网页版,网站永久镜像怎么做问题描述#xff1a;Pytorch用多张GPU训练时#xff0c;会报地址已被占用的错误。其实是端口号冲突了。 因此解决方法要么kill原来的进程#xff0c;要么修改端口号。
在代码里重新配置
torch.distributed.init_process_group()dist_init_method tcp://{master_ip}:{mast…问题描述Pytorch用多张GPU训练时会报地址已被占用的错误。其实是端口号冲突了。 因此解决方法要么kill原来的进程要么修改端口号。
在代码里重新配置
torch.distributed.init_process_group()dist_init_method tcp://{master_ip}:{master_port}.format(master_ip127.0.0.1, master_port10000)dist_world_size opt.world_size #total number of distributed processes.torch.distributed.init_process_group(backendnccl, init_methoddist_init_method, world_sizedist_world_size, rank[0,1]) 每次只要重新修改master_port