当前位置: 首页 > news >正文

网站开发工作协议书范本如何让网站自适应屏幕

网站开发工作协议书范本,如何让网站自适应屏幕,公积金app下载,集团网站开发多少钱0. 参数分配 稠密参数 → MPI 集合通信#xff08;All-Reduce / Broadcast / Reduce-Scatter#xff09;。稀疏参数 → brpc Parameter Server 异步推拉。 完全去掉 NCCL/GPU 相关部分。1. 整体拓扑 ┌----------------┐ ┌----------------┐ │ Worker-0 │…0. 参数分配 稠密参数 → MPI 集合通信All-Reduce / Broadcast / Reduce-Scatter。稀疏参数 → brpc Parameter Server 异步推拉。 完全去掉 NCCL/GPU 相关部分。1. 整体拓扑 ┌----------------┐ ┌----------------┐ │ Worker-0 │ │ PS-0 │ │ Worker-1 │◄------► │ PS-1 │ │ ... │ brpc │ ... │ │ Worker-N │ │ PS-M │ └----------------┘ └----------------┘▲│MPITCP/InfiniBand▼ MPI_COMM_WORLD稠密参数稠密梯度通过 MPI 标准集合操作MPI_Allreduce、MPI_Bcast 等实现同步。稀疏参数Worker 与 PS 之间用 brpc protobuf 通信异步推拉。2. 关键模块C cpu_dist/ ├── common/ │ ├── tensor.h // 纯 CPU 张量FP32/FP64 │ └── mpi_context.h // MPI_Init / Finalize 封装 ├── dense/ │ ├── mpi_allreduce.h // MPI All-Reduce 封装 │ └── optimizer.h // 本地 SGD / AdamW ├── sparse/ │ ├── ps_server.h/cc // brpc Parameter Server │ ├── ps_client.h/cc // brpc Client │ └── table.h // 稀疏表unordered_map 锁 ├── proto/ │ └── message.proto // protobuf 消息 └── launcher.cc // 主进程入口3. MPI 通信层稠密参数 3.1 封装 MPI All-Reduce // dense/mpi_allreduce.h class MPIAllReduce {public:explicit MPIAllReduce(MPI_Comm comm) : comm_(comm) {}template typename Tvoid AllReduceSum(std::vectorT buf) {std::vectorT recv(buf.size());MPI_Allreduce(buf.data(), recv.data(), buf.size(),GetMPITypeT(), MPI_SUM, comm_);buf.swap(recv);}private:MPI_Comm comm_; };支持 float / double / int。支持 In-place All-ReduceMPI_IN_PLACE。4. brpc Parameter Server稀疏参数 与之前设计一致仅通信后端为 brpc proto 定义不变PullRequest, PushRequest。PS 端 实现 brpc::Service用 brpc::Server 启动。Worker 端 用 brpc::Channel 连接 PS支持 轮询/一致性哈希 负载均衡。5. 主进程结构launcher.cc int main(int argc, char* argv[]) {MPI_Init(argc, argv);int rank, size;MPI_Comm_rank(MPI_COMM_WORLD, rank);MPI_Comm_size(MPI_COMM_WORLD, size);bool is_ps (rank FLAGS_worker_num);if (!is_ps) {// WorkerMPIAllReduce ar(MPI_COMM_WORLD);PSClient ps(FLAGS_ps_list);WorkerLoop(ar, ps);} else {// Parameter ServerPSServer server;server.Start(FLAGS_ps_port);}MPI_Finalize(); }6. Worker 主循环 void WorkerLoop(MPIAllReduce ar, PSClient ps) {Model model;DataLoader dl(FLAGS_data_path);for (int step 0; step FLAGS_max_step; step) {auto batch dl.Next();std::vectorfloat dense_grad;std::vectorint64_t sparse_keys;std::vectorfloat sparse_grad;// 前向 反向model.Backward(batch, dense_grad, sparse_keys, sparse_grad);// 1. 稠密梯度 MPI All-Reducear.AllReduceSum(dense_grad);// 2. 稀疏梯度异步 Pushps.PushAsync(0, sparse_keys, sparse_grad);// 3. 稀疏参数 Pullstd::vectorfloat sparse_emb;ps.Pull(0, sparse_keys, sparse_emb);// 4. 参数更新model.Update(dense_grad, sparse_emb);} }7. 部署与运行 7.1 启动脚本OpenMPI # 4 worker 2 ps mpirun -np 6 \-x LD_LIBRARY_PATH \./launcher \--worker_num 4 \--ps_list 0.0.0.0:8000,0.0.0.0:8001worker_num 前 rank 0~3 为 Worker后 rank 4~5 为 PS。MPI 负责稠密通信brpc 负责稀疏通信两者互不干扰。8. 性能调优项建议MPI使用 OpenMPI 4.x 或 Intel MPICPU 亲和、NUMA 优化。brpc配置 轮询 批处理64~256 key/RPC开启 8bit 量化压缩。线程MPI 与 brpc 线程分离brpc 用 bthread避免与 MPI 线程冲突。 至此“CPU MPI稠密 brpc Parameter Server稀疏” 的完整框架已就绪。
http://www.zqtcl.cn/news/666601/

相关文章:

  • 一个网站 两个数据库沈阳市住房和城乡建设厅网站
  • 重庆建站网站流程及费用制作网页界面工具
  • 设计师家园官网wordpress 4.9 优化
  • 主机屋空间安装织梦后台程序后怎么弄成淘宝客网站襄阳网站制作
  • 怎么建设分销模式手机网站宜昌做网站的公司
  • 网上商城网站设计网页设计作业欣赏
  • 育才网站建设网站访问慢原因
  • 网站建设方案 备案品牌网站推广软件
  • 桓台县建设局网站前端开发入门培训
  • 前端怎么在猪八戒网站接单做烟台网站开发技术
  • 济南烨铭网站建设做英文网站2014
  • 哪个餐饮店微网站做的有特色3d动画制作收费标准
  • h5旅游网站开发wordpress的站点地址如何配置
  • 网站正在维护中 模板招远网站建设
  • 福田欧曼银河报价seo文章是什么
  • 古云网站建设模具培训网站建设
  • 帮助企业做网站的销售卫浴洁具公司网站模板
  • 解释seo网站推广网站域名和空间费用
  • 深圳市珠宝网站建设手机网站框架
  • 晋城推广型网站开发dw做网站模板
  • 万网一个ip建立多个网站网页设计注册页面代码
  • 网站建设6000元地方门户网站有哪些
  • 十大SEO网站外链建设误区排版设计教程入门初学者
  • 网站基本维护网站设计软件下载
  • 网站开发的需求文档大型网站外链是怎么建设的
  • 网站建设实训心得与建议网站建设一般需要多少费用
  • 国内怎么打开WordPress网站wordpress制作api文件路径
  • 义乌网站开发公司wordpress段子模板
  • 国外有没有专门做靶材的网站做网站用哪个电脑
  • 郑州网站制作郑州网站制作上海网站建设免费推荐