当前位置: 首页 > news >正文

阿里建设网站东莞seo优化案例

阿里建设网站,东莞seo优化案例,wordpress前台登录地址,销售平台有哪些 电商CUDA流与异步 基于流的异步的内核启动和数据传输支持以下类型的粗粒度并发#xff1a; 1.重叠主机计算和设备计算#xff1b; 2.重叠主机计算和主机与设备间的数据传输#xff1b; 3.重叠主机与设备间的数据传输和设备计算#xff1b; 4.并发设备计算。 理解一个CUDA程序 1.重叠主机计算和设备计算 2.重叠主机计算和主机与设备间的数据传输 3.重叠主机与设备间的数据传输和设备计算 4.并发设备计算。 理解一个CUDA程序应该从设备和主机两个角度来考虑。从设备的角度来看操作都被发布到默认的流中并且按发布顺序取执行。设备不知道其他被执行的主机操作。从主机的角度来看每个数据传输都是同步的在等待它们完成时将强制空闲主机时间。内核启动是异步的所以无论内核是否完成主机的应用程序几乎都立即恢复执行。这种内核启动的默认异步行为使它可以直接重叠设备和主机计算。 如果要实现重叠主机计算和主机与设备间的数据传输那么就需要显式地创建CUDA流来保证这个传输任务不会阻塞主机而是在CUDA流中异步发布。当执行异步数据传输时使用cudaMemcpyAsync但必须使用固定(或非分页的)主机内存来保证异步执行时的数据一致性。可以使用cudaMallocHost函数或者cudaHostAlloc函数分配固定内存。如果使用pageable页面的话会带来性能下降。 如果要重叠主机与设备间的数据传输和设备计算那么要将这两个任务发布在两个不同的非空流中同时数据传输还是要满足上面的固定内存。如果要在使用空流那么其他流要使用cudaStreamCreateWithFlags来创建非阻塞流。 Pytorch可以通过将主机与设备间的数据传输和设备计算放在两个显式的torch.cuda.stream中完成重叠为了效率请保证主机与设备间的数据传输涉及的主机内存是pinned()的。
http://www.zqtcl.cn/news/327179/

相关文章:

  • 关于建设网站的需求wordpress不能发布文章
  • 如何一键建淘宝客网站中国建设银行金华分行网站
  • 给wordpress添加公告英语seo
  • 佛山市网站建设系统wap浏览器网页版
  • 关于小说网站的一些建设流程学做蛋糕有哪些网站
  • 益阳购物网站开发设计禹城网站制作
  • 教育网站开发文档全网营销推广案例
  • 最流行的网站开发框架wordpress阅读权限
  • 怎么做推广网站创立网站
  • 制作自己的网站需要什么材料网站计费系统怎么做
  • 网站和域名的区别昆山网站开发建设公司
  • 兼职网站推广如何做西安市商标局
  • 打开网站说建设中是什么问题莱芜金点子招小时工
  • 做网站的相关协议秦皇岛解封最新消息今天
  • 网站托管维护方案新闻媒体发稿平台
  • 网站扩展名四平网站建设怎么选
  • 网站制作价格与售后视频网站建设有什么意义
  • 网站建设+太原1核1g可以做几个网站
  • 电商设计网站有哪些内容西安百度推广外包
  • 深圳网站建设价格多少做废旧金属的网站
  • wordpress 文档超级优化空间
  • 湖北seo网站推广官方网站怎么制作
  • 随州网站seo诊断wordpress 只显示一个主题
  • 建站登录可信网站认证 费用
  • 互站网站源码用jsp做网站一般会用到什么
  • 个人免费设计网站fomo3d 网站怎么做
  • 菏泽做网站公司公关公司经营范围
  • 钓鱼网站营销型网站建设实战
  • 可以下载电影的网站怎么做做网站公司西安
  • 自己做签名网站网店美工培训教程