当前位置: 首页 > news >正文

域名 做网站和邮箱阳江网络问政平台回复查询

域名 做网站和邮箱,阳江网络问政平台回复查询,网站开发的进度控制计划表,网站排名优化+o+mSpark Stage 什么是Stage Spark中的一个Stage只不过是物理执行计划其中的一个步骤#xff0c;它是物理执行计划的一个执行单元。一个Job会被拆分为多组Task#xff0c;每组任务被称为一个Stage#xff0c;可以简单理解为MapReduce里面的Map Stage#xff0c; Reduce Stag…Spark Stage 什么是Stage Spark中的一个Stage只不过是物理执行计划其中的一个步骤它是物理执行计划的一个执行单元。一个Job会被拆分为多组Task每组任务被称为一个Stage可以简单理解为MapReduce里面的Map Stage Reduce Stage。 Spark的Job中Stage之间会有依赖关系。可以利用这些依赖关系把Job所有stage串连起来形成一个有向无环图。在单个job内是根据shuffle算子来拆分stage的shuffle之前是一个stageshuffle之后是另一个stage如果一个job中有多个shuffle那么每个shuffle之前都是一个stage。一个job被提交运行之后将会触发stage及其父stage的执行。 窄依赖 指父RDD的每一个分区最多被一个子RDD的分区所用表现为一个父RDD的分区对应于一个子RDD的分区和两个父RDD的分区对应于一个子RDD 的分区。图中map/filter和union属于第一类对输入进行协同划分co-partitioned的join属于第二类。 宽依赖 指子RDD的分区依赖于父RDD的所有分区这是因为shuffle类操作如图中的groupByKey和未经协同划分的join。 Stage: 一个Job会被拆分为多组Task每组任务被称为一个Stage就像Map Stage Reduce Stage。Stage的划分简单的说是以ShuffleMapStage 和ResultStage 这两种类型来划分。 在Spark中有两类task一类是shuffleMapTask一类是resultTask第一类task的输出是shuffle所需数据第二类task的输出是resultstage的划分也以此为依据shuffle之前的所有变换是一个stageshuffle之后的操作是另一个stage。 比如 rdd.parallize(1 to 10).foreach(println) 这个操作没有shuffle直接就输出了那么只有它的task是resultTaskstage也只有一个 如果是rdd.map(x (x, 1)).reduceByKey(_ _).foreach(println), 这个job因为有reduce所以有一个shuffle过程那么reduceByKey之前的是一个stage执行shuffleMapTask输出shuffle所需的数据reduceByKey到最后是一个stage直接就输出结果了。 如果job中有多次shuffle那么每个shuffle之前都是一个stage。 Spark会根据RDD之间的依赖关系将DAG图划分为不同的阶段对于窄依赖由于partition依赖关系的确定性partition的转换处理就可以在同一个线程里完成窄依赖就被spark划分到同一个stage中而对于宽依赖只能等父RDD shuffle处理完成后下一个stage才能开始接下来的计算。之所以称之为ShuffleMapTask是因为它需要将自己的计算结果通过shuffle到下一个stage中。 Spark Stage的分类 在Spark中Stage可以分成两种类型。分别是 ShuffleMapStage 这种Stage是以Shuffle为输出边界其输入边界可以是从外部获取数据也可以是另一个ShuffleMapStage的输出其输出可以是另一个Stage的开始ShuffleMapStage的最后Task就是ShuffleMapTask在一个Job里可能有该类型的Stage也可以能没有该类型Stage ResultStage 这种Stage是直接输出结果其输入边界可以是从外部获取数据也可以是另一个ShuffleMapStage的输出ResultStage的最后Task就是ResultTask在一个Job里必定有该类型Stage Stage类的定义 Stage类是一个抽象类类的定义如下 abstract class Stage { def findMissingPartitions(): Seq[Int]}
http://www.zqtcl.cn/news/718944/

相关文章:

  • 帝国+只做网站地图厦门app定制公司
  • 网站运营推广主要做什么的高匿代理ip
  • 网站建设与维护采访稿wordpress 图床加速
  • 建设国际互联网网站完整网站开发教程
  • 一个购物交易网站怎么做网站管理功能图
  • 做有后台的网站如何提交网站地图
  • 网站建设税率多少潍坊市住房和城乡建设局网站
  • 网站图片怎么做白色背景青岛公司做网站的价格
  • 网站seo工具wordpress放视频没画面
  • 自己做个网站要多少钱o2o商城网站系统开发
  • 百度网站优化哪家好长沙抖音推广代运营公司
  • 做网站的软件worddede 后门暴网站
  • 极简风格 网站上市公司seo是什么意思
  • 商城手机网站设计网架公司十大排名
  • 在建设主题网站时邯郸房产信息网恋家网
  • 保山做网站建设做网站zwnet
  • 南阳做网站推广自助个人免费网站
  • 企业做网站怎么做高校档案室网站建设
  • 辽宁省建设厅网站升级期货交易软件定制开发
  • 网站建设公司工资设置mufen wordpress
  • 资阳网站网站建设月夜直播免费完整版
  • 自己的网站打不开了网站建设维护成本
  • 最便宜做网站c2c网站建站的标准
  • 家里电脑做网站服务器下载中国移动商旅100最新版本
  • 深圳建站公司开发费用做网站网页的工作怎么样
  • 网站工程师平均工资网站开发合同里的坑
  • 南通公司建站模板品牌网站建设小蝌蚪
  • 网站备案号 有效期微信小程序开发视频完整教程
  • 给公司做网站需要什么信息html制作百度登录页面
  • 济南市建设执业资格注册中心网站小程序源码模板下载