当前位置: 首页 > news >正文

自己做视频网站的流程wordpress显示一个分类列表名称

自己做视频网站的流程,wordpress显示一个分类列表名称,成都有实力的seo团队,建网站的工具有哪些大纲 sourceMapSplittingMapping ReduceKeyingReducing 完整代码结构参考资料 在《0基础学习PyFlink——模拟Hadoop流程》一文中#xff0c;我们看到Hadoop在处理大数据时的MapReduce过程。 本节介绍的DataStream API#xff0c;则使用了类似的结构。 source 为了方便我们看到Hadoop在处理大数据时的MapReduce过程。 本节介绍的DataStream API则使用了类似的结构。 source 为了方便我们依然使用from_collection从内存中读取数据。 和使用Table API类似我们给from_collection传递的第二参数是每行数据类型。本例中是String即“A C B”的类型。 from pyflink.common import Types from pyflink.datastream import StreamExecutionEnvironment, RuntimeExecutionModeword_count_data [A C B,A E B,E C D]def word_count():env StreamExecutionEnvironment.get_execution_environment()env.set_runtime_mode(RuntimeExecutionMode.BATCH)# write all the data to one fileenv.set_parallelism(1)source_type_info Types.STRING()# define the sourcesource env.from_collection(word_count_data, source_type_info)可以使用下面指令输出source内容 source.print()A C B A E B E C DMap 和上图一样Map由Splitting和Mapping组成。它们分别将数据切割成做小运算单元和生成map结构。 Splitting def split(line):for s in line.split():yield ssplitted source.flat_map(split) 上述splitted的结构输出是 A C B A E B E C DMapping Mapping的操作就是将之前的数组结构转换成map结构 mappedsplitted.map(lambda i: (i, 1), Types.TUPLE([Types.STRING(), Types.INT()]))mapped的输出值如下可以看到它还是按我们输入数据的顺序排列的。 (A,1) (C,1) (B,1) (A,1) (E,1) (B,1) (E,1) (C,1) (D,1)Reduce Keying 这一步对应于上图中的ShufflingSorting它会将相同key的数据进行分区以供后面reducing操作使用。 keyedmapped.key_by(lambda i: i[0]) 可以看到keyed数据已经经过排序和聚合了。 (A,1) (A,1) (B,1) (B,1) (C,1) (C,1) (D,1)Reducing reducedkeyed.reduce(lambda i, j: (i[0], i[1] j[1]))reduce的方法有如下注释 Applies a reduce transformation on the grouped data stream grouped on by the given key position. The ReduceFunction will receive input values based on the key value. Only input values with the same key will go to the same reducer. 特别是最后一句非常有用“Only input values with the same key will go to the same reducer”只有相同Key的输入数据才会进入相同的Reducer中。这句话意味着上述Keyed的数据会被分组执行于是就不会出现计算错乱。 (A,2) (B,2) (C,2) (D,1) (E,2)完整代码 from pyflink.common import Types from pyflink.datastream import StreamExecutionEnvironment, RuntimeExecutionModeword_count_data [A C B,A E B,E C D]def word_count():env StreamExecutionEnvironment.get_execution_environment()env.set_runtime_mode(RuntimeExecutionMode.BATCH)# write all the data to one fileenv.set_parallelism(1)source_type_info Types.STRING()# define the sourcesource env.from_collection(word_count_data, source_type_info)# source.print()def split(line):for s in line.split():yield ssplitted source.flat_map(split) # splitted.print()mappedsplitted.map(lambda i: (i, 1), Types.TUPLE([Types.STRING(), Types.INT()]))# mapped.print()keyedmapped.key_by(lambda i: i[0]) # keyed.print()reducedkeyed.reduce(lambda i, j: (i[0], i[1] j[1]))# define the sinkreduced.print()# submit for executionenv.execute()if __name__ __main__:word_count()结构 参考资料 https://nightlies.apache.org/flink/flink-docs-master/zh/docs/dev/python/datastream_tutorial/
http://www.zqtcl.cn/news/19475/

相关文章:

  • 福建省住房城乡建设部网站成都网站建设 培训班
  • 与网络公司洽谈做网站需要注意什么网站备注查询
  • 做地方门户网站如何推广自己的网址
  • 哪些网站收录排名好如何制作电脑公司网站
  • 泗阳县建设局网站wordpress php mysql
  • 阿里云oss做网站备份网站开发硬件工程师待遇
  • 免费学设计的网站视频网站设计模板
  • php 上传到网站学校网站在建设方面的的优势
  • wordpress+ie9深圳网站seo优化公司
  • 做阿里巴巴网站店铺装修费用定西市建设厅官方网站
  • 学生作业做网站需要县城网站怎么做
  • 桓台响应式网站建设加拿大28怎么做网站代理
  • 个人域名备案网站名称安徽网站优化价格咨询
  • 网站建设运营岗位职责浙江备案需要开启网站吗
  • 做调查赚钱的网站又哪些大家都在哪些网站做宣传
  • 单页面应用的网站做网页链接
  • 2015年做那个网站致富怎么在wordpress建站
  • 无锡网站建设选众鼎做网站的用什么电脑好
  • 太原网站优化培训做网站的硬件成本
  • 做网站的公司推荐哪个平台做推广效果好
  • 成都网站建设方案服务寻找客户的渠道和方法
  • 高端网站设计新鸿儒温州seo公司
  • 网站的收费系统怎么做买域名后 怎么做网站
  • 玛迪做网站做网站源代码
  • 凤岗东莞网站建设河北网站建设电话
  • 网站挂马怎么办车载cms是什么意思
  • 肯德基网站开发网站建设询价
  • 学校网站怎么做优化正规的高端网站制作公司
  • 免费个人网站哪个好旅行社网站建设方案
  • 南通物流网站建设发生太多重定位wordpress