当前位置: 首页 > news >正文

上海闵行建设局官方网站ae模板

上海闵行建设局官方网站,ae模板,模拟登录 wordpress,深圳市南山网站建设文章目录 产生背景编程模型统计词频案例 实现机制容错机制Master的容错机制Worker的容错机制 产生背景 MapReduce是一种分布式数据处理模型和编程技术#xff0c;由Google开发#xff0c;旨在简化大规模数据集的处理。产生MapReduce的背景#xff1a; 数据量的急剧增长由Google开发旨在简化大规模数据集的处理。产生MapReduce的背景 数据量的急剧增长随着互联网的快速发展产生的数据量急剧增加传统的数据处理方法已经无法有效处理如此庞大的数据集。需要一种能够在数以千计的计算机上并行处理大数据的方法。分布式计算需求增加为了处理大规模数据集需要将数据分布在多个计算节点上进行并行处理。这就要求有一种可靠的方法来协调这些节点之间的工作处理节点间的通信以及处理节点故障时的数据恢复。简化并行计算虽然分布式和并行计算技术已经存在但它们往往需要开发者具有高度的专业知识。Google希望开发一种简单的编程模型让开发者不需要深入了解分布式系统的底层细节也能开发出高效的分布式应用。Google的实际需求Google需要处理网页索引、搜索结果排序等涉及大量数据的任务。这些任务不仅数据量大而且需要频繁更新。MapReduce的设计就是为了优化这些任务的处理效率提高资源利用率和处理速度。 MapReduce封装并行处理、容错处理、本地化计算、负载均衡的细节还提供简单而强大的接口通过该接口可以把大尺度的计算自动地并发和分布执行并具备较好的通用性。 编程模型 MapReduce模型包含两个关键步骤Map映射和Reduce归约。在Map阶段输入数据被分成独立的小块然后并行处理。在Reduce阶段处理结果被汇总为最终结果。这种模型大大简化分布式计算的复杂性使得程序员可以用较少的代码行数处理大量数据。 MapReduce的成功推动了大数据和分布式计算技术的发展Hadoop就是受其启发创建的一个开源框架它允许使用简单的编程模型来处理大规模数据集。 Map函数——对一部分原始数据进行指定的操作。每个Map操作都针对不同的原始数据因此Map与Map之间是互相独立的这使得它们可以充分并行化Reduce操作——对每个Map所产生的一部分中间结果进行合并操作每个Reduce所处理的Map中间结果是互不交叉的所有Reduce产生的最终结果经过简单连接就形成了完整的结果集。 Map: (in_key, in_value) - {(keyj, valuej) | j 1…k} Reduce: (key, [value1,…,valuem]) - (key, final_value) Map输入参数in_key和in_value它指明了Map需要处理的原始数据Map输出结果一组key,value对这是经过Map操作后所产生的中间结果Reduce输入参数key,[value1,…,valuem]Reduce工作对这些对应相同key的value值进行归并处理Reduce输出结果key, final_value所有Reduce的结果并在一起就是最终结果 统计词频案例 Mapreduce首先把数据切片切成若干块然后每一块启动一个map函数进行处理map函数接受的 键是文件名值是文件的内容 键是文件名值是文件的内容 键是文件名值是文件的内容键值对文件名, 文件内容map逐个遍历单词每遇到一个单词w就产生一个中间键值对w, 1这表示又找到了一个单词w每一个map所产生的中间键值对要再进行分区即将这些中间键值对再切成若干块每一块交给一个reduce函数进行处理MapReduce将键相同都是单词w的键值对传给reduce函数这样reduce函数接受的键就是单词w值是一串1个数等于键为w的键值对的个数然后将这些“1”累加就得到单词w的出现次数。 实现机制 MapReduce的实现机制过程 首先MapReduce将输入文件切分成多个块并分配给不同的Map任务进行处理。每个Map任务读取并处理与其相关的输入块生成中间结果并将这些结果缓存到内存中。定期将缓存的中间结果写入本地硬盘并根据分区函数将数据分成多个区。当Master通知执行Reduce的Worker时它调用远程过程从Map Worker的本地硬盘上读取缓存的中间数据。Reduce Worker根据每个唯一的中间键遍历排序后的中间数据并将键和相关的中间结果值集合传递给用户定义的Reduce函数。当所有的Map任务和Reduce任务都完成时Master激活用户程序最终将所有Reduce任务的结果连接起来形成完整的结果集。 Created with Raphaël 2.3.0 输入文件 切分成多个块 分配给不同的Map任务 Map任务处理并生成中间结果 缓存中间结果到内存 定期写入本地硬盘 根据分区函数分成多个区 Master通知执行Reduce的Worker 调用远程过程读取中间数据 Reduce Worker遍历排序后的中间数据 传递键和相关的中间结果给Reduce函数 所有Map和Reduce任务完成 激活用户程序 合并所有Reduce任务的结果 输出最终结果集 结束 容错机制 由于MapReduce在成百上千台机器上处理海量数据所以容错机制是不可或缺的。MapReduce中的容错机制是确保系统在处理海量数据时能够处理故障和失效情况的重要组成部分。 Master的容错机制 Master会周期性地设置检查点并导出数据以便在任务失效时进行恢复和重新执行。如果Master失效整个MapReduce程序将终止并重新开始。Master会定期发送ping命令给Worker如果没有Worker的应答则认为Worker失效并将任务调度到其他Worker上重新执行。 Worker的容错机制 如果Worker失效Master会终止对该Worker的任务调度并将任务调度到其他Worker上重新执行。 总的来说MapReduce通过重新执行失效的地方来实现容错。Master和Worker之间的通信和检查机制确保系统在面对故障和失效时的可靠性和稳定性。
http://www.zqtcl.cn/news/513681/

相关文章:

  • 临沂做进销存网站推广软件公司
  • 网站前端建设唐山网站建设托管
  • 做效果图有哪些网站seo怎么做关键词排名
  • 深圳手机网站开发什么网站可以做英语题
  • 网站优化什么意思图片展示网站
  • 建德做网站米趋外贸网站建设
  • 国外优秀的设计网站八爪鱼磁力搜索引擎
  • 网站建设优化陕西网络营销推广方法与策略
  • 网站建设推广者怎样找到客户百度seo排名帝搜软件
  • 绵阳网站托管网站建设第一品牌
  • 张家港网站建设培训班电商seo引流
  • 网站安全怎么做手机网站 焦点图
  • 阿里云做网站的代码网上申请入团网站
  • 精品课程网站怎么做建筑图纸符号大全解释
  • 高权重网站 内页做跳转给新网站许昌做网站公司哪家专业
  • 咸阳网站建设工作室网站建设经
  • 网站怎么做短信接口新浪wordpress
  • 方维o2o 2.9蓝色团购网站程序源码模板做一电影网站怎么赚钱
  • 口碑好网站建设资源新昌网站建设
  • 苏州做网站的公司排名泉州网络推广专员
  • 无为县做互联网网站备案的时候网站建设方案书要吗
  • 修改网站的备案主体dede网站地图不显示文章列表
  • 建立个人网站的成本织梦html5手机网站模板
  • 怎么自己建一个网站吗php网页设计培训
  • 深圳大型论坛网站建设wordpress国内加速
  • 仿站怎么做广告装饰公司名字
  • 黄冈网站推广收费标准wordpress导航页面设置密码
  • 做网站会犯法吗贵州省建设厅城乡建设网站
  • 做网站和做公众号资金盘网站怎么建设
  • 全国最好的网站建设案例推广方法视频