当前位置：首页 > news >正文

创建免费论坛的10个网站国内顶尖设计椅子图片

news 2025/11/15 2:42:06

创建免费论坛的10个网站,国内顶尖设计椅子图片,全国企业查询系统信息,不利于优化网站的因素目录一、前言二、示例程序 2.1 提交wordcount示例程序 2.2 提交求圆周率示例程序三、写在最后一、前言我们前面提到了MapReduce#xff0c;也说了现在几乎没有人再写MapReduce代码了#xff0c;因为它已经过时了。然而不写代码不意味着它没用#xff0c;当下很火…目录一、前言二、示例程序 2.1 提交wordcount示例程序 2.2 提交求圆周率示例程序三、写在最后一、前言我们前面提到了MapReduce也说了现在几乎没有人再写MapReduce代码了因为它已经过时了。然而不写代码不意味着它没用当下很火的HIve技术就到了MapReduce所以MapReduce还是相当重要的。但是本章我们暂时不用管MapReduce程序是如何编写的它的语法结构是什么我们通过Hadoop系统自带MapReduce示例程序到YARN运行。目的是让各位有一个直观的认识。在部署并成功启动YARN集群后我们就可以在YARN上运行各类应用程序了。 YARN作为资源调度管控框架其本身提供资源供许多程序运行常见的有 MapReduce程序Spark程序Flink程序 Spark和Flink是大数据后续的学习内容我们目前先来体验一下在YARN上执行MapReduce程序的过程。二、示例程序 Hadoop官方内置了一些预置的MapReduce程序代码我们无需编程只需要通过命令即可使用。常用的有2个MapReduce内置程序 wordcount单词计数程序统计指定文件内各个单词出现的次数pi求圆周率通过蒙特卡罗算法统计模拟法求圆周率这些内置的示例MapReduce程序代码都在 $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar 这个文件内。可以通过 hadoop jar 命令来运行它提交MapReduce程序到YARN中。语法 hadoop jar 程序文件 java类名 [程序参数] ... [程序参数] 2.1 提交wordcount示例程序介绍单词计数示例程序的功能很简单给定数据输入的路径HDFS、给定结果输出的路径HDFS 将输入路径内的数据中的单词进行计数将结果写到输出路径步骤我们可以准备一份数据文件并上传到HDFS中。 itheima itcast itheima itcast hadoop hdfs hadoop hdfs hadoop mapreduce hadoop yarn itheima hadoop itcast hadoop itheima itcast hadoop yarn mapreduce将上述内容保存到Linux中为words.txt文件并上传到HDFS。 hadoop fs -mkdir -p /input/wordcount hadoop fs -mkdir /output hadoop fs -put words.txt /input/wordcount/执行如下命令提交示例MapReduce程序WordCount到YARN中执行 hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar wordcount hdfs://node1:8020/input/wordcount/ hdfs://node1:8020/output/wc1 注意参数wordcount表示运行jar包中的单词计数程序Java Class参数1是数据输入路径hdfs://node1:8020/input/wordcount/)参数2是结果输出路径(hdfs://node1:8020/output/wc1) 需要确保输出的文件夹不存在提交程序后可以在YARN的WEB UI页面看到运行中的程序http://centos100:8088/cluster/apps) 执行完成后可以查看HDFS上的输出结果 _SUCCESS文件是标记文件表示运行成功本身是空文件part-r-00000是结果文件结果存储在以part开头的文件中执行完成后可以借助历史服务器查看到程序的历史运行信息 ps如果没有启动历史服务器和代理服务器此操作无法完成页面信息由历史服务器提供鼠标点击跳转到新网页功能由代理服务器提供查看运行的日志 2.2 提交求圆周率示例程序可以执行如下命令使用蒙特卡罗算法模拟计算求PI圆周率 hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.1.jar pi 3 1000 参数pi表示要运行的Java类这里表示运行jar包中的求pi程序参数3表示设置几个map任务参数1000表示模拟求PI的样本数越大求的PI越准确但是速度越慢如图运行完成求得PI值样本1000太小不够精准仅演示三、写在最后到这一章结束我们的Hadoop学习就告一段落了。不是说Hadoop技术学完了而是可以说已经入门了。至于后续要深入学习也有了方向性。下一步我们将讲解Hive技术。过程中会补充MapReduce的一些知识点。最难不过坚持加油

查看全文

http://www.zqtcl.cn/news/106822/