当前位置: 首页 > news >正文

网站推广策划书模板wordpress.net

网站推广策划书模板,wordpress.net,蜂鸟 网站建设,wordpress查询分页插件我们将在这里描述在多节点集群中的Apache Hadoop中运行MapReduce Job的过程。 要在多节点群集中设置Apache Hadoop #xff0c;可以阅读设置Apache Hadoop多节点群集 。 为了进行设置#xff0c;我们必须在每台计算机上使用以下配置Hadoop#xff1a; 在所有节点的conf / … 我们将在这里描述在多节点集群中的Apache Hadoop中运行MapReduce Job的过程。 要在多节点群集中设置Apache Hadoop 可以阅读设置Apache Hadoop多节点群集 。 为了进行设置我们必须在每台计算机上使用以下配置Hadoop 在所有节点的conf / mapred-site.xml中添加以下属性 property namemapred.job.tracker/name valuemaster:54311/valuedescriptionThe host and port that the MapReduce job tracker runs at. If “local”, then jobs are run in-process as a single map and reduce task. /description /propertyproperty namemapred.local.dir/name value${hadoop.tmp.dir}/mapred/local/value /propertyproperty namemapred.map.tasks/name value20/value /propertyproperty namemapred.reduce.tasks/name value2/value /property 注意最后三个是附加设置因此我们可以忽略它们。 古腾堡项目 为了演示MapReduce我们将使用WordCount示例作业该作业读取文本文件并计算单词出现的频率。 输入是文本文件输出是文本文件其每一行包含一个单词和出现频率的计数以制表符分隔。 从以下站点下载示例输入所有电子文本均应采用纯文本us-ascii编码。 科学概要卷。 1共4个作者J。Arthur Thomson 达芬奇的笔记本 尤利西斯James Joyce 《孙子兵法》提高了6美分。 卑诗省孙子 亚瑟·柯南·道尔爵士的《福尔摩斯历险记》 魔鬼字典安布罗斯·比尔斯Ambrose Bierce 大英百科全书第11版第4卷第3部分 请谷歌搜索这些文本。 将每个电子书下载为纯文本UTF-8编码的文本文件并将文件存储在所选的本地临时目录中例如/ tmp / gutenberg。 使用以下命令检查文件 $ ls -l /tmp/gutenberg/ 接下来我们在集群中启动dfs和mapred层 $ start-dfs.sh$ start-mapred.sh 通过发出以下命令jps进行检查以检查数据节点名称节点和任务跟踪器作业跟踪器在所有节点中均正常运行。 接下来我们将本地文件这里是文本文件复制到Hadoop HDFS $ hadoop dfs -copyFromLocal /tmp/gutenberg /Users/hduser/gutenberg$ hadoop dfs -ls /Users/hduser 如果文件被成功复制我们将看到类似以下内容–找到2个项目 drwxr-xr-x – hduser supergroup 0 2013-05-21 14:48 /Users/hduser/gutenberg 此外我们检查文件系统在/ Users / hduser / gutenberg中的内容 $ hadoop dfs -ls /Users/hduser/gutenbergFound 7 items-rw-r--r-- 2 hduser supergroup 336705 2013-05-21 14:48 /Users/hduser/gutenberg/pg132.txt -rw-r--r-- 2 hduser supergroup 581877 2013-05-21 14:48 /Users/hduser/gutenberg/pg1661.txt -rw-r--r-- 2 hduser supergroup 1916261 2013-05-21 14:48 /Users/hduser/gutenberg/pg19699.txt -rw-r--r-- 2 hduser supergroup 674570 2013-05-21 14:48 /Users/hduser/gutenberg/pg20417.txt -rw-r--r-- 2 hduser supergroup 1540091 2013-05-21 14:48 /Users/hduser/gutenberg/pg4300.txt -rw-r--r-- 2 hduser supergroup 447582 2013-05-21 14:48 /Users/hduser/gutenberg/pg5000.txt -rw-r--r-- 2 hduser supergroup 384408 2013-05-21 14:48 /Users/hduser/gutenberg/pg972.txt 我们开始我们的MapReduce工作 让我们运行MapReduce WordCount示例 $ hadoop jar hadoop-examples-1.0.4.jar wordcount /Users/hduser/gutenberg /Users/hduser/gutenberg-output 注意假设您已经在HADOOP_HOME目录中。 如果没有 $ hadoop jar ABSOLUTE/PATH/TO/HADOOP/DIR/hadoop-examples-1.0.4.jar wordcount /Users/hduser/gutenberg /Users/hduser/gutenberg-output 或者如果您已经在/ usr / local / hadoop中安装了Hadoop hadoop jar /usr/local/hadoop/hadoop-examples-1.0.4.jar wordcount /Users/hduser/gutenberg /Users/hduser/gutenberg-output 输出如下 13/05/22 13:12:13 INFO mapred.JobClient: map 0% reduce 0% 13/05/22 13:12:59 INFO mapred.JobClient: map 28% reduce 0% 13/05/22 13:13:05 INFO mapred.JobClient: map 57% reduce 0% 13/05/22 13:13:11 INFO mapred.JobClient: map 71% reduce 0% 13/05/22 13:13:20 INFO mapred.JobClient: map 85% reduce 0% 13/05/22 13:13:26 INFO mapred.JobClient: map 100% reduce 0% 13/05/22 13:13:43 INFO mapred.JobClient: map 100% reduce 50% 13/05/22 13:13:55 INFO mapred.JobClient: map 100% reduce 100% 13/05/22 13:13:59 INFO mapred.JobClient: map 85% reduce 100% 13/05/22 13:14:02 INFO mapred.JobClient: map 100% reduce 100% 13/05/22 13:14:07 INFO mapred.JobClient: Job complete: job_201305211616_0011 13/05/22 13:14:07 INFO mapred.JobClient: Counters: 26 13/05/22 13:14:07 INFO mapred.JobClient: Job Counters 13/05/22 13:14:07 INFO mapred.JobClient: Launched reduce tasks3 13/05/22 13:14:07 INFO mapred.JobClient: SLOTS_MILLIS_MAPS118920 13/05/22 13:14:07 INFO mapred.JobClient: Total time spent by all reduces waiting after reserving slots (ms)0 13/05/22 13:14:07 INFO mapred.JobClient: Total time spent by all maps waiting after reserving slots (ms)0 13/05/22 13:14:07 INFO mapred.JobClient: Launched map tasks10 13/05/22 13:14:07 INFO mapred.JobClient: Data-local map tasks10 13/05/22 13:14:07 INFO mapred.JobClient: SLOTS_MILLIS_REDUCES54620 13/05/22 13:14:07 INFO mapred.JobClient: File Output Format Counters 13/05/22 13:14:07 INFO mapred.JobClient: Bytes Written1267287 13/05/22 13:14:07 INFO mapred.JobClient: FileSystemCounters 13/05/22 13:14:07 INFO mapred.JobClient: FILE_BYTES_READ4151123 13/05/22 13:14:07 INFO mapred.JobClient: HDFS_BYTES_READ5882320 13/05/22 13:14:07 INFO mapred.JobClient: FILE_BYTES_WRITTEN6937084 13/05/22 13:14:07 INFO mapred.JobClient: HDFS_BYTES_WRITTEN1267287 13/05/22 13:14:07 INFO mapred.JobClient: File Input Format Counters 13/05/22 13:14:07 INFO mapred.JobClient: Bytes Read5881494 13/05/22 13:14:07 INFO mapred.JobClient: Map-Reduce Framework 13/05/22 13:14:07 INFO mapred.JobClient: Reduce input groups114901 13/05/22 13:14:07 INFO mapred.JobClient: Map output materialized bytes2597630 13/05/22 13:14:07 INFO mapred.JobClient: Combine output records178795 13/05/22 13:14:07 INFO mapred.JobClient: Map input records115251 13/05/22 13:14:07 INFO mapred.JobClient: Reduce shuffle bytes1857123 13/05/22 13:14:07 INFO mapred.JobClient: Reduce output records114901 13/05/22 13:14:07 INFO mapred.JobClient: Spilled Records463427 13/05/22 13:14:07 INFO mapred.JobClient: Map output bytes9821180 13/05/22 13:14:07 INFO mapred.JobClient: Total committed heap usage (bytes)1567514624 13/05/22 13:14:07 INFO mapred.JobClient: Combine input records1005554 13/05/22 13:14:07 INFO mapred.JobClient: Map output records1005554 13/05/22 13:14:07 INFO mapred.JobClient: SPLIT_RAW_BYTES826 13/05/22 13:14:07 INFO mapred.JobClient: Reduce input records178795 检索作业结果 要直接从hadoop读取而不复制到本地文件系统请执行以下操作 $ hadoop dfs -cat /Users/hduser/gutenberg-output/part-r-00000 让我们将结果复制到本地文件系统中。 $ mkdir /tmp/gutenberg-output$ bin/hadoop dfs -getmerge /Users/hduser/gutenberg-output /tmp/gutenberg-output$ head /tmp/gutenberg-output/gutenberg-output 我们将得到如下输出 Ample. 1 Arthur! 1 As 1 Because 1 But, 1 Certainly, 1 Come, 1 DEAR 1 Dear 2 Dearest 1 Dont 1 Fritz! 1 From 1 Have 1 Here 1 How 2 命令fs -getmerge将简单地串联在指定目录中找到的所有文件。 这意味着合并的文件可能并且很可能不会被排序。 资源 http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-single-node-cluster/ http://www.michael-noll.com/tutorials/running-hadoop-on-ubuntu-linux-multi-node-cluster/ http://hadoop.apache.org/docs/current/ 参考 Phlox Blog博客上的JCG合作伙伴 Piyas De 在Apache Hadoop多节点群集中运行Map-Reduce作业 。 翻译自: https://www.javacodegeeks.com/2013/06/running-map-reduce-job-in-apache-hadoop-multinode-cluster.html
http://www.zqtcl.cn/news/175253/

相关文章:

  • 深圳高端网站建设美工步骤图
  • 指数网站网站用ps下拉效果怎么做
  • 李沧网站建设电话从化企业网站建设
  • 北京电商网站建设公司新康家园网站建设
  • 广西注册公司网站企业高端网站制作
  • 国安中建建设集团网站南京网页设计培训班
  • 网站如何制作建设内容社交电商平台
  • 无法连接到wordpress站点网站建设两个方面
  • 广东官网网站建设品牌未来做啥网站能致富
  • 网站建设合同副本珠海微网站建设
  • wordpress 多语言 站点数据分析师报名入口
  • 做网站长尾词品牌设计模板
  • 企业建立网站的优势阿里云做网站号码
  • 江苏住房城乡建设厅网站一千块钱能注册公司吗
  • 山东兴华建设集团有限公司网站分类信息网站怎么做
  • 怎么用手机网站做软件西安网站建设开发熊掌号
  • asp.net做网站的流程杭州vi设计广告公司
  • 微信网站主题网络建设解决方案
  • 济南自助建站系统网站的外链建设计划
  • 中山低价网站建设一学一做教育视频网站有哪些内容
  • 网上最好的网站模块模板建站小程序
  • 安平县哪家做网站html动漫网站模板下载
  • 网站关于 模板wordpress adsence
  • 杭州公司网站建设如何选择五屏网站建设
  • 天津商城网站建设平面设计师网站
  • 上海的网站设计公司苏州网站建设渠道
  • 做美食没有广告的网站o2o网站建设
  • 网站程序调试模式怎么做做汽车特卖会的网站
  • 怎么有自己的网站政务公开网站建设方案
  • 济南装饰行业网站建设成都地区网站开发成本