服务好的做培训网站,龙岩网站建设要多,购物软件有哪些,网站开发自学流程Java技术栈 —— Hadoop入门#xff08;二#xff09; 一、用MapReduce对统计单词个数1.1 项目流程1.2 可能遇到的问题1.3 代码勘误1.4 总结 一、用MapReduce对统计单词个数
1.1 项目流程 (1) 上传jar包。 (2) 上传words.txt文件。 (3) 用hadoop执行jar包的代码#xff0c;… Java技术栈 —— Hadoop入门二 一、用MapReduce对统计单词个数1.1 项目流程1.2 可能遇到的问题1.3 代码勘误1.4 总结 一、用MapReduce对统计单词个数
1.1 项目流程 (1) 上传jar包。 (2) 上传words.txt文件。 (3) 用hadoop执行jar包的代码对words.txt进行分析。 参考文章或视频链接重点看这篇文章 [1] 《Hadoop实战——MapReduce对英文单词文本进行统计和排序超详细教学算法分析》- CSDN[2] Hadoop实战项目源码集合 - gitee[3] HDFS文件系统的根目录和用户主目录解析 - CSDN
1.2 可能遇到的问题 (1) 无法Download结果文件。 这个问题看参考文章[1]-[3]有两个点要注意注意你的hosts文件有没有配对以及有没有开启dfs.webhdfs.enabled。 (2) 删除不了hadoop下的文件夹。 这个问题的解决方案看本节参考文章[4]不过我要提醒你的是他那篇文章里的summer对应与你当前的Linux用户我这里就叫programmer然后重启hadoopdr.who是谁可以看参考文章[5]。 (3) 更改用户后还是无法删除文件夹。 解决方案看本节参考文章[6]先关闭安全模式再删除。 # 进入安全模式
hdfs dfsadmin -safemode enter
# 退出安全模式
hdfs dfsadmin -safemode leave(4) 这里面的input文件夹和output文件夹在Linux系统上没搜到是怎么回事 当然搜不到这并不是你自己OS的真实文件夹而是存储在Hadoop的HDFS上我下载的是3.3.6版本的hadoop请检查你的hdfs-site.xml文件的${dfs.datanode.data.dir}配置项注意不同版本的hadoop这些配置项名字可能不一样所以一切以官方文档为准然而我并没有找到hdfs-default.xml这些值可能已经默认存储了具体见参考文章[7]-[9]。 这些是我的OS上的文件夹与文件位置。 1.2 参考文章或视频链接[1] Unable to open/download files in HDFS using Hadoop Web UI - stackoverflow[2] 记一次HDFS Web报错Couldn‘t preview the file. NetworkError: Failed to execute ‘send‘ on ‘XMLHttpRequest‘ - CSDN[3] HDFS Web报错Couldn‘t preview the file. - CSDN[4] 《Hadoop常见错误及解决方案、Permission denied: userdr.who, accessWRITE, inode“/“:summer:supergroup:drwxr-xr-x》[5] 《Permission denied. userdr.who is not the owner of inode/tmp》[6] 《Name node is in safe mode》[7] Where does HDFS store it’s files - stackoverflow[8] hdfs-default.xml - hadoop[9] 《过时的属性Deprecated Properties》 - 博客园
1.3 代码勘误
本章节代码作者有个地方写错了注意下即可。
//WordReduce.java文件里应该这样写
System.out.println(new Date().toGMTString() : key 出现了 sum);1.4 总结
MapReduce也没那么神神秘秘世界上没有事物是不可认识的只有还有待认识的事物总结起来就还是四个字分工协作或者可以理解为民主集中制的基本原则之一“个别酝酿集体决定”。 Map是拆分开来各自计算各自思考而Reduce就是将结果集中起来看看大家提出的意见到底如何并对结果按照具体需求进行排序。在MapReduce这个思想上共产党人走在这帮搞技术的老外的前面。