当前位置: 首页 > news >正文

龙门惠州网站建设wordpress阅读数 显示k

龙门惠州网站建设,wordpress阅读数 显示k,17网站一起做网店的流程,wordpress 删除小工具栏文章目录 SequenceFile、元数据操作与MapReduce单词计数一、实验目标二、实验要求三、实验内容四、实验步骤附#xff1a;系列文章 SequenceFile、元数据操作与MapReduce单词计数 一、实验目标 熟练掌握hadoop操作指令及HDFS命令行接口掌握HDFS SequenceFile读写操作掌握Map… 文章目录 SequenceFile、元数据操作与MapReduce单词计数一、实验目标二、实验要求三、实验内容四、实验步骤附系列文章 SequenceFile、元数据操作与MapReduce单词计数 一、实验目标 熟练掌握hadoop操作指令及HDFS命令行接口掌握HDFS SequenceFile读写操作掌握MapReduce单词计数操作熟练掌握查询文件状态信息和目录下所有文件的元数据信息的方法 二、实验要求 给出主要实验步骤成功的效果截图。要求分别在本地和集群测试给出测试效果截图对本次实验工作进行全面的总结。完成实验内容后实验报告文件名加上学号姓名。涉及的文件名、类名自拟要求体现本人学号或姓名信息涉及的文件内容自拟。 三、实验内容 SequenceFile写操作实现效果如下图所示。 SequenceFile读操作实现效果如下图所示。 输出一个目录下多个文件的文件状态和元数据信息。 使用mapreduce编程自拟文件名和文件内容完成对该文件的单词计数实现效果参考下图。 四、实验步骤 1.SequenceFile写操作 程序设计 package hadoop;import java.io.*; import java.net.URI; import org.apache.hadoop.conf.*; import org.apache.hadoop.fs.*; import org.apache.hadoop.io.*; import org.apache.hadoop.util.*;SuppressWarnings(unused) public class SeqFileWrite {static Configuration conf new Configuration();static String url hdfs://master:9000/seqfile.txt;static String[] data {a,b,c, a,e,f, a,j,k};public static void main(String[] args) throws IOException{FileSystem fs FileSystem.get(URI.create(url), conf);Path path new Path(url);IntWritable key new IntWritable();Text text new Text();SuppressWarnings(deprecation)SequenceFile.Writer w SequenceFile.createWriter(fs, conf, path, IntWritable.class, Text.class);for(int i0; i10; i){key.set(10-i);text.set(data[i%data.length]);w.append(key, text);}IOUtils.closeStream(w);} }程序分析 这是一个使用Hadoop的SequenceFile编写程序它可以将数据写入到一个SeqFile中。SeqFile是Hadoop中的一种二进制文件格式它能够高效地储存大量的键值对数据并支持高效地随机访问。 在程序中首先定义了一个静态的Configuration对象和一个静态的URL字符串url用于指定数据文件的位置。然后定义了一个包含若干数据字符串的data数组。 在main()方法中通过调用FileSystem.get()方法获取一个文件系统对象fs并通过指定URL字符串和Configuration对象来实现。然后定义一个Path对象指定数据文件的路径。 接下来定义一个IntWritable对象key和一个Text对象text用于储存键和值。打开文件并创建一个SequenceFile.Writer对象w用于向SeqFile中写入数据。 通过for循环遍历数据将数据写入到SeqFile中并通过IOUtils.closeStream()方法关闭写入流。 总的来说这个程序是一个简单的SeqFile写入例子它可以帮助初学者了解SeqFile的使用方法。 运行结果 2.SequenceFile读操作 程序设计 package hadoop;import java.io.*; import java.net.URI; import org.apache.hadoop.conf.*; import org.apache.hadoop.fs.*; import org.apache.hadoop.io.*; import org.apache.hadoop.util.*;public class SeqFileRead {static Configuration conf new Configuration();static String url hdfs://master:9000/seqfile.txt;public static void main(String[] args) throws IOException{FileSystem fs FileSystem.get(URI.create(url), conf);Path path new Path(url);SuppressWarnings(deprecation)SequenceFile.Reader r new SequenceFile.Reader(fs, path, conf);Writable keyclass (Writable)ReflectionUtils.newInstance(r.getKeyClass(), conf);Writable valueclass (Writable)ReflectionUtils.newInstance(r.getValueClass(), conf);while(r.next(keyclass, valueclass)){System.out.println(key: keyclass);System.out.println(valueL: valueclass);System.out.println(position: r.getPosition());}IOUtils.closeStream(r);} }程序分析 这是一个使用Hadoop的SequenceFile读取程序它可以从指定的SeqFile中读取数据并输出到控制台上。 在程序中首先定义了一个静态的Configuration对象和一个静态的URL字符串url用于指定数据文件的位置。 在main()方法中通过调用FileSystem.get()方法获取一个文件系统对象fs并通过指定URL字符串和Configuration对象来实现。然后定义一个Path对象指定数据文件的路径。 接下来打开文件并创建一个SequenceFile.Reader对象r用于从SeqFile中读取数据。通过ReflectionUtils.newInstance()方法动态生成Writable类型的对象实例。然后在while循环中通过r.next()方法读取下一个键值对并输出到控制台上。 最后通过IOUtils.closeStream()方法关闭读取流。 总的来说这个程序是一个简单的SeqFile读取例子它可以帮助初学者了解SeqFile的读取方法和Writable对象的动态生成方法。 运行结果 3.读取文件元信息 程序设计 package hadoop;import java.io.IOException; import java.net.URI;import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.FileUtil; import org.apache.hadoop.fs.Path;public class FileStatus {public static void main(String[] args){Configuration conf new Configuration();conf.set(fs.DefailtFS, hdfs://master:9000/);FileSystem fs null;Path path[] new Path[args.length];for(int i0; ipath.length; i){path[i] new Path(args[i]);}try{fs FileSystem.get(URI.create(args[0]), conf);org.apache.hadoop.fs.FileStatus[] filestatus fs.listStatus(path);Path listPaths[]FileUtil.stat2Paths(filestatus);for(Path p:listPaths){System.out.println(p);System.out.println(p.getName());String ps p.toString();FileSystem fs2 FileSystem.get(URI.create(ps),conf);org.apache.hadoop.fs.FileStatus[] filestatus2 fs2.listStatus(p);for(int i0; ifilestatus.length;i){System.out.println(filestatus[i]);}}}catch(IOException e){e.printStackTrace();}}}程序分析 这是一个使用Hadoop的FileStatus获取指定文件夹中的文件状态信息的程序。 在程序中首先定义了一个Configuration对象conf并设置default file system的URL为hdfs://master:9000/。然后通过FileSystem.get()方法获取一个文件系统对象fs。 在main()方法中通过for循环依次处理传入的参数将其转换为Path对象并存储在数组path[]中。 在try语句块中通过fs.listStatus()方法获取指定文件夹的文件状态信息存储在数组filestatus[]中。然后通过FileUtil.stat2Paths()方法将filestatus[]转换为Path类型的数组listPaths[]。 接下来遍历listPaths[]数组分别输出路径和文件名并再次调用FileSystem.get()方法获取一个新的文件系统对象fs2用于获取指定路径下的文件状态信息。通过fs2.listStatus()方法获取指定路径下的文件状态信息存储在数组filestatus2[]中并将其循环输出到控制台上。 最后通过catch(IOException e)方法捕获异常并输出错误信息。 总的来说这个程序是一个简单的使用Hadoop的FileStatus获取文件状态信息的例子可以帮助初学者了解Hadoop中FileStatus的使用方法。 运行结果 4.单词计数 程序设计 Map类 package hadoop; import java.io.IOException; import org.apache.hadoop.mapreduce.Mapper; import org.apache.hadoop.io.*;public class Map extends MapperObject, Text, Text, IntWritable{protected void map(Object key, Text value, Context context) throws IOException, InterruptedException{String [] lines value.toString().split( );for(String word : lines){context.write(new Text(word), new IntWritable(1));}}}Reduce类 package hadoop; import java.io.IOException; import org.apache.hadoop.io.*; import org.apache.hadoop.mapreduce.Reducer;public class Reduce extends ReducerText, IntWritable, Text, IntWritable{protected void reduce(Text key, IterableIntWritable values, Context context) throws IOException,InterruptedException{int sum 0;for (IntWritable count:values){sum sum count.get();}context.write(key, new IntWritable(sum));}}主函数 package hadoop;import org.apache.hadoop.mapreduce.lib.input.*; import org.apache.hadoop.mapreduce.lib.output.*; import org.apache.hadoop.mapreduce.*;import java.io.IOException;import org.apache.hadoop.conf.*; import org.apache.hadoop.io.*; import org.apache.hadoop.fs.*;public class WordMain {SuppressWarnings(deprecation)public static void main(String[] args) throws IOException,ClassNotFoundException,InterruptedException{if(args.length ! 2 || args null){System.out.println(please input current Path);System.exit(0);}Configuration conf new Configuration();Job job new Job(conf, WordMain.class.getSimpleName());job.setJarByClass(WordMain.class);job.setInputFormatClass(TextInputFormat.class);job.setOutputFormatClass(TextOutputFormat.class);FileInputFormat.setInputPaths(job, new Path(args[0]));FileOutputFormat.setOutputPath(job, new Path(args[1]));job.setMapperClass(Map.class);job.setReducerClass(Reduce.class);job.setOutputKeyClass(Text.class);job.setOutputValueClass(IntWritable.class);job.waitForCompletion(true);} }运行结果 附系列文章 实验文章目录直达链接实验01Hadoop安装部署https://want595.blog.csdn.net/article/details/132767284实验02HDFS常用shell命令https://want595.blog.csdn.net/article/details/132863345实验03Hadoop读取文件https://want595.blog.csdn.net/article/details/132912077实验04HDFS文件创建与写入https://want595.blog.csdn.net/article/details/133168180实验05HDFS目录与文件的创建删除与查询操作https://want595.blog.csdn.net/article/details/133168734实验06SequenceFile、元数据操作与MapReduce单词计数https://want595.blog.csdn.net/article/details/133926246实验07MapReduce编程数据过滤保存、UID 去重https://want595.blog.csdn.net/article/details/133947981实验08MapReduce 编程检索特定群体搜索记录和定义分片操作https://want595.blog.csdn.net/article/details/133948849实验09MapReduce 编程join操作和聚合操作https://want595.blog.csdn.net/article/details/133949148实验10MapReduce编程自定义分区和自定义计数器https://want595.blog.csdn.net/article/details/133949522
http://www.zqtcl.cn/news/5356/

相关文章:

  • 动画网站制作设计网站实现PDF在线阅读需要怎么做
  • 做电影网站如何买版权网站建设管理工作情况的通报
  • 达州做网站的公司有哪些大连嘉良建设有限公司网站
  • 黄冈网站推广软件视频浦口区网站建设质量推荐
  • 广西建设网桂建云网站wordpress mnews
  • 通信部门网站备案证明游戏推广群
  • 山东省质量建设监督总站网站万网上传wordpress
  • 环保网站建设说明启源网站建设
  • 台州建设公司网站在别的公司做的网站
  • 房产销售网站开发文档网站建设 探索
  • 怎么做最火的视频网站视觉设计公司名字
  • 如何做企业的网站怎么做公众号微信
  • dj那个网站做的好现在注册公司流程和费用
  • 企业网站备案需要什么资料潍坊企业网站模板建站
  • 建设网站好公司哪家好定制手机微网站
  • 徐典超 网站建设做一个微信公众号大概要多少钱
  • 门户网站开发费需入无形资产网站建设包括网页设计
  • 源码网站怎么搭建视频背景网站
  • 商城网站商家入驻功能自己制作网页查询系统
  • 做本地的分类信息网站佛山找企业的网站
  • 企业网站开发到上线的视频1688网站入口
  • 汽车建设网站的能力一年的百度指数
  • 网站建设分哪些类别什么是产品网络推广
  • 站酷网在线官网ui设计公司网站
  • 网站建设登录界面代码腾讯企业邮箱电脑版
  • 上海网站开发哪家好软件公司网站系统集成建设
  • 最好的餐饮设计网站建设怎么避免网站开发后门
  • 信誉好的武进网站建设wordpress小说网自动采集
  • 网站域名免费桂林人网
  • d代码做网站博物馆网站建设方案报价