当前位置: 首页 > news >正文

廊坊市网站国外永久免费服务器

廊坊市网站,国外永久免费服务器,网站域名需要每年续费,wordpress收录排名插件供个人学习使用 1.大数据的特点 大、多、值、快、信#xff0c;即5V#xff1a; Volume#xff08;大量#xff09;#xff1a;大数据的采集、计算、存储量都非常庞大#xff0c;待处理数据都是TB、PB、乃至EB级别的Variety#xff08;多样性#xff09;#xff1… 供个人学习使用 1.大数据的特点 大、多、值、快、信即5V Volume大量大数据的采集、计算、存储量都非常庞大待处理数据都是TB、PB、乃至EB级别的Variety多样性相对于以往便于存储的 以数据库/文本为主的结构化数据非结构化数据越来越多包括网络日志、音频、视频、图 片、地理位置信息等这些多类型的数据对数据的处理能力提出了更高要求。Value低价值密度价值密度的高低与数据总量的大小成反比Velocity高速数据的采集、计算和存储速度都很快Veracity可靠数据精准可靠 2.hadoop主要解决得问题 海量数据的存储和海量数据的分析计算问题  3.Hadoop的优势 高可靠性。Hadoop通过在多个节点上保存数据副本确保即使某个计算节点或存储节点发生故障数据也不会丢失。 高扩展性。Hadoop能够在现有的计算机集群中轻松扩展支持成千上万的节点使其能够处理大规模数据。高效性。Hadoop能够在多个节点之间动态移动数据并保持节点间的动态平衡从而提高数据处理速度。高容错性。Hadoop能够自动重新分配失败的任务和计算节点确保任务继续执行。低成本。Hadoop是开源的用户可以免费下载和使用显著降低了软件成本。 广泛的适用性。Hadoop的框架是基于Java编写的使其能够运行在多种操作系统和硬件平台上。 成熟的技术生态和社区支持。Hadoop拥有一个成熟的技术生态和强大的开源社区支持提供了丰富的工具和组件便于用户集成和扩展。 4.Hadoop的组成 在Hadoop1.x版本中Hadoop中的MapReduce同时处理业务逻辑运算和资源的调度其耦合度较大在Hadoop2.x版本中在此基础上增加了Yarn此后MapReduce只处理业务逻辑运算Yarn只负责资源调度Hadoop3.x版本相较于Hadoop2.x版本在组成上没有变化 4.1 HDFS  HDFS全称Hadoop Distributed File System 是Apache Hadoop项目的一个核心组件是一个分布式文件系统旨在存储大规模数据集并提供高可用性、容错性和高吞吐量的数据访问 HDFS主要由NameNodenn、DataNodedn和Secondary NameNode2nn组成 NameNode存储文件的元数据如文件名文件目录结构文件属性生成时间、副本数、文件权限以及每个文件的块列表和块所在的DataNode位置信息等。DataNode存储具体的文件在本地文件系统存储文件块数据以及块数据的校验和。Secondary NameNode每隔一段时间对NameNode进行数据备份在NameNode挂掉时可以辅助恢复NameNode会丢掉一部分数据生产过程中采用配置两个NameNode的方式代替 4.2 MapReduce MapReduce分为Map和Reduce两个阶段 Map并行处理输入输入的数据并将处理结果送往Reduce端相应的分区各Mapper之间相互独立。Reduce对Map阶段送来的处理结果进行汇总各Reducer之间相互独立。 4.3 Yarn Yarn全称Yet Another Resource Negotiator是一种资源管理者负责Hadoop的资源调度。主要由Resource ManagerRM、NodeManagerNM、ApplicationManagerAM和Container组成。 ResourceManagerRM整个集群资源的掌管者负责协调和管理集群中的资源包括内存、CPU和其他计算资源ApplicationManagerAMResourceManager的一个子组件其主要职责是管理MapReduce所有应用程序的生命周期和资源分配。ApplicationManager负责与ResourceManager协调以分配所需的计算和存储资源。NodeManagerNMNodeManager是ResourceManager的下级组件负责管理单个数据节点上的计算和存储资源。它监视节点上的资源使用情况包括CPU、内存和磁盘空间等以便及时向ResourceManager报告可用资源的情。Container容器相当一台独立的服务器里面封装了任务运行所需要的资源如内存、CPU、磁盘、网络等。 4.4 HDFS、MapReduce、Yarn之间的关系 HDFS作为Hadoop的底层存储层为MapReduce和其他大数据处理框架提供了高吞吐量的数据访问。MapReduce是Hadoop生态系统中的一个计算框架它可以从HDFS中读取数据并将处理结果写回HDFS。MapReduce依赖于HDFS来存储输入和输出数据以及在YARN上执行任务。YARN充当资源管理器和作业调度器它协调集群上运行的各种应用程序包括MapReduce作业。MapReduce作业的执行需要YARN来分配和管理计算资源。
http://www.zqtcl.cn/news/585405/

相关文章:

  • 石家庄做网站汉狮网络企业标准网上备案网站
  • php网站开发权限管理广州白云区网站开发
  • 北京网站开发建设 58同城wordpress 无标题
  • 黑龙seo网站优化建设网站要学编程吗
  • 花都区水务建设管理中心官方网站怎么样才能搜索到自己做的网站
  • dedecms景区网站模板wordpress显示手动摘要
  • 备案网站免网上海网站建设机构
  • 模板建网站哪个品牌好网站制作排名
  • 网站开发咨询企业排名查询
  • 东莞做网站注意事项坪山网站建设方案
  • 网站文章页图片不显示图片手机设计
  • 公司网站版面怎么设计湖南做网站 就问磐石网络专业
  • 描述网站开发的广告词黄页网络的推广
  • 打开官方网站广告平面设计好学吗
  • 建设银行观澜支行网站做网站公司汉狮网络
  • 荆州学校网站建设seo专业培训机构
  • 网站制作上网建站程序的价钱
  • 阿里巴巴网站建设规划24小时学会网站建设pdf
  • wordpress建站以后网络公司注册资金多少
  • wordpress下载站模板优秀网站开发公司
  • ppt模板免费下载完整版免费网站微网站开发商
  • 网站建设前的分析第一小节内容wordpress自带主题下载失败
  • 深圳微信网站设计网站建设设计制作外包
  • 做数模必逛的网站wordpress 培训 主题
  • 开发网站语言天元建设集团有限公司电话
  • 兼职做网站访问量和数据关于外贸公司的网站模板
  • 旅游网站设计与实现软件定制报价单
  • 上海专业网站建站公网站开发人员
  • 淄博网站建设公司有几家网络培训平台下载
  • 优秀网站展示仲恺做网站