当前位置：首页 > news >正文

宁波网站推广公司有哪些三明注册公司

news 2025/11/15 8:56:09

宁波网站推广公司有哪些,三明注册公司,免费稳定的网站空间,wordpress详情页一. Elasticsearch架构原理 1、Elasticsearch的节点类型在Elasticsearch主要分成两类节点#xff0c;一类是Master#xff0c;一类是DataNode。 1.1 Master节点在Elasticsearch启动时#xff0c;会选举出来一个Master节点。当某个节点启动后#xff0c;然后使用Zen D…一. Elasticsearch架构原理 1、Elasticsearch的节点类型在Elasticsearch主要分成两类节点一类是Master一类是DataNode。 1.1 Master节点在Elasticsearch启动时会选举出来一个Master节点。当某个节点启动后然后使用Zen Discovery机制找到集群中的其他节点建立连接并从候选主节点中选举出一个主节点。 Master节点主要负责处理创建删除索引等请求负责索引的创建与删除决定分片被分配到哪个节点维护并且更新Cluster State Master Node的最佳实践 Master节点非常重要在部署上需要考虑解决单点的问题为一个集群设置多个Master节点每个节点只承担Master 的单一角色选主的过程互相Ping对方Node ld 低的会成为被选举的节点其他节点会加入集群但是不承担Master节点的角色。一旦发现被选中的主节点丢失就会选举出新的Master节点 1.2 DataNode节点在Elasticsearch集群中会有N个DataNode节点。DataNode节点主要负责数据写入、数据检索大部分Elasticsearch的压力都在DataNode节点上在生产环境中内存最好配置大一些。可以保存数据的节点叫做Data Node负责保存分片数据。在数据扩展上起到了至关重要的作用。节点启动后默认就是数据节点可以设置node.data: false 禁止。由Master Node决定如何把分片分发到数据节点上通过增加数据节点可以解决数据水平扩展和解决数据单点问题。 1.3 Coordinating Node 负责接受Client的请求将请求分发到合适的节点最终把结果汇集到一起。每个节点默认都起到了Coordinating Node的职责。 1.4 其他节点 Master eligible nodes可以参与选举的合格节点 Master eligible nodes和Master Node 每个节点启动后默认就是一个Master eligible节点 ○ 可以设置 node.master: false禁止Master-eligible节点可以参加选主流程成为Master节点当第一个节点启动时候它会将自己选举成Master节点每个节点上都保存了集群的状态只有Master节点才能修改集群的状态信息 ○ 集群状态(Cluster State) 维护了一个集群中必要的信息 ■ 所有的节点信息 ■ 所有的索引和其相关的Mapping与Setting信息 ■ 分片的路由信息Hot Warm Node ○ 不同硬件配置的Data Node,用来实现Hot Warm架构降低集群部署的成本Ingest Node ○ 数据前置处理转换节点支持pipeline管道设置可以使用ingest对数据进行过滤、转换等操作Machine Learning Node ○ 负责跑机器学习的Job用来做异常检测Tribe Node ○ Tribe Node连接到不同的Elasticsearch集群并且支持将这些集群当成一个单独的集群处理二、分片和副本机制 2.1 分片Primary Shard Replica Shard Elasticsearch是一个分布式的搜索引擎索引的数据也是分成若干部分分布在不同的服务器节点中。分布在不同服务器节点中的索引数据就是分片Shard。Elasticsearch会自动管理分片如果发现分片分布不均衡就会自动迁移一个索引index由多个shard分片组成而分片是分布在不同的服务器上的 2.1.1 主分片Primary Shard 用以解决数据水平扩展的问题。通过主分片可以将数据分布到集群内的所有节点之上一个分片是一个运行的Lucene的实例主分片数在索引创建时指定后续不允许修改除非Reindex 2.1.2 副本分片Replica Shard 用以解决数据高可用的问题。副本分片是主分片的拷贝副本分片数可以动态调整增加副本数还可以在一定程度上提高服务的可用性(读取的吞吐) 分片的设定对于生产环境中分片的设定需要提前做好容量规划 2.1.3 分片数设置过小导致后续无法增加节点实现水平扩展单个分片的数据量太大导致数据重新分配耗时 2.1.4 分片数设置过大 7.0 开始默认主分片设置成1解决了over-sharding分片过度的问题影响搜索结果的相关性打分影响统计结果的准确性单个节点上过多的分片会导致资源浪费同时也会影响性能指定索引的主分片和副本分片数 PUT /blogs {settings: {number_of_shards: 3,number_of_replicas: 1 // 0或1 } }#查看集群的健康状况 GET _cluster/health 2.2 副本为了对Elasticsearch的分片进行容错假设某个节点不可用会导致整个索引库都将不可用。所以需要对分片进行副本容错。每一个分片都会有对应的副本。在Elasticsearch中默认创建的索引为1个分片、每个分片有1个主分片和1个副本分片。每个分片都会有一个Primary Shard主分片也会有若干个Replica Shard副本分片 Primary Shard和Replica Shard不在同一个节点上 2.3 指定分片、副本数量 // 创建指定分片数量、副本数量的索引 2.4 集群status ● Green: 主分片与副本都正常分配 ● Yellow: 主分片全部正常分配有副本分片未能正常分配 ● Red: 有主分片未能分配。例如当服务器的磁盘容量超过85%时,去创建了一个新的索引 CAT API查看集群信息 GET /_cat/nodes?v #查看节点信息 GET /_cat/health?v #查看集群当前状态红、黄、绿 GET /_cat/shards?v #查看各shard的详细情况 GET /_cat/shards/{index}?v #查看指定分片的详细情况 GET /_cat/master?v #查看master节点信息 GET /_cat/indices?v #查看集群中所有index的详细信息 GET /_cat/indices/{index}?v #查看集群中指定index的详细信息三、Elasticsearch重要工作流程 3.1 Elasticsearch文档写入原理 1.选择任意一个DataNode发送请求例如node2。此时node2就成为一个coordinating node协调节点 2.计算得到文档要写入的分片 shard hash(routing) % number_of_primary_shards routing 是一个可变值默认是文档的 _id 3.coordinating node会进行路由将请求转发给对应的primary shard所在的DataNode假设primary shard在node1、replica shard在node2 4.node1节点上的Primary Shard处理请求写入数据到索引库中并将数据同步到Replica shard 5.Primary Shard和Replica Shard都保存好了文档返回client. 注意es路由分片规则是 shard hash(routing) % number_of_primary_shards其中number_of_primary_shards为分片数。 3.2 Elasticsearch检索原理 client发起查询请求某个DataNode接收到请求该DataNode就会成为协调节点Coordinating Node 2.协调节点Coordinating Node将查询请求广播到每一个数据节点这些数据节点的分片会处理该查询请求 3.每个分片进行数据查询将符合条件的数据放在一个优先队列中并将这些数据的文档ID、节点信息、分片信息返回给协调节点协调节点将所有的结果进行汇总并进行全局排序 4.协调节点向包含这些文档ID的分片发送get请求对应的分片将文档数据返回给协调节点最后协调节点将数据返回给客户端如何对集群的容量进行规划一个集群总共需要多少个节点?一个索引需要设置几个分片规划上需要保持一定的余量当负载出现波动节点出现丢失时还能正常运行。做容量规划时一些需要考虑的因素 ● 机器的软硬件配置 ● 单条文档的大小│文档的总数据量│索引的总数据量(Time base数据保留的时间)|副本分片数 ● 文档是如何写入的(Bulk的大小) ● 文档的复杂度文档是如何进行读取的(怎么样的查询和聚合) 评估业务的性能需求 ● 数据吞吐及性能需求 ○ 数据写入的吞吐量每秒要求写入多少数据? ○ 查询的吞吐量? ○ 单条查询可接受的最大返回时间? ● 了解你的数据 ○ 数据的格式和数据的Mapping ○ 实际的查询和聚合长的是什么样的 ES集群常见应用场景 ● 搜索: 固定大小的数据集 ○ 搜索的数据集增长相对比较缓慢 ● 日志: 基于时间序列的数据 ○ 使用ES存放日志与性能指标。数据每天不断写入增长速度较快 ○ 结合Warm Node 做数据的老化处理硬件配置 ● 选择合理的硬件数据节点尽可能使用SSD ● 搜索等性能要求高的场景建议SSD ○ 按照1∶10的比例配置内存和硬盘 ● 日志类和查询并发低的场景可以考虑使用机械硬盘存储 ○ 按照1:50的比例配置内存和硬盘 ● 单节点数据建议控制在2TB以内最大不建议超过5TB ● JVM配置机器内存的一半JVM内存配置不建议超过32G ● 不建议在一台服务器上运行多个节点内存大小要根据Node 需要存储的数据来进行估算 ● 搜索类的比例建议: 1:16 ● 日志类: 1:48——1:96之间假设总数据量1T设置一个副本就是2T总数据量 ● 如果搜索类的项目每个节点3116 496 G加上预留空间。所以每个节点最多400G数据至少需要5个数据节点 ● 如果是日志类项目每个节点3150 1550 GB2个数据节点即可

查看全文

http://www.zqtcl.cn/news/937491/