当前位置: 首页 > news >正文

建设银行网站网址网站推广在线

建设银行网站网址,网站推广在线,北辰正方建设集团网站,网站开发代理合同目录 一、Zookeeper 1.zookeeper介绍 2.数据模型 3.操作使用 4.运行机制 5.一致性 二、Dolphinscheduler 1.Dolphinscheduler介绍 架构 2.架构说明 该服务内主要包含: 该服务包含#xff1a; 3.FinalShell主虚拟机启动服务 4.Web网页登录 5.使用 5-1 安全中心…目录 一、Zookeeper 1.zookeeper介绍 2.数据模型 3.操作使用 4.运行机制 5.一致性 二、Dolphinscheduler 1.Dolphinscheduler介绍 架构 2.架构说明 该服务内主要包含: 该服务包含 3.FinalShell主虚拟机启动服务 4.Web网页登录 5.使用 5-1 安全中心 创建队列 添加租户 5-2 项目管理 I-创建项目 II-工作流定义 5-3 数据中心 5-4 资源中心 5-5 监控中心 6.指标分类介绍 一、Zookeeper 1.zookeeper介绍 ZooKeeper是一个具有高可用性的高性能分布式协调服务主要解决单点故障问题实现服务的高可用。 官网 ZooKeeper: Because Coordinating Distributed Systems is a Zoo 2.数据模型 zk可存储小文件数据用来保存其他服务的信息比如保存hdfs的namenode信息ds的运行信息 ZooKeeper 维护着一个树形层次结构树中的节点被称为 znode。znode 可以用于存储数据并且有一个与之相关联的 ACL。ZooKeeper 被设计用来实现协调服务(这类服务通常使用小数据文件),而不是用于大容量数据存储因此一个 znode 能存储的数据被限制在1MB以内 3.操作使用 1-登录客户端 /opt/cloudera/parcels/CDH-6.2.1-1.cdh6.2.1.p0.1425774/lib/zookeeper/bin/zkCli.sh 查看根节点下子节点有哪些 创建新的节点并指定数据 create 节点名(从根节点开始) 数据 查看节点内的数据 get 节点名 删除节点及数据 4.运行机制 第一阶段 启动服务进行领导者选举 所有机器通过一个选择过程来选出一台被称为领导者(leader)的机器其他的机器被称为跟随者(follower)。一旦半数以上(或指定数量)的跟随者已经将其状态与领导者同步则表明这个阶段已经完成。 第二阶段 原子广播进行数据读写 所有的写请求都会被转发给领导者再由领导者将更新广播给跟随者。当半数以上的跟随者已经将修改持久化之后领导者才会提交这个更新然后客户端才会收到一个更新成功的响应。这个用来达成共识的协议被设计成具有原子性因此每个修改要么成功要么失败。 如果领导者出现故障其余的机器会选出另外一个领导者并和新的领导者一起继续提供服务。随后如果之前的领导者恢复正常会成为一个跟随者。领导者选举的过程是非常快的。 5.一致性 一个跟随者可能滞后于领导者几个更新。这也表明在一个修改被提交之前只需要集合中半数以上机器已经将该修改持久化则认为更新完成。 对 ZooKeeper 来说理想的情况就是将客户端都连接到与领导者状态一致的服务器上。 zk能保证数据的最终一致性(要么全部成功要么全部失败)。 二、Dolphinscheduler 1.Dolphinscheduler介绍 官网 https://dolphinscheduler.apache.org/zh-cn Apache DolphinScheduler 是一个分布式易扩展的可视化DAG工作流任务调度开源系统。适用于企业级场景提供了一个可视化操作任务、工作流和全生命周期数据处理过程的解决方案。 Apache DolphinScheduler 旨在解决复杂的大数据任务依赖关系并为应用程序提供数据和各种 OPS 编排中的关系。 解决数据研发ETL依赖错综复杂无法监控任务健康状态的问题。 DolphinScheduler 以 DAGDirected Acyclic GraphDAG流式方式组装任务可以及时监控任务的执行状态支持重试、指定节点恢复失败、暂停、恢复、终止任务等操作。 架构 2.架构说明 MasterServer MasterServer采用分布式无中心设计理念MasterServer主要负责 DAG 任务切分、任务提交监控并同时监听其它MasterServer和WorkerServer的健康状态。 MasterServer服务启动时向Zookeeper注册临时节点通过监听Zookeeper临时节点变化来进行容错处理。 MasterServer基于netty提供监听服务。 该服务内主要包含: DistributedQuartz分布式调度组件主要负责定时任务的启停操作当quartz调起任务后Master内部会有线程池具体负责处理任务的后续操作 MasterSchedulerService是一个扫描线程定时扫描数据库中的t_ds_command表根据不同的命令类型进行不同的业务操作 WorkflowExecuteRunnable主要是负责DAG任务切分、任务提交监控、各种不同事件类型的逻辑处理 TaskExecuteRunnable主要负责任务的处理和持久化并生成任务事件提交到工作流的事件队列 EventExecuteService主要负责工作流实例的事件队列的轮询 StateWheelExecuteThread主要负责工作流和任务超时、任务重试、任务依赖的轮询并生成对应的工作流或任务事件提交到工作流的事件队列 FailoverExecuteThread主要负责Master容错和Worker容错的相关逻辑 WorkerServer WorkerServer也采用分布式无中心设计理念WorkerServer主要负责任务的执行和提供日志服务。 WorkerServer服务启动时向Zookeeper注册临时节点并维持心跳。 WorkerServer基于netty提供监听服务。 该服务包含 WorkerManagerThread主要负责任务队列的提交不断从任务队列中领取任务提交到线程池处理 TaskExecuteThread主要负责任务执行的流程根据不同的任务类型进行任务的实际处理 RetryReportTaskStatusThread主要负责定时轮询向Master汇报任务的状态直到Master回复状态的ack避免任务状态丢失 ZooKeeper ZooKeeper服务系统中的MasterServer和WorkerServer节点都通过ZooKeeper来进行集群管理和容错。另外系统还基于ZooKeeper进行事件监听和分布式锁。 我们也曾经基于Redis实现过队列不过我们希望DolphinScheduler依赖到的组件尽量地少所以最后还是去掉了Redis实现。 AlertServer 提供告警服务通过告警插件的方式实现丰富的告警手段。 ApiServer接口 API接口层主要负责处理前端UI层的请求。该服务统一提供RESTful api向外部提供请求服务。 UI 系统的前端页面提供系统的各种可视化操作界面。 3.FinalShell主虚拟机启动服务 # 启动 sh /export/server/dolphinscheduler/bin/start-all.sh # 停止 sh /export/server/dolphinscheduler/bin/stop-all.sh 4.Web网页登录 http://192.168.88.80:12345/dolphinscheduler/ui/view/login/index.html 账号:admin 密码:dolphinscheduler123 5.使用 5-1 安全中心 创建队列 队列是在执行 spark、mapreduce 等程序需要用到“队列”参数时使用的。 管理员进入安全中心 - 队列管理页面点击“创建队列”按钮创建队列。 注意目前仅有 admin 用户可以修改队列。 添加租户 租户对应的是 Linux 的用户用于 worker 提交作业所使用的用户。如果 linux 没有这个用户则会导致任务运行失败。你可以通过修改 worker.properties 配置文件中参数 worker.tenant.auto.createtrue 实现当 linux 用户不存在时自动创建该用户。worker.tenant.auto.createtrue 参数会要求 worker 可以免密运行 sudo 命令 租户编码租户编码是 Linux上 的用户唯一不能重复 管理员进入安全中心-租户管理页面点击“创建租户”按钮创建租户。 注意目前仅有 admin 用户可以修改租户。 5-2 项目管理 I-创建项目 II-工作流定义 进入项目 定义 定义任务1 定义任务2 控制任务执行顺序 保存工作流 上线任务 执行任务 工作流执行实例 查看任务 查看任务日志 5-3 数据中心 数据源中心可以配置各种数据源包括MySQL/PostgreSQL/Hive/Spark/ClickHouse/Oracle/ SQLServer/DB2等。配置数据源后在使用SQL类型的任务时选用不同数据源就可以直接使用相应类型的SQL了。 这里配置hive-dws 创建工作流 注意如果是查询语句需要配置邮箱服务当前ds未配置邮箱服务所以无法执行查询语句 需要公司向第三方邮箱服务器公司申请或者公司自建邮箱服务 非查询语句 create table dim.tb_test(id int,name string) 5-4 资源中心 将编写好的代码文件资源交给ds进行保存定义任务时直接执行文件 定义工作流使用 5-5 监控中心 主要是对系统中的各个服务的健康状况和基本信息的监控和显示 6.指标分类介绍 指标就是最终要计算的数据内容。 指标主要有以下分类: (1)原子指标: 原子指标基于某一业务过程的度量值是业务定义中不可再 拆解的指标原子指标的核心功能就是对指标的聚合逻辑进行了 定义。比如 销售额 销量。 (2)派生指标: 派生指标基于原子指标在原子指标的基础上加了各种限 定。比如 每月销售额 每月每个店铺的销售额。 (3)衍生指标: 衍生指标是在一个或多个派生指标的基础上通过各种逻辑 运算复合而成的。比如 每月销售的环比增长每个品类销售额占 比。
http://www.zqtcl.cn/news/720618/

相关文章:

  • 网站logo上传营销型网站制作方案
  • 小说网站静态模板站长工具seo综合查询adc
  • 北京响应式网站做logo那个网站
  • 如何申请免费网站空间刚察县wap网站建设公司
  • 哪里有网站推广软件免费推广seo策略方法
  • 阿里云备案网站 网站名称怎么写京icp备案查询
  • 网站开发岗位思维导图alexa排名
  • 自适应网站建设济南济南网站建设公司
  • 巴州网站建设库尔勒网站建设钟爱网络杭州微信网站制作
  • 52做网站南京市住房城乡建设门户网站
  • 网站开发精品课程贵阳市白云区官方网站
  • seo整站优化服务会计培训班一般收费多少
  • 批量网站访问检测怎么做好手机网站开发
  • 深圳网站建设公司哪家比较好shortcodes wordpress
  • 网站内链越多越好嘛可以做3d电影网站
  • 企业网站需求文档微商引流客源最快的方法
  • 交互式网站备案业务网站在线生成
  • 自建网站百度个人网站如何在百度上做推广
  • 如何安装wordpress模板竞价网站做seo
  • 做论坛网站如何赚钱电子商务营销推广
  • 想要自己做一个网站怎么做济宁百度网站建设
  • 海会网络建设网站wordpress刷不出图片
  • 一个人做商城网站网站推广的几个阶段
  • 做国学类网站合法吗html5教程pdf下载
  • 云南省文化馆网站建设二级域名分发平台
  • 网站版面布局结构图网站收录批量查询
  • 网站开发手机模拟器常州到丹阳
  • 淮南医院网站建设班级网站开发报告
  • 东莞营销网站建设哪家好微信api接口
  • 凡科建站怎么导出网页wordpress视频采集插件