当前位置: 首页 > news >正文

企业网站建设方案论文图片站wordpress

企业网站建设方案论文,图片站wordpress,345诛仙网站是谁做的,查看网站信息图标怎么做简介#xff1a; 本文将会讲述共享充电宝开创企业来电科技如何基于FlinkHologres构建统一数据服务加速的实时数仓 作者#xff1a;陈健新#xff0c;来电科技数据仓库开发工程师#xff0c;目前专注于负责来电科技大数据平台离线和实时架构的整合。 深圳来电科技有限公司 本文将会讲述共享充电宝开创企业来电科技如何基于FlinkHologres构建统一数据服务加速的实时数仓 作者陈健新来电科技数据仓库开发工程师目前专注于负责来电科技大数据平台离线和实时架构的整合。 深圳来电科技有限公司以下简称“来电科技”是共享充电宝行业开创企业主要业务覆盖充电宝自助租赁、定制商场导航机开发、广告展示设备及广告传播等服务。来电科技拥有业内立体化产品线大中小机柜以及桌面型目前全国超过90%的城市实现业务服务落地注册用户超2亿人实现全场景用户需求。 一、大数据平台介绍 一发展历程 来电科技大数据平台的发展历程主要分为以下三个阶段 1.离散0.X Greenplum 为什么说离散因为之前没有一个统一的大数据平台来支持数据服务而是由每个业务开发线自行取数或者做一些计算并用一个低配版的Greenplum离线服务来维持日常的数据需求。 2.离线1.0 EMR 之后架构升级为离线1.0 EMR这里的EMR指的是阿里云由大数据组成的弹性分布式混合集群服务包括Hadoop、HiveSpark离线计算等常见组件。 阿里云EMR主要解决我们三个痛点一是存储计算资源的水平可扩展二是解决了前面各个业务线异构数据带来的开发维护问题由平台统一清洗入仓三是我们可以建立自己的数仓分层体系划分一个主题域为我们的指标系统打好基础。 3.实时、统一 2.0 FlinkHologres 当前正经历的“FlinkHologres”实时数仓这也是本文分享的核心。它为我们大数据平台带来了两个质的改变一是实时计算二是统一数据服务。基于这两点我们加速知识数据探索促进业务快速发展。 二平台能力 总的概括来说2.0版本的大数据平台提供了以下能力 1数据集成 平台现在支持使用实时或者离线的方式集成业务数据库或业务数据的日志。 2数据开发 平台现已支持基于Spark的离线计算以及基于Flink的实时计算。 3数据服务 数据服务主要由两部分组成一部分是由Impala提供的分析服务和即席分析的能力另一部分是Hologres提供的针对业务数据的交互式分析能力。 4数据应用 同时平台可以直接对接常见的BI工具业务系统也能快速地集成对接。 三取得成就 大数据平台提供的能力给我们带来了不少成就总结为以下五点 1横向扩展 大数据平台的核心就是分布式架构这样我们能够低成本地水平扩展存储或者计算资源。 2资源共享 可以整合所有服务器可用的资源。以前的架构是每个业务部门自己维护一套集群这样会造成一些浪费难以保证可靠性而且运费成本较高现在由平台统一调度。 3数据共享 整合了业务部门所有的业务数据以及业务日志等其他异构数据源数据由平台统一清洗对接。 4服务共享 数据共享之后就由平台统一对外输出服务各个业务线无需自行重复开发就能快速得到平台提供的数据支撑。 5安全保障 由平台提供统一的安全认证等授权机制可以做到对不同人进行不同程度的细粒度授权保证数据安全。 二、企业业务对数据方面的需求 随着业务的快速发展构建统一的实时数仓迫在眉睫综合0.x、1.0版本的平台架构综合业务的现在发展和未来趋势判断构建2.x版本数据平台的需求主要集中在以下几个方面 1实时大屏 实时大屏需要替换旧的准实时大屏采用更可靠、低延迟的技术方案。 2统一数据服务 高性能、高并发和高可用的数据服务成为企业数字化转型统一数据门户的关键需要构建一个统一的数据门户统一对外输出。 3实时数仓 数据时效性在企业运营中的重要性日益凸现需要响应更快更及时。 三、实时数仓和统一数据服务技术方案 一整体技术架构 技术架构主要分为四个部分分别是数据ETL、实时数仓、离线数仓和数据应用。 数据ETL是对业务数据库和业务日志进行实时处理统一使用Flink实时计算实时数仓中数据实时处理后进入Hologres存储与分析业务冷数据存储在Hive离线数仓并同步到Hologres做进一步的数据分析处理由Hologres统一对接常用的 BI工具如Tableau、Quick BI、DataV和业务系统等。二实时数仓数据模型 如上所示实时数仓和离线数仓有一些相似的地方只不过少一些其它层的链路。 第一层是原始数据层数据来源有两种类型一种是业务库的Binlog第二种是服务器的业务日志统一用Kafka作为存储介质。第二层是数据明细层将原始数据层Kafka里面的信息进行ETL提取作为实时明细存储至Kafka。这样做的目的是为了方便下游不同消费者同时订阅同时方便后续应用层的使用。维表数据也是通过Hologres存储来满足下面的数据关联或者条件过滤。第三是数据应用层这里除了打通Hologres还使用了Hologres对接了Hive由Hologres统一提供上层应用服务。 三整体技术架构数据流 下面的数据流图可以具象加深整体架构的规划和数仓模型整体的数据流向。 从图中可以看出主要分为三个模块第一个是集成处理第二个是实时数仓第三块是数据应用。 从数据的流入流出看到主要的核心有两点 第一个核心是Flink的实时计算可以从Kafka获取或者直接Flink cdt读取MySQL Binlog数据或者直接再写回Kafka集群这是一个核心。第二个核心是统一数据服务现在统一数据服务是由Hologres完成避免数据孤岛产生的问题或者一致性难以维护等也加速了离线数据的分析。四、具体实践细节 一大数据技术选型 方案执行分为两个部分实时与服务分析。实时方面我们选择了阿里云Flink全托管的方式它主要有以下几方面优点 1状态管理与容错机制 2Table API和Flink SQL支持 3高吞吐低延迟 4Exactly Once语义支持 5流批一体 6全托管等增值服务。 服务分析方面我们选择了阿里云Hologres交互式分析它带来了几点好处 1极速响应分析 2高并发读写 3计算存储分离 4简单易用。 二实时大屏业务实践落地 上图为业务实时大屏新旧方案对比。 以订单为例旧方案中的订单是从订单从库通过DTS同步到另一个数据库这虽然是实时的但是在计算与处理这方面主要是通过定时任务比如调度间隔时间设为1分钟或者5分钟来完成数据的实时更新而销售层、管理层需要更实时地掌握业务动态因此并不能算真正意义上的实时。除此之外响应慢且不稳定也是很大的问题。 新方案采用的是Flink实时计算Hologres架构。 开发方式完全是可以利用Flink的SQL支持对于我们之前的MySQL计算开发方式可以说是一个无缝的迁移实现快速落地。数据分析和服务统一使用Hologres。还是以订单为例比如今日订单营收额今日订单用户数或者今日订单用户量随着业务多样性的增加可能需要增加城市维度。通过Hologres的分析能力可以完美支撑营收额、订单量、订单用户数以及城市维度的一些指标做快速展示。 三实时数仓和统一数据服务实践落地 以某块业务场景为例比如量级比较大的业务日志日均数据量在TB级别。下面先来分析一下旧方案的痛点 数据时效性差由于数据量较大所以在旧方案中使用了每小时离线调度的策略进行数据计算。但是该方案时效性较差无法满足众多业务产品的实时需求例如硬件系统需要实时知道设备当前状态如告警、错误、空仓等以及时做出相应的决策行动。数据孤岛旧方案使用Tableau对接大量业务报表报表用于分析过去一个小时或者过去一天设备上报有多少数量哪些设备上报出现异常等。针对不同的场景会将之前通过Spark离线计算的数据再备份存储到MySQL或者Redis上。这样就多套系统形成数据孤岛这些数据孤岛对平台维护是一个巨大的挑战。现在通过2.0 FlinkHologres架构可以将业务日志进行改造。 以前TB级别的日志量在Flink高分子低延迟的计算框架下完全没有压力。例如之前的flume HDFS到Spark的一个链路直接被废弃取而代之的是Flink我们只需要维护一个Flink的计算框架即可。设备状态数据采集的时候都是一些非结构的数据需要对数据进行清洗之后再返回Kafka因为消费者可能是多样化的这样可以方便下游的多个消费者同时订阅。在刚才的场景中硬件系统需要高并发、实时查询上千万的设备充电宝状态对服务能力的要求较高。通过Hologres提供高并发读写能力关联状态设备建立主键表可以实时更新状态满足CRM系统对设备充电宝的实时查询。同时在Hologres还会存最近的热点明细数据直接提供对外服务。 四业务支撑效果 通过FlinkHologres的新方案我们支撑了三大场景 1实时大屏 业务层面更高效地迭代多样化需求同时降低了开发、运维维护开销。 2统一数据服务 通过一个HSAP系统来实现服务/分析一体化避免数据孤岛以及一致性、安全性等问题。 3实时数仓 满足企业运营中对于数据时效性越来越高的要求秒级响应。 五、未来规划 伴随着业务的迭代我们未来在大数据平台的规划主要有两点流批一体和完善实时数仓。 现在的大数据平台总的来说还是离线架构和实时架构混合后续会废弃冗余的离线代码架构借助Flink的流批一体统一计算引擎。另外我们目前只迁移了部分业务所以会参考之前已经完善的离线数仓指标系统体系来满足我们现在的实时数仓建设全面迁移到2.0 FlinkHologres架构上。 通过未来的规划我们希望同Flink全托管和Hologres一起共建更加完善的实时数仓但也在此对其有着更近一步的需求 一对Flink全托管的需求 Flink全托管中的SQL编辑器编写FlinkSQL作业很高效方便并且也提供了很多常见的SQL上下游 Connector满足开发需求。但是仍有一些需求希望Flink全托管在后续的迭代中支持 SQL作业版本控制和兼容性监测SQL作业支持Hive3.X集成DataStream作业打包更方便、资源包上传速度更快Session集群模式部署的任务支持自动调优功能。二对Hologres交互式分析的需求 Hologres不仅能够支持高并发地实时写入和查询并且兼容PostgreSQL生态方便接入使用统一数据服务。但是仍有一些需求希望Hologres能在后期迭代中支持 支持热升级操作减少对业务的影响支持数据表备份、支持读写分离支持加速查询阿里云EMR-Hive数仓支持对用户组进行计算资源管理。 原文链接 本文为阿里云原创内容未经允许不得转载。
http://www.zqtcl.cn/news/352930/

相关文章:

  • 看企业网站怎么做到百度秒收WordPress怎么可以上传图片
  • 欧洲手表网站简述jsp网站架构
  • 网站搜索排名优化软件flash xml网站
  • 匀贵网站建设亿级别网站开发注意
  • 怎样架设网站网站优化公司推荐
  • iis网站防盗链济宁官方网站
  • 网址查询地址查询站长之家在海南注册公司需要什么条件
  • 网站开发兼职平台网站建设需要多少钱小江网页设计
  • 最专业的网站建设收费2021没封的网站有人分享吗
  • 站酷设计网站官网入口文字设计wordpress是服务器吗
  • 律师手机网站模板天津做推广的公司
  • 西安市高新区建设规划局网站织梦小说网站模板下载地址
  • 网站开发简历 自我评价网页设计报告论文
  • 如何让网站不被收录不备案 国内网站
  • 站长之家域名买天猫店铺去哪里买
  • asp.net做的网站模板下载万网x3 wordpress
  • 设计网站设计目标天津市建设工程管理总队网站
  • 网站开始怎么做上海响应式网页建设
  • 网站备案 seo免费二维码制作网站
  • 删除网站备案网站建设湖南岚鸿建设
  • 做vlogger的网站有哪些长沙网站排名技巧
  • 媒体营销平台商品seo关键词优化
  • 芜湖先锋网站两学一做wordpress菜单顶部
  • 网站策划怎么样一级域名网站如何申请
  • 烟台高端网站开发网站开发哪个公司好
  • 广州网站定制开发方案南宁网站 制作
  • php做网站需要后台吗郑州建网站十大
  • 网站跳出率是什么意思百度服务
  • 建站 discuz开发者导航
  • 有哪些网站可以做毕业设计外贸网站发外链