当前位置: 首页 > news >正文

做专利费减是哪个网站医院工程建设网站

做专利费减是哪个网站,医院工程建设网站,调用wordpress编辑器,常用微信小程序api简述 CloudCanal 最近对于全周期数据流动进行了初步探索#xff0c;打通了Hive 目标端的实时同步#xff0c;为实时数仓的构建提供了支持#xff0c;这篇文章简要做下分享。 基于临时表的增量合并方式基于 HDFS 文件写入方式临时表统一 Schema任务级的临时表 基于临时表的…简述 CloudCanal 最近对于全周期数据流动进行了初步探索打通了Hive 目标端的实时同步为实时数仓的构建提供了支持这篇文章简要做下分享。 基于临时表的增量合并方式基于 HDFS 文件写入方式临时表统一 Schema任务级的临时表 基于临时表的增量合并方式 Hive 目标端写入方式和 Doris 相似需要在目标表上额外添加一个 __op0UPSERT1DELETE字段作为标记位实际写入时会先将源端的变更先写入临时表最终合并到实际表中。 CloudCanal 的设计核心在于每个同步表对应两张临时表通过交替合并的方式确保在一张临时表进行合并时另一张能够接收新变更从而提升同步效率和并发性。 Hive 提供了两种合并方式INSERT OVERWRITE所有版本均支持MERGE INTOHive 2.2.0 之后支持且需要是 ACID 表 -- INSERT OVERWRITE 语法 INSERT OVERWRITE [LOCAL] DIRECTORY directory1[ROW FORMAT row_format] [STORED AS file_format] SELECT ... FROM ...-- MERGE INTO 语法 MERGE INTO target table AS T USING source expression / table AS S ON boolean expression1WHEN MATCHED [AND boolean expression2] THEN UPDATE SET set clause listWHEN MATCHED [AND boolean expression3] THEN DELETEWHEN NOT MATCHED [AND boolean expression4] THEN INSERT VALUESvalue list任务级的临时表 在大数据场景下多表汇聚的情况十分普遍CloudCanal 在构建临时表时利用源端的订阅 Schema Table 信息创建不同的临时表。 通过这种方式无论是相同或不同的任务、相同或不同的 Schema源端、相同或不同的 Table源端都能将数据写入不同的临时表最终合并到同一个实际表中互相之间不会产生影响。 基于 HDFS 文件的写入方式 Hive 是建立在 Hadoop 体系上的数据仓库而实际的数据存储在 HDFS 中。 如果直接通过 HQL 将增量数据写入 HiveHive 会将 HQL 转化为 MR Job由于每一个 MR Job 处理速度相对较慢这将导致增量性能极其差。 CloudCanal 在进行数据写入的时候选择的是绕过 Hive 这层直接写入 HDFS 文件系统。 目前支持 HDFS 文件格式Text、Orc、Parquet。 临时表统一 Schema 基于临时表构建的增量方式如果临时表分散在不同的 Schema 中将给 DBA 的管理带来不便。 为了简化管理CloudCanal 将所有临时表构建在统一的 Schema 下并允许用户自定义其临时表路径。 示例 准备 CloudCanal 下载安装 CloudCanal 私有部署版本 添加数据源 数据源管理 - 添加数据源 添加 MySQL、Hive 创建同步任务 选择源端 MySQL 和目标端 Hive同步的 Schema 和 Table高级参数含义参考 MySQL - Hive 任务创建第四步点击 配置分区键 选择 分区键类型 以及 HDFS 文件类型 点击下一步创建任务即可 未来方向 文件 Append 写入方式 目前 HDFS 文件写入处理是每批数据写到一个文件中并不会处理历史数据文件更加合理的方式是基于历史文件进行 Append 追加写满之后再切换为下一个文件。 提供参数优化 MR 处理速度 目前 CloudCanal 并没有提供参数入口用于优化 MR 处理速度而是自动使用用户所配置的未来 CloudCanal 将提供一个参数入口用于用户自定义每一个 MR Job 的处理并行度等优化参数。 支持 MERGE INTO 合并方式 目前 CloudCanal 仅支持 INSERT OVERWRITE 的合并方式这种方式更为通用而 MERGE INTO 此种合并方式速度更快但限制较多未来 CloudCanal 也会支持此种合并方式。 支持自定义分区键 目前 CloudCanal 仅支持按照日期选择分区键目前暂时不支持更多分区键的选择未来 CloudCanal 会提供更多分区键的选择。 总结 本篇文章简单介绍 CloudCanal 对于全生命周期的数据流动的初步探索并通过 MySQL - Hive 示例介绍其使用。
http://www.zqtcl.cn/news/549861/

相关文章:

  • 教育网站 php网络服务公司
  • net域名做网站怎么样建站公司 转型经验
  • 赣州网站建设哪家公司好上海市建设安全协会网站
  • 网站排名优化软件有哪些西宁网站建设官网
  • 支付宝手机网站签约迪庆公司网站开发方法
  • 唐山网站关键词优化网站开发公司推荐
  • 福建响应式网站制作市工商局网站建设情况
  • 深圳网站运营托管罗伯特清崎说的网络营销是什么
  • 太仓市质监站网址百度关键字推广费用
  • 为您打造高端品牌网站pageadmin wordpress
  • 中小型网站建设的基本流程简约网站欣赏
  • 设备上哪个网站做外贸推广网络服务类型及其所采用的网络协议
  • 学习前端开发的网站动漫设计属于什么大类
  • 十堰秦楚网 十堰新闻门户网站报修网站模板
  • 家居小程序源码下载自动seo系统
  • 动态效果的网站建设技术老闵行是指哪里
  • 电商网站开发面临的技术问题做闪图的网站
  • 怎么查看网站开发语言的类型东莞哪些地方是风险区
  • 不用购买域名做网站广州网站建设培训学校
  • 城市轨道建设规范下载网站古网站典模板
  • 关于实验室建设的英文网站深圳企业网站制作公司怎样
  • wordpress全站背景音乐中山网站搜索排名
  • 搭建网站的过程透明主题wordpress
  • 丰台网站建设公司电话深圳微信商城网站设计公司
  • 做淘宝要用的网站吗上海微信网站
  • 佛山高端网站制作公司wordpress 发送邮件插件
  • 类似站酷的设计类网站网站建设需要待摊吗
  • 用php做视频网站在学做网站还不知道买什么好
  • wordpress培训类网站网站建设 好
  • 网站开发需要2个月吗网站建设案例精粹