当前位置: 首页 > news >正文

网站开发方案案例长春网站建设专业公司

网站开发方案案例,长春网站建设专业公司,手机网站免费做app,烟台网站营销数据入湖Hudi Apache Hudi(简称#xff1a;Hudi)使得您能在hadoop兼容的存储之上存储大量数据#xff0c;同时它还提供两种原语#xff0c;使得除了经典的批处理之外#xff0c;还可以在数据湖上进行流处理。这两种原语分别是#xff1a; Update/Delete记录#xff1a;H…数据入湖Hudi Apache Hudi(简称Hudi)使得您能在hadoop兼容的存储之上存储大量数据同时它还提供两种原语使得除了经典的批处理之外还可以在数据湖上进行流处理。这两种原语分别是 Update/Delete记录Hudi使用细粒度的文件/记录级别索引来支持Update/Delete记录同时还提供写操作的事务保证。查询会处理最后一个提交的快照并基于此输出结果。变更流Hudi对获取数据变更提供了一流的支持可以从给定的时间点获取给定表中已updated/inserted/deleted的所有记录的增量流并解锁新的查询姿势类别。 配置 将hudi相关jar包放在flink安装目录的lib下 hudi-flink1.16-bundle-0.13.0.jar hudi-hadoop-mr-0.13.0.jar hudi-hive-sync-0.13.0.jar 确保/etc/profile配置了hadoop和hive的环境变量 #HADOOP_HOME export HADOOP_HOME/usr/hdp/3.1.5.0-152/hadoop export HADOOP_CONF_DIR/usr/hdp/3.1.5.0-152/hadoop/etc/hadoop export HADOOP_COMMON_HOME/usr/hdp/3.1.5.0-152/hadoop export HADOOP_HDFS_HOME/usr/hdp/3.1.5.0-152/hadoop export HADOOP_YARN_HOME/usr/hdp/3.1.5.0-152/hadoop export HADOOP_MAPRED_HOME/usr/hdp/3.1.5.0-152/hadoop export PATH$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin export HADOOP_CLASSPATHhadoop classpath#HIVE HOME export HIVE_HOME/usr/hdp/3.1.5.0-152/hive export PATH$PATH:$HIVE_HOME/bin:$HIVE_HOME/sbin 测试插入hudi表 set sql-client.execution.result-mode tableau; set execution.checkpointing.interval30sec; SET table.sql-dialectdefault;CREATE TABLE hudi_test(uuid VARCHAR(20) PRIMARY KEY NOT ENFORCED,name VARCHAR(10),age INT,ts TIMESTAMP(3),partition VARCHAR(20) ) PARTITIONED BY (partition) WITH (connector hudi, -- 连接器指定hudipath hdfs://bigdata101:8020/hudi/hudi_test, -- 数据存储地址table.type MERGE_ON_READ -- 表类型默认COPY_ON_WRITE,可选MERGE_ON_READ );INSERT INTO hudi_test VALUES(id1,Danny,23,TIMESTAMP 1970-01-01 00:00:01,par1),(id2,Stephen,33,TIMESTAMP 1970-01-01 00:00:02,par1),(id3,Julian,53,TIMESTAMP 1970-01-01 00:00:03,par2),(id4,Fabian,31,TIMESTAMP 1970-01-01 00:00:04,par2),(id5,Sophia,18,TIMESTAMP 1970-01-01 00:00:05,par3),(id6,Emma,20,TIMESTAMP 1970-01-01 00:00:06,par3),(id7,Bob,44,TIMESTAMP 1970-01-01 00:00:07,par4),(id8,Han,56,TIMESTAMP 1970-01-01 00:00:08,par4); MySql数据写入Hudi表 建hudi表 create table hudi_user(id string not null,name string,birth string,gender string,primary key (id) not enforced ) with (connector hudi,path hdfs://bigdata101:8020/hudi/hudi_user,table.type MERGE_ON_READ,write.option bulk_insert,write.precombine.field id ); 将MySql映射表的数据插入hudi表此时会生成一个flink任务 insert into ods.hudi_user select * from mysql_user; 流式查询 上面的查询方式是非流式查询流式查询会生成一个flink作业并且实时显示数据源变更的数据。 流式查询Streaming Query需要设置read.streaming.enabled true。再设置read.start-commit如果想消费所有数据设置值为earliest。 使用参数如下 参数名称 是否必填 默认值 备注 read.streaming.enabled FALSE FALSE 设置为true开启stream query read.start-commit FALSE the latest commit Instant time的格式为:’yyyyMMddHHmmss’ read.streaming_skip_compaction FALSE FALSE 是否不消费compaction commit消费compaction commit会出现重复数据 clean.retain_commits FALSE 10 当开启change log mode保留的最大commit数量。如果checkpoint interval为5分钟则保留50分钟的change log 建表 create table hudi_user_read_streaming(id int not null ,name string,birth string,gender string,primary key (id) not enforced ) with (connector hudi,path hdfs://bigdata101:8020/hudi/hudi_user,table.type MERGE_ON_READ,write.option bulk_insert,write.precombine.field id,read.streaming.enabled true, -- 默认值false设置为true开启stream queryread.start-commit 20231008134557, -- start-commit之前提交的数据不显示read.streaming.check-interval 4 -- 检查间隔默认60s);insert into hudi_user_read_streaming select * from mysql_user;select * from hudi_user_read_streaming; 此时执行select 语句就会生成一个flink 作业 源端变更数据会实时展示出来 系列文章 Fink CDC数据同步一环境部署https://blog.csdn.net/weixin_44586883/article/details/136017355?spm1001.2014.3001.5502​​​​​​​Fink CDC数据同步二MySQL数据同步https://blog.csdn.net/weixin_44586883/article/details/136017472?spm1001.2014.3001.5501Fink CDC数据同步三Flink集成Hivehttps://blog.csdn.net/weixin_44586883/article/details/136017571?spm1001.2014.3001.5501Fink CDC数据同步四Mysql数据同步到Kafkahttps://blog.csdn.net/weixin_44586883/article/details/136023747?spm1001.2014.3001.5501Fink CDC数据同步五Kafka数据同步Hivehttps://blog.csdn.net/weixin_44586883/article/details/136023837?spm1001.2014.3001.5501 Fink CDC数据同步六数据入湖Hudihttps://blog.csdn.net/weixin_44586883/article/details/136023939?spm1001.2014.3001.5502
http://www.zqtcl.cn/news/324770/

相关文章:

  • 漳诈网站建设免费的企业网站建设
  • 广州番禺区有什么好玩的地方优化软件有哪些
  • 面包机做面包网站wordpress获取用户注册时间
  • 福州网站建设个人兼职泰州seo排名扣费
  • 泰安北京网站建设公司个人自我介绍网页
  • 网站建设适应全屏如何自动深圳市哪里最繁华
  • 杭州网站推广公司阿里云wordpress 安装目录
  • 厦门优秀网站建设app项目开发流程
  • 工作设计室网站海外网站代理
  • 室内设计官方网站没网站怎么做cpa
  • 哪个网站做欧洲旅游攻略好wordpress编辑器字体大小
  • aspcms 手机网站wordpress 刷浏览量
  • dw网站首页的导航怎么做网站建设企业建站模板
  • 平台型网站建设网站关键词优化seo
  • 齿轮机械东莞网站建设技术支持热搜词排行榜关键词
  • 河南专业做网站网站推广优化c重庆
  • 温州网站建设钱建设工程公司网站
  • 做笑话网站全国大学生职业生涯规划大赛官网
  • 便宜购 网站建设平台推广引流怎么做
  • 怎么用记事本做钓鱼网站制作公司网页的步骤
  • 机械设备东莞网站建设智慧软文网站
  • 个人网站需不需要搭建服务器蘑菇短视频2023版特色功能
  • 网站建设公司是什么东兰县建设局网站
  • 网站优化排名方案软件发布网
  • 企业网站开发价钱低企业策划案例
  • 网站建设帐号网站导入页欣赏
  • ftp 迁移 网站建筑公司商标logo设计
  • 没钱怎么做网站wordpress 链接修改插件
  • 建一个网站需要多久建设银行官网登录入口
  • 贸易公司网站制作邢台哪里做网站