当前位置: 首页 > news >正文

phpcms v9企业网站模板(简洁利于优化)青岛网站制作方法

phpcms v9企业网站模板(简洁利于优化),青岛网站制作方法,数据分析软件,网站标题有什么作用DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台#xff0c;实现各种异构数据源之间高效的数据同步功能。最近#xff0c;阿里云cassandra团队为datax提供了cassandra读写插件#xff0c;进一步丰富了datax支持的数据源#xff0c;可以很方便实现cassandra之间以…DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台实现各种异构数据源之间高效的数据同步功能。最近阿里云cassandra团队为datax提供了cassandra读写插件进一步丰富了datax支持的数据源可以很方便实现cassandra之间以及cassandra与其他数据源之间的数据同步。本文简单介绍如何使用datax同步cassandra的数据针对几种常见的场景给出配置文件示例还提供了提升同步性能的建议和实测的性能数据。 datax快速入门 使用datax同步数据的方法很简单一共只需要三步 1 部署datax。 2 编写同步作业配置文件。 3 运行datax等待同步作业完成。 datax的部署和运行都很简单可以通过datax官方提供的下载地址下载DataX工具包下载后解压至本地某个目录进入bin目录即可运行同步作业 $ cd {YOUR_DATAX_HOME}/bin $ python datax.py {YOUR_JOB.json} 同步作业的配置格式可以参考datax文档。 一个典型的配置文件如下 {job: {content: [{reader: {name: streamreader,parameter: {sliceRecordCount: 10,column: [{type: long,value: 10},{type: string,value: hello你好世界-DataX}]}},writer: {name: streamwriter,parameter: {encoding: UTF-8,print: true}}}],setting: {speed: {channel: 5}}} } 一个同步作业的配置文件主要包括两部分setting包括任务调度的一些配置content描述同步任务的内容里面包含reader插件的配置和writer插件的配置。例如我们需要从mysql同步数据到cassandra那么我们只需要把reader配置为mysqlreaderwriter配置为cassandrawriter并提供相应的插件配置信息即可。在datax项目页面上面可以看到datax支持的插件列表点击对应的链接就可以查看相关插件的文档了解插件需要的配置内容和格式要求。例如cassandra插件的文档可点击如下链接读插件 写插件。 以下列举几种常见的场景。 场景一 cassandra之间的数据同步 最常见的场景是把数据从一个集群同步到另一个集群例如机房整体迁移、上云等。这时需要先手动在目标集群创建好keyspace和表的schema然后使用datax进行同步。作为例子下面的配置文件把数据从cassandra的一个表同步到另一个表 {job: {setting: {speed: {channel: 3}},content: [{reader: {name: cassandrareader,parameter: {host: localhost,port: 9042,useSSL: false,keyspace: test,table: datax_src,column: [id,name]}},writer: {name: cassandrawriter,parameter: {host: localhost,port: 9042,useSSL: false,keyspace: test,table: datax_dst,column: [id,name]}}}]} } 场景二 从mysql同步到cassandra datax支持多种数据源可以很方便做到cassandra和其他数据源之间的数据同步。下面的配置把数据从mysql同步到cassandra {job: {setting: {speed: {channel: 3}},content: [{reader: {name: mysqlreader,parameter: {username: root,password: root,column: [id,name],splitPk: db_id,connection: [{table: [table],jdbcUrl: [jdbc:mysql://127.0.0.1:3306/database]}]}},writer: {name: cassandrawriter,parameter: {host: localhost,port: 9042,useSSL: false,keyspace: test,table: datax_dst,column: [id,name]}}}]} } 场景三 只同步cassandra中的一部分数据 我们在读插件的配置中提供了where关键字可以用来只同步一部分数据。例如对于时序数据等场景定期同步的情况就可以通过增加where的条件来实现只同步增量数据。where条件的格式和cql相同例如where:textcola的作用类似于使用select * from table_name where textcol a进行查询。另外还有allowFiltering关键字配合where使用作用和cql中的ALLOW FILTERING关键字也是相同的。下面给出一个配置的例子 {job: {setting: {speed: {channel: 1}},content: [{reader: {name: cassandrareader,parameter: {host: localhost,port: 9042,useSSL: false,keyspace: test,table: datax_src,column: [deviceId,time,log],where:time 2019-09-25,allowFiltering:true}},writer: {name: cassandrawriter,parameter: {host: localhost,port: 9042,useSSL: false,keyspace: test,table: datax_dst,column: [deviceId,time,log]}}}]} } 提高同步速度 以cassandra之间的数据同步为例。如下这些配置会对数据同步任务的性能产生影响 1并行度 可以通过调大任务的并行度来提高同步速度。这主要通过job.setting.speed.channel从参数来实现。例如下面这个配置的效果是会有10个线程并行执行同步任务。 job: {setting: {speed: {channel: 10}}, ... 需要注意的是cassandra读插件里面切分任务是通过在cql语句中增加token范围条件来实现的所以只有使用RandomPartitioner和Murmur3Partitioner的集群才能够正确切分。如果您的集群使用了其他的Partitionercassandrareader插件会忽略channel配置只用一个线程进行同步。 2batch 可以通过配置batchSize关键字在cassandra写插件里面使用UNLOGGED batch来提高写入速度。但是需要注意cassandra中对batch的使用有一些限制使用这个关键字之前建议先阅读[《简析Cassandra的BATCH操作》(https://yq.aliyun.com/articles/719784?spma2c4e.11155435.0.0.65386b04OYOsvK)一文中关于batch使用限制的内容。 3连接池配置 写插件还提供了连接池相关的配置connectionsPerHost和maxPendingPerConnection。这两个参数的具体含义可以参考[java driver文档]https://docs.datastax.com/en/developer/java-driver/3.7/manual/pooling/。 4一致性配置 读写插件中都提供了consistancyLevel关键字默认的读写一致性级别都是LOCAL_QUORUM。如果您的业务场景里面可以允许两个集群的数据有少量不一致也可以考虑不使用默认一致性级别来提高读写性能例如使用ONE级别来读数据。 性能数据 我们通过一个测试来观察datax同步数据的性能。 服务端使用阿里云cassandra源集群和目标集群均为3节点规格为4CPU 8GB。客户端使用一台ECS规则为4 CPU 16 GB。 首先使用cassandra-stress向源集群写入500w行数据 cassandra-stress write clQUORUM n5000000 -schema replication(factor3) keyspacetest -rate threads300 -col nFIXED(10) sizeFIXED(64) -errors retries32 -mode native cql3 user$USER password$PWD -node $NODE 写入过程的统计数据如下 然后使用datax将这些数据从源集群同步到目标集群。配置文件如下 {job: {setting: {speed: {channel: 10}},content: [{reader: {name: cassandrareader,parameter: {host: 源集群NODE,port: 9042,username:USER,password:PWD,useSSL: false,keyspace: test,table: standard1,column: [key,\C0\,\C1\,\C2\,\C3\,\C4\,\C5\,\C6\,\C7\,\C8\,\C9\]}},writer: {name: cassandrawriter,parameter: {host: 目标集群NODE,port: 9042,username:USER,password:PWD,useSSL: false,keyspace: test,table: standard1,batchSize:6,column: [key,\C0\,\C1\,\C2\,\C3\,\C4\,\C5\,\C6\,\C7\,\C8\,\C9\]}}}]} } 同步过程的统计数据如下 可见datax同步数据的性能和cassandra-stress的性能相当甚至要好一些。 原文链接 本文为云栖社区原创内容未经允许不得转载。
http://www.zqtcl.cn/news/539224/

相关文章:

  • 网站建设法规浙江建设信息港证书查询
  • 影视作品网站开发与设计网站建设教程简笔画
  • 自己可以给公司做网站吗网站建设 用ftp上传文件
  • 电子商务网站开发与管理网站建设的设备
  • 网站建设项目公司沈阳网站关键字优化
  • 可以做淘宝联盟的免费网站优质国外网站
  • 石家庄营销型网站建设公司服装公司网站源码
  • 网站开发的软硬件需求做网站盘锦
  • 创意网站建设排行榜python和php哪个做网站
  • 开锁做网站怎么样榆林网站开发公司
  • 松原市建设局网站苏州网站建设-中国互联
  • 标书制作教程视频网站福田祥菱v1单排
  • 点网站出图片怎么做能看人与动物做的网站
  • 免费开源建站系统源码wordpress公共函数在哪里
  • 西昌市建设工程管理局网站模块化网站开发
  • 无限看片的视频大全免费下载上海网络优化方法
  • 物流公司做网站注重什么问题中国建设银行征信中心网站
  • 教务处网站建设专业做鞋子的网站吗
  • 梦幻创意网站建设成都做网站设计哪家便宜
  • 织梦网站栏目修改教程丝绸之路网站建设意义
  • 如何知道一个网站是谁做的北京装饰公司前十名
  • 杭州网站建设哪个平台好visualstudio 做网站
  • 广州站是哪个站h5建站系统
  • 网站首页网址应该有对应的域名南京高端模板建站
  • 自己做的网站竞价优化怎么做网站流量赚钱吗
  • 人力资源网站建设mip网站模板
  • 太原市住房和城乡建设部网站网站 备案 换空间
  • 怎么做网站备份网站运营数据周报表怎么做
  • 度更新网站做详情页网站
  • 酷炫网站模板wordpress自动发货插件