当前位置: 首页 > news >正文

教育网站框架模板黔西南州网站建设公司

教育网站框架模板,黔西南州网站建设公司,学做甜点的网站,网站后台的数据库怎么做介绍场景建表明细模型聚合模型更新模型主键模型 介绍 StarRocks是一款经过业界检验、现代化#xff0c;面向多种数据分析场景的、兼容MySQL协议的、高性能分布式关系型分析数据库。 StarRocks充分吸收关系型 OLAP 数据库和分布式存储系统在大数据时代的优秀研究成果#xff… 介绍场景建表明细模型聚合模型更新模型主键模型 介绍 StarRocks是一款经过业界检验、现代化面向多种数据分析场景的、兼容MySQL协议的、高性能分布式关系型分析数据库。 StarRocks充分吸收关系型 OLAP 数据库和分布式存储系统在大数据时代的优秀研究成果并在业界实践的基础上进一步改进优化架构升级和添加新功能形成了全新的企业级产品。 StarRocks致力于满足企业用户的多种数据分析场景支持多种数据模型(明细模型、聚合模型、更新模型、主键模型) 多种导入方式 可整合和接入多种现有系统(Spark、Flink、Hive、ElasticSearch、Iceberg、Hudi等)。 StarRocks兼容MySQL协议可使用MySQL客户端和常用BI工具对接StarRocks来进行数据分析。 StarRocks采用分布式架构对table进行水平划分并以多副本存储。集群规模可以灵活伸缩能够支持10PB级别的数据分析支持MPP并行加速计算支持多副本具有弹性容错能力。 StarRocks采用关系模型使用严格的数据类型使用列式存储引擎通过编码和压缩技术降低读写放大。使用向量化执行方式充分挖掘多核CPU的并行计算能力从而显著提升查询性能。 场景 建表 StarRocks 共有四类数据模型明细模型、聚合模型、更新模型、主键模型。 分别适用于不同的业务场景。 建表语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] [database.]table_name (column_definition1[, column_definition2, ...] [, index_definition1[, index_definition2,]]) [ENGINE [olap|mysql|elasticsearch|hive]] [key_desc (key1,key2...)] [COMMENT table comment]; [partition_desc] [distribution_desc] [rollup_index][PROPERTIES (keyvalue, ...)] [BROKER PROPERTIES (keyvalue, ...)]duplicate key 排序字段 数据按照指定的key列进行排序创建时应选择经常过滤的列放在key列提高查询效率。 partition_desc分区字段 通常选取常用的日期过滤字段作为分区字段查询时可以进行分区裁剪减少数据扫描量。实际应用中用户一般选取时间列作为分区键具体划分的粒度视数据量而定单个分区原始数据量建议维持在100G以内。 distribution_desc分桶字段 选取基数较高的字段做为分桶字段可以选择多个列进行分桶。尽量将数据打散避免出现数据倾斜。 把经常需要作为查询过滤条件的列作为分桶键可以在查询时裁剪掉大量无关分桶。但如果只利用该分桶键数据分布可能会出现严重的数据倾斜, 导致系统局部的性能瓶颈。这个时候用户需要适当调整分桶的字段以将数据打散利用分布式集群的整体并发性能提高吞吐。 分桶的数据的压缩方式使用的是Lz4。建议压缩后磁盘上每个分桶数据文件大小在100MB-1GB左右。这种模式在多数情况下足以满足业务需求。 对于StarRocks而言分区和分桶的选择是非常关键的。在建表时选择好的分区分桶列可以有效提高集群整体性能。当然在使用过程中也需考虑业务情况根据业务情况进行调整。 以下是针对特殊应用场景下对分区和分桶选择的一些建议 数据倾斜业务方如果确定数据有很大程度的倾斜那么建议采用多列组合的方式进行数据分桶而不是只单独采用倾斜度大的列做分桶。高并发分区和分桶应该尽量覆盖查询语句所带的条件这样可以有效减少扫描数据提高并发。高吞吐尽量把数据打散让集群以更高的并发扫描数据完成相应计算。 明细模型 一般用明细模型来处理的场景有如下特点  需要保留原始的数据例如原始日志原始操作记录等来进行分析  查询方式灵活, 不局限于预先定义的分析方式, 传统的预聚合方式难以命中;  数据更新不频繁。导入数据的来源一般为日志数据或者是时序数据, 以追加写为主要特点, 数据产生后就不会发生太多变化。 建议排序列使用shortkey index, 可快速过滤数据. 用户可以考虑将过滤条件中频繁使用的维度列的定义放置其他列的定义之前这样能够提升查询速度 注意明细模型中, 可以指定部分的维度列为排序键; 而聚合模型和更新模型中, 排序键只能是全体维度列。 聚合模型 采用聚合模型来分析的场景具有如下特点  业务方进行的查询为汇总类查询比如sum、count、max等类型的查询  不需要召回原始的明细数据  老数据不会被频繁更新只会追加新数据。 聚合表中数据会分批次多次导入每次导入会形成一个版本。相同排序键的数据行聚合有三种触发方式:  数据导入时数据落盘前的聚合  数据落盘后后台的多版本异步聚合  数据查询时多版本多路归并聚合。 注意数据查询时指标列采用先聚合后过滤的方式把没必有做指标的列存储为维度列。 更新模型 适合更新模型的场景特点 已经写入的数据有大量的更新需求 需要进行实时数据分析。 注意 1、导入数据时需要将所有字段补全才能够完成更新操作。 2、对于更新模型的数据读取需要在查询时完成多版本合并当版本过多时会导致查询性能降低。所以在向更新模型导入数据时应该适当降低导入频率从而提升查询性能。 3、将经常过滤字段且不会被修改的字段放在主键上, 能够在合并之前就将数据过滤掉从而提升查询性能。 4、避免放置过多的主键字段以免降低查询性能。如果某个字段只是偶尔会作为查询中的过滤条件存在不需要放在主键中。 主键模型 相较更新模型主键模型Primary Key可以更好地支持实时/频繁更新的功能。该类型的表要求有唯一的主键支持对表中的行按主键进行更新和删除操作。 由于存储引擎会为主键建立索引而在导入数据时会把主键索引加载在内存中所以主键模型对内存的要求比较高还不适合主键特别多的场景。目前primary主键存储在内存中为防止滥用造成内存占满限制主键字段长度全部加起来编码后不能超过127字节。目前比较适合的两个场景是 1、数据有冷热特征即最近几天的热数据才经常被修改老的冷数据很少被修改。典型的例子如MySQL订单表实时同步到StarRocks中提供分析查询。其中数据按天分区对订单的修改集中在最近几天新创建的订单老的订单完成后就不再更新因此导入时其主键索引就不会加载也就不会占用内存内存中仅会加载最近几天的索引。 2、大宽表(数百到数千列)。主键只占整个数据的很小一部分其内存开销比较低。比如用户状态/画像表虽然列非常多但总的用户数不大(千万-亿级别)主键索引内存占用相对可控。 注意 主键列仅支持类型: boolean, tinyint, smallint, int, bigint, largeint, string/varchar, date, datetime, 不允许NULL。 分区列(partition)、分桶列(bucket)必须在主键列中。 1、和更新模型不同主键模型允许为非主键列创建bitmap等索引注意需要建表时指定。 2、由于其列值可能会更新主键模型目前还不支持rollup index和物化视图。暂不支持使用ALTER TABLE修改列类型。 3、在设计表时应尽量减少主键的列数和大小以节约内存建议使用int/bigint等占用空间少的类型。暂时不建议使用varchar。建议提前根据表的行数和主键列类型来预估内存使用量避免出现OOM。内存估算举例 a. 假设表的主键为: dt date (4byte), id bigint(8byte) 12byte b. 假设热数据有1000W行, 存储3副本 c. 则内存占用: (12 9(每行固定开销) ) * 1000W * 3 * 1.5(hash表平均额外开销) 945M 4、目前主键模型只支持整行更新还不支持部分列更新。
http://www.zqtcl.cn/news/633953/

相关文章:

  • 怎样做视频上网站赚钱推广计划怎么做推广是什么
  • 台州外贸网站建设做网站开发一般用什么语言
  • 咸阳做网站的公司漯河网做网站
  • 红酒网站模板下载做网站加推广
  • 免费网站服务器域名在线手机网站建设
  • 北京网站ui设计公司在线设计装修
  • 大学生网站作业北京网站优化技术
  • 静安区网站开发固原网络推广
  • WordPress网站修改志成网站设计制作
  • 做网站需要注意的昭通网站seo优化
  • 站群软件lanyun网站开发
  • 固始网站制作html美食网页设计源码
  • 软件研发过程管理岳阳seo
  • 舟山网站建设代理门户网站建设流程
  • 天水建设银行网站网站建设方案免费下载
  • 长城宽带魔方优化大师官网下载
  • 宁波建设工程主管部门网站长沙网站维护
  • 网站推广机构我的世界怎么做赞助网站
  • 做网站的公司图sae wordpress storage
  • 做塑料的网站有哪些东道设计公司待遇如何
  • 烟台做网站哪家好网站加速器下载
  • 哪些网站是响应式河北省住房和城乡建设厅信用网站
  • 彩票网站html模板新闻html网页设计代码范文
  • 建网站视频怎么建网站卖产品
  • 做翻糖的网站深圳做购物网站
  • 国外界面设计网站海淘网站
  • 全国住房城乡建设厅网站wordpress 宽版
  • 网站建设实训意见中国建设人才信息网站
  • 如何给网站做301跳转中国做机床的公司网站
  • 网站建设课程体系济南建站详情