当前位置：首页 > news >正文

学校校园网站大牌网站设计

news 2025/11/14 15:35:19

学校校园网站,大牌网站设计,wordpress文章标签只调用一个,像天猫网站怎么做本文作者#xff1a;58同城架构师刘春雷一、背景介绍 58同城作为中国互联网生活服务领域的领军者#xff0c;其平台规模居国内之首#xff0c;涵盖了包括车辆交易、房产服务、人才招聘、本地生活服务以及金融等多元化的业务场景。因其业务的广泛性和多样性#xff0c;我… 本文作者58同城架构师刘春雷一、背景介绍 58同城作为中国互联网生活服务领域的领军者其平台规模居国内之首涵盖了包括车辆交易、房产服务、人才招聘、本地生活服务以及金融等多元化的业务场景。因其业务的广泛性和多样性我们发现单一的数据库难以满足所有场景的独特需求。例如金融业务对数据的稳定可靠性有严格标准而直播业务则对高并发处理能力有极高要求数据分析业务则更侧重于存储成本优化和AP性能提升。因此我们进行了深入的数据库调研涵盖了OceanBase、TiDB、StarRocks等多种数据库以期找到能够支撑我们复杂多变业务场景的最佳数据库解决方案。引入OceanBase主要是为了满足TP业务的降本增效需求以及解决核心业务分库分表的痛点。OceanBase经历过大量金融核心场景的打磨在核心业务场景选型中占据极大优势。二、技术选型在调研时我们考察了 OceanBase 的一些特性另我们最看重的特性包括多租户及资源隔离、高压缩率、优秀的查询性能。多租户我们有很多业务需要部署大量的数据库实例通常一个业务会占用一个数据库实例资源保证业务之间互相不影响。这就可能造成严重的资源碎片化在某个关键业务或关键客户需求激增时难以灵活、弹性扩展性能和可用性难以保证。比如核心业务大数据量级我们仍然采用MySQL分库分表的架构在业务洪流高峰时没有很好的弹性扩展手段只能从应用层去做流量保护来保证业务和数据库的稳定性。由于数据库资源的碎片化部署单个实例为了保证一定的性能弹性空间往往会多划出一部分容量作为短时间内请求增长的预备资源。这种资源预留在整体业务视角来看实际上造成了巨大的资源浪费大大抬高了我们的资源成本。而且大量的数据库实例同时带来的还有管理效率的降低数据库相关团队难以对成百甚至上千的实例进行精细化管理出现故障、抖动等事件时恢复时效差对整体资源水位的把控难以全局掌控又抬高了我们的管理成本。 OceanBase 的优势在于其多租户架构可以将多个不同业务的数据库实例集中整合提升资源利用率同时基于 Paxos 的多副本机制保证每个资源单元的高可用能力。这样就可以为不同业务提供不同规格的实例保证资源隔离性的同时降低成本。我们认为OceanBase多租户特性对58同城业务最大的帮助体现在以下三个方面。 · 多租户池化 OceanBase 集群原生支持多租户下的资源隔离和虚拟化一个集群中可以部署上百个数据库租户租户间的数据和资源互相隔离计算资源原地升级规格配置秒级生效。 · 多维度弹性基于 OceanBase 的单机分布式一体化式架构可以实现单机原地升级配置、多机弹性扩展多机流量均衡多个维度的扩容操作并且扩容对上层应用透明。对于涉及数据迁移的扩展无需人工值守可以自动完成迁移及多维度数据校验。 · 统一管理把多个零散的实例统一部署在 OceanBase 后运维管理的复杂度会大大降低DBA 从之前管理数十个分散实例到目前管理一个 OceanBase 集群将负载、告警、调优全部统一至集群级别常规故障能够自动恢复大幅提升了业务支撑效率和应急响应能力。高压缩率因为 OceanBase 的压缩率极高所以我们也做了一个相对比较详细的调研。 OceanBase 支持不感知数据特征的通用压缩 ( compression ) 和感知数据特征并按列进行压缩的数据编码 ( encoding )。这两种压缩方式是正交的也就是说可以对一个数据块先进行编码然后再进行通用压缩来实现更高的压缩率。通用压缩是在不感知微块内部数据格式的前提下将整个微块通过通用压缩算法进行压缩依赖通用压缩算法来检测并消除微块中的数据冗余。目前 OceanBase 支持选择 zlib、snappy、zstd、lz4 等算法进行通用压缩可以根据表的应用场景通过 DDL 对指定表的通用压缩算法进行配置和变更。编码压缩的算法比较复杂OceanBase 根据实际业务场景需求实现了单列数据的字典编码、 RLE 编码、常量编码、数值差值编码、定长字符串差值编码同时还引入了列间等值编码和列间子串编码能够分别对数据库中一列数据或几列数据间可能产生的不同类型数据冗余进行压缩。最后还可以再利用 bit-packing 编码、字符串 HEX 编码等对已经编码过的数据再进行一层编码进一步去除冗余的信息。综上 OceanBase 相当于做了三层编码压缩列内编码、列间编码以及bit-packing/hex 编码。下面这两张图就分别是 bit-packing 编码和 hex 编码的示意图。 bit-packing 编码 HEX 编码此外在编码压缩这一层还使用了自适应压缩技术根据真实的数据特征自动选择最优的编码算法。因为数据编码的压缩效果不仅与表的 schema 相关同时还与数据的分布微块内数据值域等数据本身的特征相关这也就意味着难以在用户设计表数据模型时指定列编码来实现最好的压缩效果。为了减轻用户使用负担也为了实现更好的压缩效果OceanBase 支持在合并过程中分析数据类型、值域、NDV 等特征结合合并任务中上一个微块对应列选择的编码算法和压缩率自适应地探测合适的编码对同一列在不同数据块中支持使用不同的算法来进行编码。良好的查询性能因为OceanBase有着极高的数据压缩率所以我们特别关心 OceanBase 能否同时支持良好的查询性能。事实上 OceanBase 在设计数据编码格式时也考虑到了对查询性能带来的影响我们了解到其中几种比较关键的提升查询性能的方法。 1. 行级粒度数据随机访问。通用压缩中如果要访问一个压缩块中的部分数据通常需要将整个数据块解压后访问某些分析型系统的数据编码大多面向扫描场景而针对点查场景的数据编码较少。因此OceanBase采用了在访问某一行数据时需要对相邻数据行或数据块内读取行之前所有行进行解码计算的数据编码的格式如 PFor 等差值编码。如果 OceanBase 需要更好地支持事务型负载就意味着要支持相对更高效的点查因此 OceanBase 在设计数据编码格式时保证了编码后的数据能够以行为粒度随机访问。也就是在对某一行点查时只需要对这一行相关的元数据进行访问并解码减小了随机点查时的计算放大。同时对于编码格式的微块解码数据所需要的所有元数据都存储在微块内让数据微块有自解释的能力也在解码时提供了更好的内存局部性。 2. 计算下推。由于编码数据中会存储有序字典、 null bitmap 、常量等可以描述数据分布的元数据在扫描数据时可以利用这些数据对于部分过滤聚合算子的执行过程进行优化实现在未解码的数据上直接进行计算。 OceanBase 对分析处理能力进行了大幅优化一是将聚合与过滤计算下推到存储层执行在后面落地实践的性能测试部分还会再提到二是在向量化引擎中利用编码数据的列存特征进行向量化的批量解码等特性。在查询时充分利用了编码元数据和编码数据列存储的局部性在编码数据上直接进行计算大幅提高了下推算子的执行效率和向量化引擎中的数据解码效率。存储层的查询优化除了上面提到的行级数据随机访问和计算下推之外还有 block cache、row cache、缓存解码器等手段。当然对于查询性能优化方面起到更大作用的还是 SQL 层优化而非存储层优化不过我们暂时对 SQL 层的优化器和执行器还没有深入调研这里就偷懒略去不提了。而我们OceanBase的查询性能进行了测试。例如最基础的 count 聚合测试通常 DBA 习惯通过 count 看这张表有多少数据相同的一张表在 MySQL 里算 count 聚合要执行一千多秒在 OceanBase 中只需要 0.03 秒。这是因为 OceanBase 的 scalar group by 会下压到存储层进行计算可以直接利用存储层微块内部已经维护好的聚合信息让查询性能取得数量级的提升对于我们最常用的聚合函数 count/min/max/sum 都是支持的。比如在下面这个执行计划中可以看到1 号算子存储层 table scan 吐行的时候吐出来的数据就已经是 T_FUN_COUNT(t1.c1) 了上层的 0 号算子 group by 就只需要再对存储层吐上来的各个微块的 count 信息求一个 count 的 sum 就好了可以在计划里看到它确实也是这样做的 T_FUN_COUNT_SUM(T_FUN_COUNT(t1.c1))。 explain select count(c1) from t1;| |ID|OPERATOR |NAME|EST. ROWS|COST|----------------------------------------|0 |SCALAR GROUP BY| |1 |2 ||1 | TABLE SCAN |t1 |1 |2 |Outputs filters:-------------------------------------0 - output([T_FUN_COUNT_SUM(T_FUN_COUNT(t1.c1))]), filter(nil), rowset256,group(nil), agg_func([T_FUN_COUNT_SUM(T_FUN_COUNT(t1.c1))])1 - output([T_FUN_COUNT(t1.c1)]), filter(nil), rowset256,access([t1.c1]), partitions(p0) 除此以外我们还测试了一些常用查询比如查指定日期、指定集群的表大小的 top 10在 MySQL 里是 0.04 秒在 OceanBase 是 0.01 秒查指定日期的表大小的 top 10MySQL 里是 108 秒在 OceanBase 是 28 秒。各种 SQL 的查询效率都会显著提升对于最常用的聚合更有数量级的性能提升。三、落地实践目前我们优先将DBA使用的线上数据统计信息库迁移到了OceanBase进行运维和使用经验的积累后续逐步将其他业务迁移到 OceanBase。我们使用OceanBase4.2.1版本搭建了一套6个节点的集群机器配置如下表。配置具体CPU64核 Intel(R) Xeon(R) Gold 6326 CPU 2.90GHz内存512G磁盘SSD NVME 3.5T 迁移到OceanBase的库存储了一些其他业务库的统计信息比如存储 TiDB 业务库的实时慢 SQL、TiDB 业务库天级别慢 SQL、MySQL 业务库中表的基本信息和 SQL 的执行信息、Redis 业务库的链接信息等。因为有些表的存储量很大一张单表能达到 1.5TB如果将大表放在 MySQL 中查询分析时就会有明显的性能问题所以我们之前大多数统计信息库都选择放在 TiDB 的不同集群中比如线上所有 TiDB 集群的实时慢 SQL放到一套 TiDB 集群里 TiDB 天级别的所有的慢 SQL放到另一套 TiDB 集群里。但是这些 TiDB 集群特别耗资源原来每个业务的统计信息都对应一个 TiDB 集群每个 TiDB 集群基本都需要 2 ~3 个 TiDB server外加 3 个 PD每台 server 都是 8 核 16G 虚拟机每台 TiKV 是 40 核 256G 物理机。租户名业务原集群情况已分配 CPU(核)已分配内存(G)已分配日志盘已使用数据盘sys系统租户64848GB620MBt_tidb_realtime_slowTiDB 实时慢 SQLTiDB集群 2 个 TiDB(8核16G300G虚拟机) 3个 PD(8核16G300G虚拟机) 3个TiKV(40核192G3.5T物理机)48144300GB295.75GBt_tidb_slowTiDB 天级别慢 SQLTiDB集群 3 个 TiDB(8核16G300G虚拟机) 3个 PD(8核16G300G虚拟机) 3个TiKV(40核256G3.5T物理机)72192300GB258.54GBt_table_statisticsMySQL 表基本信息MySQL集群表 1.5T迁移后集群不能下线60192300GB178.26GBt_redisclientinfoRedis 的连接信息TiDB集群库17G 迁移后集群不能下线48192300GB466MBt_ps_statsMySQL 执行 SQL 信息MySQL集群 3个节点(48核256G物理机) 历史数据废弃新写到OB 迁移后集群可以下线72192300GB779.05GB 如今我们统一把上表的所有集群统一迁移到一套 OceanBase 集群上不同业务的统计数据按照租户进行拆分。这样不仅利用 OceanBase 的高压缩比节省了存储空间大约节省50%还能把节点数量也从20个缩减到6个机器成本缩减了5倍。此外如果考虑到后续在 HTAP 场景中上线OceanBase替换现有的 TiKV 和 TiFlash 两套存储引擎成本将节省更多。回到上线流程我们使用OMS将一张 21 亿行的表从 MySQL 迁移到 OceanBase 迁移前的 MySQL 磁盘信息如下表。分类磁盘占用量逻辑数据大小856.19G逻辑索引大小591.45G碎片大小0.01G实际文件大小1.5T 由于OMS可以选择迁移模式我们没有选择高速迁移而是选择平稳迁移模式耗费 11 小时完成迁移大约每秒迁移五万多行数据。迁移后 OMS 会进行索引创建我们选择单线程创建4个索引耗费7个小时。官方建议选择多线程方式可以更加快速地并行创建索引。迁移完成后会达到磁盘占用量的顶峰 259GB全量合并后数据约 157GB 。也就是说MySQL单副本1.5TB大表迁移到OceanBase后是双副本 155GB从单副本来看的话应该只有 80G 左右。整体的压缩率让我们很震惊1.5T 变成 80G压缩率达到95%。分类OceanBase实际磁盘占用量迁移前2.88G迁移后(高峰)269.57G迁移后(10小时后,全量合并)164.32G真实OceanBase迁移数据大小161.44G(双副本),单副本80G对比MySQL1.5T单副本数据压缩率MySQL 1.5T-OceanBase 80G压缩率95% 下图是迁移前后的存储成本和查询性能对比。分类迁移前 MySQL迁移后 OceanBase比值 MySQL / OceanBase磁盘占用量1.5TB81.64G 单副本18.37查询耗时表总条数select count(*)1013.75s0.03s33791查询耗时计算指定日期、指定集群的表大小top100.04s0.01s4查询耗时计算指定日期的表大小top10108.88s28.75s3.78 四、未来使用OceanBase替换MySQL、TiDB、StarRocks 从关注OceanBase到迁移上线我们用了6个月时间应用OceanBase后最大的收获包括如下三方面。首先OceanBase 的多租户能力支持我们把多个 MySQL 和 TiDB 的实例整合到一套 OceanBase 集群中进行统一管理租户间资源隔离还可按需弹性扩展在简化运维的同时有效提高资源利用率。其次基于 OceanBase 的高级压缩技术在保证性能的同时数据存储空间相比原先能够节省三到五倍左右一些场景甚至可以节省将近二十倍。同等硬件投入的前提下可以让我们存储更多数据。此外在数据迁移方面因为 OceanBase 兼容 MySQL 协议与语法所以我们可以利用 OMS 做到平滑迁移大幅降低了业务迁移和改造成本。OMS 通过全量迁移、增量迁移、反向迁移保障数据迁过程中的强一致还提供了数据同步到 Kafka 等消息队列中的能力。综合考虑 OceanBase 高压缩率带来的存储成本下降、各种内核实现优化带来的查询性能提升以及超级好用的数据迁移工具 OMS我们计划将后续大量 MySQL 的上百 GB 甚至上 T 级别的大表迁移至 OceanBase 。除了 MySQL 场景以外我们还尝试将资源占用极高的 TiDB 也逐步替换成 OceanBase以节省机器资源和存储资源。测试表明OceanBase 查询性能也超越 TiDB 3~4 倍完全满足我们的业务需求。此外我们将对 OceanBase 的 AP 能力进行深入调研和测试使用 OceanBase 替换 StarRocks实现一套引擎同时处理 OLTP 业务和 OLAP 请求降低运维复杂度和运维成本。

查看全文

http://www.zqtcl.cn/news/867545/