当前位置：首页 > news >正文

网站seo内容优化wap网站什么意思

news 2025/11/14 20:53:25

网站seo内容优化,wap网站什么意思,母婴网站建设的与功能模块,义乌外贸前言在互联网和大数据的背景下#xff0c;越来越多的网站、应用系统需要支撑海量数据存储、高并发请求、高可用、高可扩展性等特性要求。传统的关系型数据库已经难以应对类似的需求#xff0c;各种各样的 NoSQL#xff08;Not Only SQL#xff09;数据库因此而产生。…前言在互联网和大数据的背景下越来越多的网站、应用系统需要支撑海量数据存储、高并发请求、高可用、高可扩展性等特性要求。传统的关系型数据库已经难以应对类似的需求各种各样的 NoSQLNot Only SQL数据库因此而产生。本文将分析传统数据库的存在的问题以及几类 NoSQL 如何解决这些问题。在不同的业务场景下作出正确的数据存储技术选型。正文 1. 传统数据库缺点缺点解释说明大数据场景下 I/O 较高因为数据是按行存储即使只针对其中某一列进行运算关系型数据库也会对整行数据进行扫描从存储设备中读入内存导致 I/O 较高结构化存储不够灵活存储的是行记录无法存储灵活的数据结构表结构 schema 扩展不方便如要需要修改表结构需要执行执行 DDLdata definition language语句修改修改期间会导致锁表部分服务不可用全文搜索功能较弱关系型数据库只能够进行子字符串的匹配查询当表的数据逐渐变大的时候即使在有索引的情况下like 扫表查询的匹配会非常慢难以存储和处理复杂关系型数据传统的关系数据库并不擅长处理数据点之间的关系 2. NoSQL简介 NoSQL泛指非关系型的数据库可以理解为关系型数据库的一个有力补充。 NoSQL 在许多方面性能大大优于非关系型数据库的同时往往也伴随一些特性的缺失。比较常见的是事务功能的缺失。数据库事务正确执行的四个基本要素 ACID 如下名称描述AAtomicity(原子性)一个事务中的所有操作要么全部完成要么全部不完成不会在中间某个环节结束。事务在执行过程中发生错误会被回滚到事务开始前的状态就像这个事务从来没有执行过一样。CConsistency一致性在事务开始之前和事务结束以后数据库的完整性没有被破坏。IIsolation隔离性数据库允许多个并发事务同时对数据进行读写和修改的能力。隔离性可以防止多个事务并发执行时由于交叉执行而导致数据的不一致。DDurability持久性事务处理结束后对数据的修改就是永久的即便系统故障也不会丢失。针对传统关系型数据库的不足下面介绍常见的 5 大类 NoSQL 解决方案 3. 列式数据库列式数据库是以列相关存储架构进行数据存储的数据库主要适合于批量数据处理和即时查询。相对应的是行式数据库数据以行相关的存储架构进行空间分配主要适合于小批量的数据处理常用于联机事务型数据处理。基于列式数据库的列存储特性可以解决某些特定场景下关系型数据库高 I/O 的问题。 3.1. 基本原理传统关系型数据库是按照行来存储数据库称为行式数据库而列式数据库是按照列来存储数据。将表放入存储系统中有两种方法而我们绝大部分是采用行存储的。行存储法是将各行放入连续的物理位置这很像传统的记录和文件系统。列存储法是将数据按照列存储到数据库中与行存储类似下图是两种存储方法的图形化解释 3.2. 常见列式数据库 3.2.1. HBase HBase 是一个开源的非关系型分布式数据库NoSQL它参考了谷歌的 BigTable 建模实现的编程语言为 Java。它是 Apache 软件基金会的 Hadoop 项目的一部分运行于 HDFS 文件系统之上为 Hadoop 提供类似于 BigTable 规模的服务。因此它可以容错地存储海量稀疏的数据。 3.2.2. BigTable BigTable 是一种压缩的、高性能的、高可扩展性的基于 Google 文件系统Google File SystemGFS的数据存储系统用于存储大规模结构化数据适用于云计算。 3.3. 相关特性 3.3.1. 优点高效的储存空间利用率列式数据库针对不同列的数据特征而发明了不同算法使其比行式数据库高的多的压缩率。普通的行式数据库一般压缩率在 31 到 51 左右而列式数据库的压缩率一般在 81 到 301 左右。比较常见的通过字典表压缩数据下面才是那张表本来的样子。经过字典表进行数据压缩后表中的字符串才都变成数字。正因为每个字符串在字典表里只出现了一次所以达到了压缩的目的。查询效率高读取多条数据的同一列效率高因为这些列都是存储在一起的一次磁盘操作可以数据的指定列全部读取到内存中。下图通过一条查询的执行过程说明列式存储以及数据压缩的优点。执行步骤如下去字典表里找到字符串对应数字只进行一次字符串比较。用数字去列表里匹配匹配上的位置设为 1。把不同列的匹配结果进行位运算得到符合所有条件的记录下标。使用这个下标组装出最终的结果集。适合做聚合操作适合大量的数据而不是小数据 3.3.2. 缺点不适合扫描小量数据不适合随机的更新不适合做含有删除和更新的实时操作单行数据支持 ACID 的事务操作多行数据的事务操作不支持事务的正常回滚支持 Isolation隔离性、(Durability持久性不能保证 (Atomicity原子性、Consistency一致性。 3.4. 应用场景列数据库的适用场景以 HBase 为例说明适合大数据量 (100TB 级数据有快速随机访问的需求。适合写密集型应用每天写入量巨大而读数量相对较小的应用比如 IM 的历史消息游戏日志等等。适合不需要复杂查询条件来查询数据的应用。HBase 只支持基于 rowkey 的查询对于 HBase 来说单条记录或者小范围的查询是可以接受的。大范围的查询由于分布式的原因可能在性能上有点影响。HBase 不适用于有 join多级索引表关系复杂的数据模型。对性能和可靠性要求非常高的应用。由于 HBase 本身没有单点故障可用性非常高。适合数据量较大而且增长量无法预估的应用需要进行优雅的数据扩展的应用。HBase 支持在线扩展即使在一段时间内数据量呈井喷式增长也可以通过 HBase 横向扩展来满足功能。存储结构化和半结构化的数据。 4. K-V数据库 4.1. 基本概念指的是使用键值key-value存储的数据库其数据按照键值对的形式进行组织、索引和存储。 KV 存储非常适合不涉及过多数据关系业务的数据。它能够有效减少读写磁盘的次数比 SQL 数据库存储拥有更好的读写性能能够解决关系型数据库无法存储数据结构的问题。 4.2. 常见K-V数据库 4.2.1. Redis Redis 是一个使用 ANSI C 编写的开源、支持网络、基于内存、可选持久性的键值对存储数据库。Redis 是目前最流行的键值对存储数据库之一。 4.2.2. Cassandra [kəsændrə] Apache Cassandra社区内一般简称为 C*是一套开源的分布式 NoSQL 数据库系统。它最初由 Facebook 开发用于储存收件箱等简单格式数据集 Google BigTable 的数据模型与 Amazon Dynamo 的完全分布式架构于一身。Cassandra 是一种流行的分布式结构化数据存储方案。 4.2.3. Memcached Memcached 是一个开放源代码、高性能、分配的内存对象缓存系统。用于加速动态 web 应用程序减轻关系型数据库负载。它可以应对任意多个连接使用非阻塞的网络 IO。由于它的工作机制是在内存中开辟一块空间然后建立一个 Hash 表Memcached 自管理这些 Hash 表。 Memcached 简单而强大。它简单的设计促进迅速部署易于发现所面临的问题解决了很多大型数据缓存。 image 4.2.4. LevelDB LevelDB 是一个由 Google 所研发的键值对Key/Value Pair嵌入式数据库管理系统编程库以开源的 BSD 许可证发布。 4.3. 相关特性 K-V 数据库的相关特性以 Redis 为例说明 4.3.1. 优点性能极高 Redis 单机最高能支持超过 10W 的 TPS。丰富的数据类型 Redis 支持包括 StringHashListSetSorted SetBitmap 和 Hyperloglog 等数据结构。丰富的特性 Redis 还支持 publish/subscribe通知key 过期等特性。 4.3.2. 缺点 Redis 事务不能支持原子性和持久性A 和 D只支持隔离性和一致性I 和 C。这里所说的无法保证原子性是针对 Redis 的事务操作因为事务是不支持回滚roll back而因为 Redis 的单线程模型Redis 的普通操作是原子性的。 4.4 应用场景 4.4.1. 适用场景适合存储用户信息比如会话、配置文件、参数、购物车等等。这些信息一般都和 ID 挂钩。 4.4.2. 不适用场景不适合需要通过值来查询而不是键来查询。Key-Value 数据库中根本没有通过值查询的途径。不适合需要储存数据之间的关系。在 Key-Value 数据库中不能通过两个或以上的键来关联数据。不适合需要支持事务的场景。在 Key-Value 数据库中故障产生时不可以进行回滚。 5. 文档型数据库 5.1. 基本概念文档数据库用于将半结构化数据存储为文档的一种数据库。文档数据库通常以 JSON 或 XML 格式存储数据。由于文档数据库的 no-schema 特性可以存储和读取任意数据。由于使用的数据格式是 JSON 或者 BSON因为 JSON 数据是自描述的无需在使用前定义字段读取一个 JSON 中不存在的字段也不会导致 SQL 那样的语法错误可以解决关系型数据库表结构 schema 扩展不方便的问题。 5.2. 常见文档数据库 5.2.1. MongoDB MongoDB 是一个基于分布式文件存储的数据库。由 C 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。 MongoDB 是一个介于关系数据库和非关系数据库之间的产品是非关系数据库当中功能最丰富最像关系数据库的 NoSQL。 5.2.2. CouchDB CouchDB 是用 Erlang 开发的面向文档的分布式数据库用于存储半结构化的数据比较类似 lucene 的 index 结构。 CouchDB 支持 RESTful API它使用 JSON 作为存储格式JavaScript 作为查询语言MapReduce 和 HTTP 作为 API 的 NoSQL 数据库。其中一个显著的功能就是多主复制功能。除此之外CouchDB 构建在强大的 B- 树储存引擎之上。 [图片上传失败...(image-fe7dcf-1536933787428)] 5.3. 相关特性文档型数据库的相关特性以 MongoDB 为例进行说明 5.3.1. 优点新增字段简单不需要像关系型数据库一样先执行 DDL 语句修改表结构程序代码直接读写即可。容易兼容历史数据。对于历史数据即使没有新增的字段也不会导致错误只会返回空值此时代码兼容处理即可。容易存储复杂数据。JSON 是一种强大的描述语言能够描述复杂的数据结构。 5.3.2. 缺点相比传统关系型数据库文档数据库的缺点主要是对多条数据记录的事务支持较弱具体体现如下 Atomicity原子性仅支持单行/文档级原子性不支持多行、多文档、多语句原子性。 Isolation隔离性隔离级别仅支持已提交读Read committed级别可能导致不可重复读幻读的问题。不支持复杂查询。例如 join 查询如果需要 join 查询需要多次操作数据库。 5.4. 应用场景 5.4.1. 适用场景数据量很大或者未来会变得很大。表结构不明确且字段在不断增加例如内容管理系统信息管理系统。 5.4.2. 不适用场景在不同的文档上需要添加事务。Document-Oriented 数据库并不支持文档间的事务。多个文档之间需要复杂的查询例如 join 操作。 6. 全文搜索引擎 6.1. 基本概念传统关系型数据库主要通过索引来达到快速查询的目的。在全文搜索的业务下索引也无能为力主要体现在以下几方面全文搜索的条件可以随意排列组合如果通过索引来满足则索引的数量非常多。全文搜索的模糊匹配方式索引无法满足只能用 like 进行查询而 like 查询是整表扫描效率非常低。全文搜索引擎的出现正是解决关系型数据库全文搜索较弱的问题。 6.2. 基本原理全文搜索引擎的技术原理称为倒排索引inverted index是一种索引方法其基本原理是建立单词到文档的索引。与之相对是是正排索引其基本原理是建立文档到单词的索引。现在有如下文档集合 [图片上传失败...(image-695617-1536933787428)] 正排索引得到索引如下 [图片上传失败...(image-35c3a2-1536933787428)] 可见正排索引适用于根据文档名称查询文档内容。简单的倒排索引如下image 带有单词频率信息的倒排索引如下image 可见倒排索引适用于根据关键词来查询文档内容。 6.3. 常见全文搜索引擎 6.3.1. ElasticSearch ElasticSearch 是一个基于 Apache Lucene 的搜索引擎。它提供了一个分布式多租户对全文搜索引擎。ElasticSearch 是用 Java 开发的对外提供 RESTful Web 接口。根据 DB-Engines 排名ElasticSearch 是最受欢迎的企业搜索引擎。 image 6.3.2. Solr Solr 是 Apache Lucene 项目的开源企业搜索平台。其主要功能包括全文检索、命中标示、分面搜索、动态聚类、数据库集成以及富文本比如 Word、PDF处理等等。Solr 是高度可扩展的并提供了分布式搜索和索引复制。 image 6.4. 相关特性全文搜索引擎以 ElasticSearch 为例说明 6.4.1. 优点查询效率高适用于对海量数据进行近实时的处理。可扩展性基于集群环境可以方便横向扩展可以承载 PB 级的数据。支持高可用ElasticSearch 集群弹性灵活可以发现新的或失败的节点重组和重新平衡数据确保数据是安全和可访问的。 6.4.2. 缺点事务的 ACID 支持不足单一文档的数据是支持 ACID 的。对于多个文档的事务操作不支持事务的正常回滚。支持Isolation隔离性基于乐观锁机制和Durability持久性不支持Atomicity原子性Consistency一致性。对类似数据库中通过外键进行多表关联的复杂操作支持较弱。读写有一定延时写入的数据最快 1s 中能被检索到。更新性能较低底层实现是先删数据再插入新数据。内存占用大因为 Lucene 将索引部分加载到内存中。 6.5. 应用场景 6.5.1. 适用场景分布式的搜索引擎和数据分析引擎。全文检索结构化检索以及数据分析。对海量数据进行近实时的处理可以将海量数据分散到多台服务器上去存储和检索。 6.5.2. 不适用场景数据需要频繁更新。需要复杂关联查询。 7. 图形数据库 7.1. 基本概念图形数据库应用图形理论存储实体之间的关系信息。最常见例子就是社会网络中人与人之间的关系。关系型数据库用于存储这种关系型数据的效果并不好其查询复杂、缓慢、超出预期。图形数据库的独特设计弥补了这个缺陷解决关系型数据库存储和处理复杂关系型数据功能较弱的问题。 7.2. 常见图形数据库 7.2.1. Neo4j Neo4j 是一个高性能的NOSQL 图形数据库它将结构化数据存储在 “图形网络上” 而不是 “表中”。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的 Java 持久化引擎。 Neo4j 也可以被看作是一个高性能的图引擎。程序员工作在一个面向对象的、灵活的网络结构下而不是严格、静态的表中。 image 7.2.2. ArangoDB ArangoDB 是一个原生多模型数据库系统。数据库系统支持三个重要的数据模型键/值文档图形。 ArangoDB 包含一个数据库核心和统一查询语言 AQLArangoDB 查询语言。查询语言是声明性的允许在单个查询中组合不同的数据访问模式。ArangoDB 是一个 NoSQL 数据库系统但 AQL 在很多方面与 SQL 都类似。 image 7.3. 基本原理图形数据库以 Neo4j 为例说明 Neo4j 使用数据结构中图graph的概念来进行建模。 Neo4j 中两个最基本的概念是节点和边。节点表示实体边则表示实体之间的关系。节点和边都可以有自己的属性。不同实体通过各种不同的关系关联起来形成复杂的对象图。针对关系数据两种数据库的存储结构分别如下 image 在 Neo4j 中存储节点时使用了 index-free adjacency即每个节点都有指向其邻居节点的指针。这样就可以在 O(1) 的复杂度内找到邻居节点。另外按照官方的说法在 Neo4j 中边 s是最重要的是 first-class entities需要单独存储。这有利于在图遍历的时候提高速度也可以很方便地以任何方向进行遍历。 image 7.4. 相关特性 7.4.1. 优点高性能表现图的遍历是图数据结构所具有的独特算法即从一个节点开始根据其连接的关系可以快速和方便地找出它的邻近节点。这种查找数据的方法不受数据量大小的影响因为邻近查询始终查找的是有限的局部数据不会对整个数据库进行搜索。设计的灵活性数据结构的自然伸展特性以及其非结构化的数据格式让图数据库设计可以具有很大的伸缩性和灵活性。因为随着需求的变化而增加的节点、关系及其属性并不会影响到原来数据的正常使用。开发的敏捷性数据模型直接明了从需求的讨论开始到程序开发和实现基本上不会有大的变化。完全支持ACID 不像别的 NoSQL 数据库Neo4j 还完全具有事务管理特性完全支持 ACID 事务管理。 7.4.2. 缺点节点关系和它们的属性的数量被限制。不支持拆分。 7.5. 应用场景 7.5.1. 适用场景在一些关系性强的数据应用例如社交网络。推荐引擎将数据以图的形式表现非常有益于推荐的制定。 7.5.2. 不适用场景记录大量基于事件的数据如日志记录、传感器数据。对大规模分布式数据进行处理类似于 Hadoop。不适用于应该保存在关系型数据库中的结构化数据。二进制数据存储。小结关于关系型数据库和 NoSQL 数据库的选型往往需要考虑几个指标数据量并发量实时性一致性要求读写分布数据类型安全性运维成本常见的系统数据库选型参考如下系统类型数据库选型企业内部管理系统例如运营系统数据量少并发量小首选考虑关系型数据库互联网大流量系统例如电商单品页后台考虑选关系型数据库前台考虑选内存型数据库日志型系统原始数据考虑选列式数据库日志搜索考虑选倒排索引搜索型系统例如站内搜索非通用搜索商品搜索后台考虑选关系型数据库前台考虑选倒排索引事务型系统例如库存管理交易记账考虑选关系型数据库缓存数据库一致性型协议离线计算例如大量数据分析考虑选列式数据库或者关系型数据库都可以实时计算例如实时监控可以考虑选内存型数据库或者列式数据库设计实践中要基于需求、业务驱动架构无论选用 RDB/NoSQL/DRDB。一定是以需求为导向最终数据存储方案必然是考虑各种权衡的综合性设计。欢迎关注技术公众号零壹技术栈零壹技术栈本帐号将持续分享后端技术干货包括虚拟机基础多线程编程高性能框架异步、缓存和消息中间件分布式和微服务架构学习和进阶等学习资料和文章。作者零壹技术栈链接https://www.jianshu.com/p/a586a8bf13f7 来源简书著作权归作者所有。商业转载请联系作者获得授权非商业转载请注明出处。

查看全文

http://www.zqtcl.cn/news/66804/