注册域名不建设网站,苏州手机网站开发公司,做网站数据库要哪一种好,搭建cms网站索引
索引是帮助 MySQL 高效获取数据的数据结构#xff08;有序#xff09;。在数据之外#xff0c;数据库系统还维护着满足特定查找算法的数据结构#xff0c;这些数据结构以某种方式引用#xff08;指向#xff09;数据#xff0c;这样就可以在这些数据结构上实现高级…索引
索引是帮助 MySQL 高效获取数据的数据结构有序。在数据之外数据库系统还维护着满足特定查找算法的数据结构这些数据结构以某种方式引用指向数据这样就可以在这些数据结构上实现高级查询算法这种数据结构就是索引。
优缺点
优点 提高数据检索效率降低数据库的IO成本 通过索引列对数据进行排序降低数据排序的成本降低CPU的消耗
缺点 索引列也是要占用空间的 索引大大提高了查询效率但降低了更新的速度比如 INSERT、UPDATE、DELETE
索引结构
索引结构描述BTree最常见的索引类型大部分引擎都支持B树索引Hash底层数据结构是用哈希表实现只有精确匹配索引列的查询才有效不支持范围查询R-Tree(空间索引)空间索引是 MyISAM 引擎的一个特殊索引类型主要用于地理空间数据类型通常使用较少Full-Text(全文索引)是一种通过建立倒排索引快速匹配文档的方式类似于 Lucene, Solr, ES
索引InnoDBMyISAMMemoryBTree索引支持支持支持Hash索引不支持不支持支持R-Tree索引不支持支持不支持Full-text5.6版本后支持支持不支持 B-Tree 二叉树的缺点可以用红黑树来解决 红黑树也存在大数据量情况下层级较深检索速度慢的问题。
为了解决上述问题可以使用 B-Tree 结构。 B-Tree (多路平衡查找树) 以一棵最大度数max-degree指一个节点的子节点个数为55阶的 b-tree 为例每个节点最多存储4个key5个指针 演示地址B-Tree Visualization BTree
结构图 演示地址B Tree Visualization 与 B-Tree 的区别 所有的数据都会出现在叶子节点 叶子节点形成一个单向链表
MySQL 索引数据结构对经典的 BTree 进行了优化。在原 BTree 的基础上增加一个指向相邻叶子节点的链表指针就形成了带有顺序指针的 BTree提高区间访问的性能。 Hash
哈希索引就是采用一定的hash算法将键值换算成新的hash值映射到对应的槽位上然后存储在hash表中。 如果两个或多个键值映射到一个相同的槽位上他们就产生了hash冲突也称为hash碰撞可以通过链表来解决。 特点 Hash索引只能用于对等比较、in不支持范围查询betwwn、、、... 无法利用索引完成排序操作 查询效率高通常只需要一次检索就可以了效率通常要高于 BTree 索引
存储引擎支持 Memory InnoDB: 具有自适应hash功能hash索引是存储引擎根据 BTree 索引在指定条件下自动构建的 面试题 为什么 InnoDB 存储引擎选择使用 BTree 索引结构 相对于二叉树层级更少搜索效率高 对于 B-Tree无论是叶子节点还是非叶子节点都会保存数据这样导致一页中存储的键值减少指针也跟着减少要同样保存大量数据只能增加树的高度导致性能降低 相对于 Hash 索引BTree 支持范围匹配及排序操作
索引分类
分类含义特点关键字主键索引针对于表中主键创建的索引默认自动创建只能有一个PRIMARY唯一索引避免同一个表中某数据列中的值重复可以有多个UNIQUE常规索引快速定位特定数据可以有多个全文索引全文索引查找的是文本中的关键词而不是比较索引中的值可以有多个FULLTEXT
在 InnoDB 存储引擎中根据索引的存储形式又可以分为以下两种
分类含义特点聚集索引(Clustered Index)将数据存储与索引放一块索引结构的叶子节点保存了行数据必须有而且只有一个二级索引(Secondary Index)将数据与索引分开存储索引结构的叶子节点关联的是对应的主键可以存在多个
演示图 聚集索引选取规则 如果存在主键主键索引就是聚集索引 如果不存在主键将使用第一个唯一(UNIQUE)索引作为聚集索引 如果表没有主键或没有合适的唯一索引则 InnoDB 会自动生成一个 rowid 作为隐藏的聚集索引
思考题
1. 以下 SQL 语句哪个执行效率高为什么
select * from user where id 10;
select * from user where name Arm;
-- 备注id为主键name字段创建的有索引
答第一条语句因为第二条需要回表查询相当于两个步骤。
2. InnoDB 主键索引的 BTree 高度为多少
答假设一行数据大小为1k一页中可以存储16行这样的数据。InnoDB 的指针占用6个字节的空间主键假设为bigint占用字节数为8. 可得公式n * 8 (n 1) * 6 16 * 1024其中 8 表示 bigint 占用的字节数n 表示当前节点存储的key的数量(n 1) 表示指针数量比key多一个。算出n约为1170。
如果树的高度为2那么他能存储的数据量大概为1171 * 16 18736 如果树的高度为3那么他能存储的数据量大概为1171 * 1171 * 16 21939856。
另外如果有成千上万的数据那么就要考虑分表涉及运维篇知识。 语法
创建索引 CREATE [ UNIQUE | FULLTEXT ] INDEX index_name ON table_name (index_col_name, ...); 如果不加 CREATE 后面不加索引类型参数则创建的是常规索引
查看索引 SHOW INDEX FROM table_name;
删除索引 DROP INDEX index_name ON table_name;
案例
-- name字段为姓名字段该字段的值可能会重复为该字段创建索引
create index idx_user_name on tb_user(name);
-- phone手机号字段的值非空且唯一为该字段创建唯一索引
create unique index idx_user_phone on tb_user (phone);
-- 为profession, age, status创建联合索引
create index idx_user_pro_age_stat on tb_user(profession, age, status);
-- 为email建立合适的索引来提升查询效率
create index idx_user_email on tb_user(email);
-- 删除索引
drop index idx_user_email on tb_user;
使用规则
最左前缀法则
如果索引关联了多列联合索引要遵守最左前缀法则最左前缀法则指的是查询从索引的最左列开始并且不跳过索引中的列。 如果跳跃某一列索引将部分失效后面的字段索引失效。
联合索引中出现范围查询, 范围查询右侧的列索引失效。可以用或者来规避索引失效问题。
索引失效情况 在索引列上进行运算操作索引将失效。如
explain select * from tb_user where substring(phone, 10, 2) 15; 字符串类型字段使用时不加引号索引将失效。如explain select * from tb_user where phone 17799990015;此处phone的值没有加引号 模糊查询中如果仅仅是尾部模糊匹配索引不会是失效如果是头部模糊匹配索引失效。如explain select * from tb_user where profession like %工程;前后都有 % 也会失效。 用 or 分割开的条件如果 or 其中一个条件的列没有索引那么涉及的索引都不会被用到。 如果 MySQL 评估使用索引比全表更慢则不使用索引。
SQL 提示
是优化数据库的一个重要手段简单来说就是在SQL语句中加入一些人为的提示来达到优化操作的目的。
例如使用索引
explain select * from tb_user use index(idx_user_pro) where profession软件工程;
不使用哪个索引
explain select * from tb_user ignore index(idx_user_pro) where profession软件工程;
必须使用哪个索引
explain select * from tb_user force index(idx_user_pro) where profession软件工程;
use 是建议实际使用哪个索引 MySQL 还会自己权衡运行速度去更改force就是无论如何都强制使用该索引。
覆盖索引回表查询
尽量使用覆盖索引查询使用了索引并且需要返回的列在该索引中已经全部能找到减少 select *。
explain 中 extra 字段含义
using index condition查找使用了索引但是需要回表查询数据 using where;
using index;查找使用了索引但是需要的数据都在索引列中能找到所以不需要回表查询
如果在聚集索引中直接能找到对应的行则直接返回行数据只需要一次查询哪怕是select *如果在辅助索引中找聚集索引如select id, name from xxx where namexxx;也只需要通过辅助索引(name)查找到对应的id返回name和name索引对应的id即可只需要一次查询如果是通过辅助索引查找其他字段则需要回表查询如select id, name, gender from xxx where namexxx;
所以尽量不要用select *容易出现回表查询降低效率除非有联合索引包含了所有字段
面试题一张表有四个字段id, username, password, status由于数据量大需要对以下SQL语句进行优化该如何进行才是最优方案
select id, username, password from tb_user where usernameitcast;
解给username和password字段建立联合索引则不需要回表查询直接覆盖索引
前缀索引
当字段类型为字符串varchar, text等时有时候需要索引很长的字符串这会让索引变得很大查询时浪费大量的磁盘IO影响查询效率此时可以只降字符串的一部分前缀建立索引这样可以大大节约索引空间从而提高索引效率。
语法create index idx_xxxx on table_name(columnn(n));
前缀长度可以根据索引的选择性来决定而选择性是指不重复的索引值基数和数据表的记录总数的比值索引选择性越高则查询效率越高唯一索引的选择性是1这是最好的索引选择性性能也是最好的。 求选择性公式
select count(distinct email) / count(*) from tb_user;
select count(distinct substring(email, 1, 5)) / count(*) from tb_user;
show index 里面的sub_part可以看到接取的长度
单列索引联合索引
单列索引即一个索引只包含单个列 联合索引即一个索引包含了多个列 在业务场景中如果存在多个查询条件考虑针对于查询字段建立索引时建议建立联合索引而非单列索引。
单列索引情况 explain select id, phone, name from tb_user where phone 17799990010 and name 韩信; 这句只会用到phone索引字段
注意事项 多条件联合查询时MySQL优化器会评估哪个字段的索引效率更高会选择该索引完成本次查询
设计原则 针对于数据量较大且查询比较频繁的表建立索引 针对于常作为查询条件where、排序order by、分组group by操作的字段建立索引 尽量选择区分度高的列作为索引尽量建立唯一索引区分度越高使用索引的效率越高 如果是字符串类型的字段字段长度较长可以针对于字段的特点建立前缀索引 尽量使用联合索引减少单列索引查询时联合索引很多时候可以覆盖索引节省存储空间避免回表提高查询效率 要控制索引的数量索引并不是多多益善索引越多维护索引结构的代价就越大会影响增删改的效率 如果索引列不能存储NULL值请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含NULL值时它可以更好地确定哪个索引最有效地用于查询