news 2026/3/16 23:38:55

论索引的重要性

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
论索引的重要性

开篇小测验

下面这样一个小SQL 你该怎么样添加最优索引

两个表上现在只有聚集索引

bigproduct 表上已经有聚集索引 ProductID

bigtransactionhistory 表上已经有聚集索引 TransactionID

你是否一眼就能看出来呢?

答案将在文章中逐步揭晓~~~

简单粗暴的添加索引

首先我们看一下没有优化前的执行计划

clustered index scan 这其实就是表扫描,不是table scan 只是因为表上有聚集索引

可以看出这个查询俩表都使用了表扫描!

where条件添加索引

首先大多数人都知道 where 条件中的字段需要添加索引! 我们添加一下看看效果创建

在 bigproduct 表上创建 name 列索引,在bigtransactionhistory表上创建TransactionDate 列索引。

再次执行语句看一下效果!

添加where索引以后可以看到以下几个现象

  • bigproduct 从原来的clustered index scan 变成 index seek

  • 另外多出来个KEY Lookup(clustered)

  • bigproduct 上添加的索引起了作用,逻辑读bigproduct 由 601 变成10。

  • bigtransactionhistory 没啥变化啊还是clustered index scan

解释一下出现的现象 :首先一点bigproduct 边添加的where条件索引,起到了作用,执行的时候不是全表扫描了,逻辑读有明显的下降,出现的 KEY Lookup 是因为选择(select)的列,在索引中没有,而需要通过聚集索引再查找一次,再找一次也意味着多一部分开销!那么同样添加了where 条件索引的bigtransactionhistory表为什么没起作用呢?那是因为SQL优化器在选择计划的时候认为,不使用TransactionDate 列索引查找效率会更好!

真的么?我们来验证一下,通过指定选择索引,来让优化器选择索引查找!

强制使用索引以后,可以看出逻辑读由 14W 变成1961W,语句时间也变得很长,这就是优化器为什么不选用你加的索引!优化器还是很智能的吧。

高能预警:优化器可不是什么时候都这么智能的...由于缓存计划或优化器抽风等原因,也会出现优化器用了这种索引,导致你的语句奇慢,读飙升直接影响到你的内存、磁盘、CPU资源!另外如果这样一条语句是系统中一条很频繁运行的语句,你的系统就挂了!没错就挂了!这就是开篇抛出的问题就是因为一条语句!

消灭Key Lookup添加select字段

这就是传说中的覆盖索引!

看到执行计划中存在Key Lookup 而且消耗占比很高,如上面强制索引的计划,那么我们就要想到的 在索引中包含那些SELECT 的列!如果消耗低,逻辑读少,如上面bigproduct 表中的Key Lookup 就可以忽略(如果你追求完美,也一样优化就可以了)。

包含列的图形化创建:@秋仙 特意给你的说明

语句创建就是:

下面我们添加一下看看效果:

添加select 索引字段后可以看出的现象:

  • 优化器自己选择了index seek

  • bigtransactionhistory占比最高的Key Lookup消失了

  • 逻辑读由原来无索引的14W变成1W

  • bigtransactionhistory表还提示缺少索引?

通过优化索引添加select 字段,我们看出语句又一次得到了提升bigtransactionhistory 从表扫描变成索引查找,逻辑读由14W变成 1W!这是一个质的飞跃啊!

CREATE NONCLUSTERED INDEXTransactionDate包含ProductID_QuantityON[dbo].[bigTransactionHistory] ([TransactionDate])------INCLUDE 就是包含列INCLUDE ([ProductID],[Quantity])GO

那为什么还提示缺少索引呢?创建一下试试吧!

索引再优化加入表关联列

按照提示我们创建索引:和上一个索引的不同 ProductID 列由包含列变成了索引列!

我们看一下效果:

再次优化索引以后可以看到以下几个现象

  • bigtransactionhistory表还是索引查找index seek

  • bigtransactionhistory依然没有了Key Lookup

  • 两表关联的hash join 变成了nested loops

  • 并行计划变成了串行

  • 逻辑读又从1W 变成18

又一次质的飞跃!读从原来的14W 变成1W 又变成18,这样大大减少了内存和IO的消耗,另外并行计划也变成了串行,无疑又减少了大量CPU的消耗!语句时间,我想这里就不用多说了吧?

高能预警:这里所说的hash join,并行变串行,不懂的朋友可以在百度自行学习,这里只是针对当前语句的情况,不能一概而论!

精简你的索引

大家都知道,索引会导致update、insert、delete操作变慢!那么尽量精简你的索引就是一个很重要的话题了!

上面的优化过程中我们创建了几个索引,以bigTransactionHistory为例来看一下:

脚本这里就不贴了,其实我们最后创建的索引 ProductID_TransactionDate包含Quantity 已经包含了前两个索引,而且可以说无论任何类似语句都使用ProductID_TransactionDate包含Quantity 就可以了!

那么我们就可以清除前两个索引!

至此语句的优化算是结束了,留下的就是bigproduct 依然有一个Key Lookup可以优化,可以仿照上面的继续优化,这里就不细说了。

这就是索引的重要性!

开篇小测试你做对了么?如果没做对那么这么请你自行模拟一个场景再现本篇的话题吧!

总结

数据库整体缓慢往往都是因为索引问题导致的,不要小看一条语句的威力,一条高频的语句足可以让你的数据库彻底无法工作。在和大量的运维人员交流的过程中发现,对于索引的重要性恰恰没有足够的重视,一提到优化就是修改SQL语句、读写分离、分布式数据库等舍近求远的方案,优化索引才是对数据库最高性价比的优化。

北京格瑞趋势科技有限公司是聚焦于数据服务的高新技术企业,成立于2008年,创始团队及核心技术人员来自微软和雅虎。微软数据平台长期合作伙伴,卫宁健康数据平台战略合作伙伴。通过产品+服务双轮驱动的业务模式,14年间累计服务4000+客户,覆盖互联网、市政、交通、电信、医疗、教育、电力、制造业等各个领域。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/14 3:59:46

深度剖析在线电路仿真对初学者的学习价值

为什么越来越多电子初学者,从“仿真”开始学电路?你有没有过这样的经历:刚翻开《电路分析》,看到“电容充电曲线是指数函数”这句话时,脑子里一片空白?或是绞尽脑汁算出一个偏置电阻值,接上电源…

作者头像 李华
网站建设 2026/3/10 1:40:36

STM32CubeMX安装包核心要点解析(初学者适用)

STM32CubeMX安装包核心要点解析(初学者适用)——从零开始搭建你的第一个STM32工程 为什么我们需要STM32CubeMX?一个真实开发场景的启示 你买了一块STM32F103C8T6最小系统板,准备点亮LED。翻出数据手册,打开参考手册&…

作者头像 李华
网站建设 2026/3/13 12:43:36

Matlab学习记录10

书籍:Matlab实用教程 工具:Matlab2021a 电脑信息:Intel Xeon CPU E5-2603 v3 1.60GHz 系统类型:64位操作系统,基于X64的处理器 windows10 专业版 第4章 Matlab的符号计算计算的可视化和GUI设计 4.6 句柄图形 4.6.1 句…

作者头像 李华
网站建设 2026/3/4 6:47:06

智谱开源神器Open-AutoGLM实战指南(从入门到精通必读)

第一章:智谱开源神器Open-AutoGLM概述Open-AutoGLM 是由智谱AI推出的一款面向自动化自然语言处理任务的开源工具,旨在降低大模型应用门槛,提升从数据预处理到模型部署的全流程效率。该工具融合了自动提示工程(Auto-Prompting&…

作者头像 李华
网站建设 2026/3/17 14:32:48

【Open-AutoGLM开源代码深度解析】:揭秘高效自动化代码生成核心技术

第一章:Open-AutoGLM开源代码地址 Open-AutoGLM 是一个面向自动化自然语言生成任务的开源框架,旨在通过模块化设计提升大语言模型在实际场景中的部署效率。该项目由国内技术团队主导开发,已在 GitHub 上正式发布,开发者可通过公开…

作者头像 李华