加入收藏 | 设为首页 | 会员中心 | 我要投稿 网站开发网_安阳站长网 (https://www.0518zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长百科 > 正文

深入理解select count(*)底层究竟做了什么

发布时间:2019-06-13 03:28:08 所属栏目:站长百科 来源:Java技术架构
导读:副标题#e# SELECT COUNT( * ) FROM t是个再常见不过的 SQL 需求了。在 MySQL 的使用规范中,我们一般使用事务引擎 InnoDB 作为(一般业务)表的存储引擎,在此前提下,COUNT( * )操作的时间复杂度为 O(N),其中 N 为表的行数。 而 MyISAM 表中可以快速取到表

相关调用栈参考如下:

深入理解select count(*)底层究竟做了什么

二、数据结构:

Q:count 值存储在哪个内存变量里?

A:SQL 解析后,存储于表达 COUNT( * ) 这一项中,((Item_sum_count*)item_sum)->count

如下图所示回顾我们之前“COUNT( * )前置流程”部分提到的 JOIN 结构。

深入理解select count(*)底层究竟做了什么

即 SQL 解析器为每个 SQL 语句进行结构化,将其放在一个 JOIN 对象 ( join ) 中来表达。在该对象中创建并填充了一个列表 result_field_list 用于存放结果列,列表中每个元素则是一个结果列的 ( Item_result_field*) 对象 ( 指针 ) 。

在 COUNT( * )-case 中,结果列列表只包含一个元素,( Item_sum_count: public Item_result_field ) 类型对象 ( name = “COUNT( * )”),其中该类所特有的成员变量 count即为所求。

三、MyISAM 全表 COUNT( * )

由于 MyISAM引擎并不常用于实际业务中,仅做简要描述如下:

  1. MyISAM-COUNT( * ) 操作是 O(1) 时间复杂度的操作。
  2. 每张MyISAM表中存放了一个 meta 信息-count 值,在内存中与文件中各有一份,内存中的 count 变量值通过读取文件中的 count 值来进行初始化。
  3. SELECT COUNT( * ) FROM t 会直接读取内存中的表 t 对应的 count 变量值。
  4. 内存中的 count 值与文件中的 count 值由写操作来进行更新,其一致性由表级锁来保证。
  5. 表级锁保证的写入串行化使得,同一时刻所有用户线程的读操作要么被锁,要么只会看到一种数据状态。

四、几个问题

Q:MyISAM 与 InnoDB 在 COUNT( * ) 操作的执行过程在哪里开始分道扬镳?

  • 共性:共性存在于 SQL 层,即 SQL 解析之后的数据结构是一致的,count 变量都是存在于作为结果列的 Item_sum_count 类型对象中;返回给客户端的过程也类似 – 对该 count 变量进行赋值并经由 MySQL 通信协议返回给客户端。
  • 区别:InnoDB 的 count 值计算是在 SQL 执行阶段进行的;而 MyISAM表本身在内存中有一份包含了表 row_count 值的 meta 信息,在 SQL 优化阶段通过存储引擎的标记给优化器一个 hint,表明该表所用的存储引擎保存了精确行数,可以直接获取到,无需再进入执行器。

深入理解select count(*)底层究竟做了什么

Q:InnoDB 中为何无法向 MyISAM 一样维护住一个 row_count 变量?

(编辑:网站开发网_安阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!