1. 描述
在MySQL中,当我们需要获取某张表中的总行数时,一般会选择使用下面的语句
select count(*) from table;
其实count函数中除了*还可以放其他参数,比如常数、主键id、字段,那么它们有什么区别?各自效率如何?我们应该使用哪种方式来获取表的行数呢?
当搞清楚count函数的运行原理后,相信上面几个问题的答案就会了然于胸。
2. 表结构
为了解决上述的问题,我创建了一张 user 表,它有两个字段:主键id和name,后者可以为null,建表语句如下。
CREATE TABLE `user` ( `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键', `name` varchar(255) DEFAULT NULL COMMENT '姓名', PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
在该表中共有6000000条数据,前1000000条数据行的name字段为空,其余数据行name=id,使用存储过程造测试数据的代码如下
-- 使用存储过程造测试数据 delimiter;; create procedure idata() begin declare i int; set i=1; while(i<=6000000)do insert into user values(i, i); set i=i+1; end while; end;; delimiter; call idata(); -- 将前1000000条数据的name字段置为null update user set name=null where id<1000000;
3. 执行 SQL 语句及结果
为了区分count函数不同参数的区别,主要从执行时间和扫描行数这两方面来描述SQL的执行效率,同时还会从返回结果来描述`count函数的特性。
- *符号 ——
select count(*) from user
; - 常数——
select count(1) from user
; - 非空字段——
select count(id) from user
; - 可为空的字段——
select count(name) from user
;
3.1 *符号
mysql> select count(*) from user; +----------+ | count(*) | +----------+ | 6000000 | +----------+ 1 row in set (0.76 sec)
遍历全表,不取值(优化后,必定不是null,不取值),累加计数,最终返回结果。
3.2 常数
mysql> select count(1) from user; +----------+ | count(1) | +----------+ | 6000000 | +----------+ 1 row in set (0.76 sec)
遍历全表,一行行取数据,将每一行赋值为1,判断到该字段不可为空,累加计数,最终返回结果。
3.3 非空字段
mysql> select count(id) from user; +-----------+ | count(id) | +-----------+ | 6000000 | +-----------+ 1 row in set (0.85 sec)
遍历全表,一行行取数据(会选择最小的索引树来遍历,所以比相同情况下的count字段效率更高),取每行的主键id,判断到该字段不可为空,累加计数,最终返回结果。
3.4 可为空的字段
mysql> select count(name) from user; +-------------+ | count(name) | +-------------+ | 5900001 | +-------------+ 1 row in set (0.93 sec)
- 若字段定义不为空:遍历全表,一行行取数据,取每行的该字段,判断到该字段不可为空,累加计数,最终返回结果。
- 若字段定义可为空:遍历全表,一行行取数据,取每行的该字段,判断到该字段可能是null,然后再判断该字段的值是否为null,不为null才累加计数,最终返回结果。
- 若该字段没有索引,将遍历主键索引树。
4. 执行结果分析
4.1 结果集
首先从结果集的角度来看,前三条 SQL 语句的目的是一样的——返回的是所有行数,而 count
函数的参数是普通字段且字段默认为 null
的时候,它返回的是该字段不为 null
的行数。
4.2 执行时间
从执行时间上来看的话,效率大致是count(可为空的字段) < count(非空字段) < count(常数) < count(*)
。
5. 总结
count是一个聚合函数,对于返回的结果集,一行行地判断,如果count函数的参数不是NULL,累计值就加1,否则不加。最后返回累计值。
count(*)
速度最快的原因是它不会在计数的时候去取每行数据值count(1)
比count(*)
稍慢的原因是它会取每个数据行并赋值为1count(非空字段)
比count(1)
稍慢的原因是它会从每个数据行中取出主键 idcount(可为空的字段)
最慢的原因是它可能需要判断每个数据行中的改字段是否为 null
所以,最好还是用count(*)。
以上就是详解 MySQL中count函数的正确使用方法的详细内容,更多关于MySQL count函数的资料请关注其它相关文章!
稳了!魔兽国服回归的3条重磅消息!官宣时间再确认!
昨天有一位朋友在大神群里分享,自己亚服账号被封号之后居然弹出了国服的封号信息对话框。
这里面让他访问的是一个国服的战网网址,com.cn和后面的zh都非常明白地表明这就是国服战网。
而他在复制这个网址并且进行登录之后,确实是网易的网址,也就是我们熟悉的停服之后国服发布的暴雪游戏产品运营到期开放退款的说明。这是一件比较奇怪的事情,因为以前都没有出现这样的情况,现在突然提示跳转到国服战网的网址,是不是说明了简体中文客户端已经开始进行更新了呢?
更新日志
- 群星2013-青春缤纷辑压箱宝大公开3CD2[新加坡限量版][WAV整轨]
- 林育群.2013-BalladShow(日本版)【环球】【WAV+CUE】
- 陈加洛.1992-痛到感觉不到【宝丽金】【WAV+CUE】
- 群星.2023-宿命之敌电视剧原声带【韶愔音乐】【FLAC分轨】
- 東京事変-大発見[FLAC+CUE]
- 椎名林檎-三文ゴシップ[FLAC+CUE]
- 2024年08月04日
- 裘德《裘德「最后的水族馆」演唱会LIVE》[320K/MP3][228.89MB]
- 裘德《裘德「最后的水族馆」演唱会LIVE》[24bit 48kHz][FLAC/分轨][2.08G]
- 基因三重奏《如果你什么都不说 音乐会现场录音》[320K/MP3][145.37MB]
- 孟庭苇.1996-月亮说话(2020环球24KGOLD限量版)【上华】【WAV+CUE】
- 群星.1997-新艺宝优质音响系列·国语精选监听版【新艺宝】【WAV+CUE】
- 阿桑.2005-寂寞在唱歌(星外星引进版)【华研国际】【WAV+CUE】
- 基因三重奏《如果你什么都不说 音乐会现场录音》[FLAC/分轨][287.43MB]
- 蔡题谦《我爱你,却依然要看你走》[320K/MP3][88.65MB]