EXPLAIN — 显示语句的执行计划
EXPLAIN [ (option[, ...] ) ]statementwhereoptioncan be one of: ANALYZE [boolean] VERBOSE [boolean] COSTS [boolean] SETTINGS [boolean] GENERIC_PLAN [boolean] BUFFERS [boolean] SERIALIZE [ { NONE | TEXT | BINARY } ] WAL [boolean] TIMING [boolean] SUMMARY [boolean] MEMORY [boolean] FORMAT { TEXT | XML | JSON | YAML }
此命令显示 PostgreSQL 规划器为提供的语句生成的执行计划。执行计划显示语句引用的表将如何扫描 —— 通过普通顺序扫描、索引扫描等等 —— 如果引用了多个表,则使用什么连接算法将来自每个输入表的所需行组合在一起。
显示中最关键的部分是估计的语句执行成本,这是规划器对运行语句所需时间的猜测(以任意的成本单位衡量,但通常表示磁盘页面获取)。实际显示两个数字:返回第一行之前的启动成本,以及返回所有行的总成本。对于大多数查询,总成本才是重要的,但在诸如 EXISTS 中的子查询之类的上下文中,规划器将选择最小的启动成本而不是最小的总成本(因为执行器无论如何都会在获得一行后停止)。此外,如果您使用 LIMIT 子句限制要返回的行数,则规划器会在端点成本之间进行适当的插值,以估计哪个计划才是真正最便宜的。
ANALYZE 选项会导致语句实际执行,而不仅仅是计划。然后,实际运行时统计信息会添加到显示中,包括每个计划节点中花费的总时间(以毫秒为单位)以及它实际返回的总行数。这对于查看规划器的估计是否接近现实很有用。
请记住,当使用 ANALYZE 选项时,语句实际上会被执行。尽管 EXPLAIN 会丢弃 SELECT 将返回的任何输出,但语句的其他副作用将照常发生。如果您希望在 INSERT、UPDATE、DELETE、MERGE、CREATE TABLE AS 或 EXECUTE 语句上使用 EXPLAIN ANALYZE 而不让该命令影响您的数据,请使用以下方法
BEGIN; EXPLAIN ANALYZE ...; ROLLBACK;
ANALYZE执行命令并显示实际运行时间和其它统计信息。此参数默认为 FALSE。
VERBOSE显示关于计划的额外信息。具体来说,包括计划树中每个节点的输出列列表,对表和函数名称进行模式限定,始终用其范围表别名标记表达式中的变量,并始终打印显示统计信息的每个触发器的名称。如果已计算查询标识符,也将显示该标识符,有关更多详细信息,请参见 compute_query_id。此参数默认为 FALSE。
COSTS包括有关每个计划节点的估计启动成本和总成本,以及估计的行数和每行的估计宽度信息。此参数默认为 TRUE。
SETTINGS包括有关配置参数的信息。具体来说,包括影响查询计划且值与内置默认值不同的选项。此参数默认为 FALSE。
GENERIC_PLAN允许语句包含诸如 $1 之类的参数占位符,并生成一个不依赖于这些参数值的通用计划。有关通用计划和支持参数的语句类型的详细信息,请参见 PREPARE。此参数不能与 ANALYZE 一起使用。它默认为 FALSE。
BUFFERS包括有关缓冲区使用情况的信息。具体来说,包括命中、读取、脏写和写入的共享块数,命中、读取、脏写和写入的本地块数,读取和写入的临时块数,以及花费在读取和写入数据文件块、本地块和临时文件块上的时间(以毫秒为单位),如果启用了 track_io_timing。 命中 表示在需要时,由于在缓存中已找到该块,因此避免了读取。共享块包含来自常规表和索引的数据;本地块包含来自临时表和索引的数据;而临时块包含在排序、哈希、物化计划节点和类似情况下使用的短期工作数据。脏写的块数表示此查询更改的先前未修改的块数;而写入的块数表示此后端在查询处理期间从缓存中逐出的先前脏写的块数。为较高级别节点显示的块数包括其所有子节点使用的块数。在文本格式中,仅打印非零值。此参数默认为 FALSE。
SERIALIZE包括有关序列化查询输出数据成本的信息,即将数据转换为文本或二进制格式以发送给客户端。如果数据类型输出函数开销很大,或者如果TOAST必须从行外存储中获取的值,这可能是查询常规执行所需时间的重要组成部分。EXPLAIN 的默认行为 SERIALIZE NONE 不执行这些转换。如果指定了 SERIALIZE TEXT 或 SERIALIZE BINARY,则会执行相应的转换,并测量执行此操作所花费的时间(除非指定了 TIMING OFF)。如果还指定了 BUFFERS 选项,则也会计算转换中涉及的任何缓冲区访问。但是,在任何情况下,EXPLAIN 都不会实际将生成的数据发送到客户端;因此,无法通过这种方式调查网络传输成本。只有在也启用了 ANALYZE 时,才能启用序列化。如果 SERIALIZE 未带参数写入,则假定为 TEXT。
WAL包括有关 WAL 记录生成的信息。具体来说,包括记录数、完整页面镜像 (fpi) 数和生成的 WAL 量(以字节为单位)。在文本格式中,仅打印非零值。只有在也启用了 ANALYZE 时,才能使用此参数。它默认为 FALSE。
TIMING在输出中包括实际启动时间和每个节点中花费的时间。重复读取系统时钟的开销可能会在某些系统上显著减慢查询速度,因此当只需要实际行数,而不需要确切的时间时,将此参数设置为 FALSE 可能很有用。即使使用此选项关闭了节点级计时,也始终会测量整个语句的运行时。只有在也启用了 ANALYZE 时,才能使用此参数。它默认为 TRUE。
SUMMARY在查询计划后包括摘要信息(例如,合计的计时信息)。默认情况下,当使用 ANALYZE 时包含摘要信息,否则默认情况下不包含摘要信息,但可以使用此选项启用。 EXPLAIN EXECUTE 中的计划时间包括从缓存中获取计划所需的时间以及重新计划所需的时间(如果需要)。
MEMORY包括有关查询计划阶段的内存消耗信息。具体来说,包括规划器内存结构使用的精确存储量,以及考虑分配开销的总内存。此参数默认为 FALSE。
FORMAT指定输出格式,可以是 TEXT、XML、JSON 或 YAML。非文本输出包含与文本输出格式相同的信息,但更易于程序解析。此参数默认为 TEXT。
布尔值指定是否应启用或禁用所选选项。您可以写入 TRUE、ON 或 1 来启用该选项,以及 FALSE、OFF 或 0 来禁用它。 boolean 值也可以省略,在这种情况下,将假定为 TRUE。
语句任何 SELECT、INSERT、UPDATE、DELETE、MERGE、VALUES、EXECUTE、DECLARE、CREATE TABLE AS 或 CREATE MATERIALIZED VIEW AS 语句,您希望查看其执行计划。
命令的结果是为 statement 选择的计划的文本描述,可以选择使用执行统计信息进行注释。 第 14.1 节 介绍了所提供的信息。
为了使 PostgreSQL 查询规划器在优化查询时做出合理的决策,对于查询中使用的所有表,pg_statistic 数据应该是最新的。通常,自动清理守护进程 将自动处理此问题。但是,如果表的内容最近发生了重大更改,您可能需要手动执行 ANALYZE,而不是等待自动清理来跟上更改。
为了衡量执行计划中每个节点的运行时成本,当前 EXPLAIN ANALYZE 的实现为查询执行增加了性能分析开销。因此,在查询上运行 EXPLAIN ANALYZE 有时可能比正常执行查询花费的时间更长。开销的大小取决于查询的性质以及所使用的平台。最坏的情况发生在本身每次执行需要的时间很少的计划节点上,以及在获取一天的时间的操作系统调用相对较慢的机器上。
显示具有单个 integer 列和 10000 行的表上的简单查询的计划
EXPLAIN SELECT * FROM foo;
QUERY PLAN
---------------------------------------------------------
Seq Scan on foo (cost=0.00..155.00 rows=10000 width=4)
(1 row)
以下是相同的查询,使用 JSON 输出格式
EXPLAIN (FORMAT JSON) SELECT * FROM foo;
QUERY PLAN
--------------------------------
[ +
{ +
"Plan": { +
"Node Type": "Seq Scan",+
"Relation Name": "foo", +
"Alias": "foo", +
"Startup Cost": 0.00, +
"Total Cost": 155.00, +
"Plan Rows": 10000, +
"Plan Width": 4 +
} +
} +
]
(1 row)
如果存在索引,并且我们使用带有可索引 WHERE 条件的查询,EXPLAIN 可能会显示不同的计划
EXPLAIN SELECT * FROM foo WHERE i = 4;
QUERY PLAN
--------------------------------------------------------------
Index Scan using fi on foo (cost=0.00..5.98 rows=1 width=4)
Index Cond: (i = 4)
(2 rows)
以下是相同的查询,但使用 YAML 格式
EXPLAIN (FORMAT YAML) SELECT * FROM foo WHERE i='4';
QUERY PLAN
-------------------------------
- Plan: +
Node Type: "Index Scan" +
Scan Direction: "Forward"+
Index Name: "fi" +
Relation Name: "foo" +
Alias: "foo" +
Startup Cost: 0.00 +
Total Cost: 5.98 +
Plan Rows: 1 +
Plan Width: 4 +
Index Cond: "(i = 4)"
(1 row)
XML 格式留给读者自己练习。
以下是相同的计划,其中成本估算被抑制
EXPLAIN (COSTS FALSE) SELECT * FROM foo WHERE i = 4;
QUERY PLAN
----------------------------
Index Scan using fi on foo
Index Cond: (i = 4)
(2 rows)
以下是使用聚合函数的查询的查询计划示例
EXPLAIN SELECT sum(i) FROM foo WHERE i < 10;
QUERY PLAN
---------------------------------------------------------------------
Aggregate (cost=23.93..23.93 rows=1 width=4)
-> Index Scan using fi on foo (cost=0.00..23.92 rows=6 width=4)
Index Cond: (i < 10)
(3 rows)
以下是使用 EXPLAIN EXECUTE 显示预备查询的执行计划的示例
PREPARE query(int, int) AS SELECT sum(bar) FROM test
WHERE id > $1 AND id < $2
GROUP BY foo;
EXPLAIN ANALYZE EXECUTE query(100, 200);
QUERY PLAN
-------------------------------------------------------------------------------------------------------------------------
HashAggregate (cost=10.77..10.87 rows=10 width=12) (actual time=0.043..0.044 rows=10 loops=1)
Group Key: foo
Batches: 1 Memory Usage: 24kB
-> Index Scan using test_pkey on test (cost=0.29..10.27 rows=99 width=8) (actual time=0.009..0.025 rows=99 loops=1)
Index Cond: ((id > 100) AND (id < 200))
Planning Time: 0.244 ms
Execution Time: 0.073 ms
(7 rows)
当然,此处显示的特定数字取决于所涉及表的实际内容。另请注意,由于规划器的改进,PostgreSQL 版本之间的数字甚至所选的查询策略都可能有所不同。此外,ANALYZE 命令使用随机抽样来估算数据统计信息;因此,即使表中数据的实际分布没有改变,在刷新运行 ANALYZE 后,成本估算也可能会发生变化。
请注意,前面的示例显示了 EXECUTE 中给定的特定参数值的“自定义”计划。我们可能还希望查看参数化查询的通用计划,这可以使用 GENERIC_PLAN 完成
EXPLAIN (GENERIC_PLAN)
SELECT sum(bar) FROM test
WHERE id > $1 AND id < $2
GROUP BY foo;
QUERY PLAN
-------------------------------------------------------------------------------
HashAggregate (cost=26.79..26.89 rows=10 width=12)
Group Key: foo
-> Index Scan using test_pkey on test (cost=0.29..24.29 rows=500 width=8)
Index Cond: ((id > $1) AND (id < $2))
(4 rows)
在这种情况下,解析器正确地推断出 $1 和 $2 应该具有与 id 相同的数据类型,因此来自 PREPARE 的参数类型信息不足不是问题。在其他情况下,可能需要显式指定参数符号的类型,这可以通过转换它们来完成,例如
EXPLAIN (GENERIC_PLAN)
SELECT sum(bar) FROM test
WHERE id > $1::integer AND id < $2::integer
GROUP BY foo;
SQL 标准中没有定义 EXPLAIN 语句。
以下语法在 PostgreSQL 9.0 版本之前使用,并且仍然受支持
EXPLAIN [ ANALYZE ] [ VERBOSE ] statement
请注意,在此语法中,选项必须完全按照所示顺序指定。
如果您在文档中发现任何不正确、与您在特定功能上的经验不符或需要进一步澄清的内容,请使用此表单报告文档问题。