PostgreSQL：文档：18：66.1. 数据库文件布局

支持的版本：当前 (18) / 17 / 16 / 15 / 14 / 13

开发版本： devel

不支持的版本： 12 / 11 / 10 / 9.6 / 9.5 / 9.4 / 9.3 / 9.2 / 9.1 / 9.0 / 8.4 / 8.3 / 8.2

66.1. 数据库文件布局
上一步	上一级	第 66 章数据库物理存储	首页	下一步

66.1. 数据库文件布局 #

本节介绍文件和目录级别的存储格式。

传统上，数据库集群使用的配置文件和数据文件存储在集群的数据目录中，通常称为 PGDATA（源自可用于定义它的环境变量的名称）。PGDATA 的一个常见位置是 /var/lib/pgsql/data。同一台机器上可以存在由不同服务器实例管理的多个集群。

PGDATA 目录包含几个子目录和控制文件，如表 66.1所示。除了这些必需项之外，集群配置文件 postgresql.conf、pg_hba.conf 和 pg_ident.conf 传统上存储在 PGDATA 中，尽管也可以将它们放在其他位置。

表 66.1. PGDATA 的内容

项	描述
`PG_VERSION`	一个包含 PostgreSQL 主版本号的文件
`base`	包含每个数据库子目录的子目录
`current_logfiles`	记录日志收集器当前写入的日志文件的文件
`global`	包含集群范围表的子目录，例如 `pg_database`
`pg_commit_ts`	包含事务提交时间戳数据的子目录
`pg_dynshmem`	包含动态共享内存子系统使用的文件的子目录
`pg_logical`	包含逻辑解码状态数据的子目录
`pg_multixact`	包含多事务状态数据（用于共享行锁）的子目录
`pg_notify`	包含 LISTEN/NOTIFY 状态数据的子目录
`pg_replslot`	包含复制槽数据的子目录
`pg_serial`	包含已提交的串行化事务信息的子目录
`pg_snapshots`	包含导出快照的子目录
`pg_stat`	包含统计子系统的永久文件的子目录
`pg_stat_tmp`	包含统计子系统的临时文件的子目录
`pg_subtrans`	包含子事务状态数据的子目录
`pg_tblspc`	包含指向表空间的符号链接的子目录
`pg_twophase`	包含已准备事务状态文件的子目录
`pg_wal`	包含 WAL（预写日志）文件的子目录
`pg_xact`	包含事务提交状态数据的子目录
`postgresql.auto.conf`	一个用于存储由 `ALTER SYSTEM` 设置的配置参数的文件
`postmaster.opts`	一个记录服务器上次启动时使用的命令行选项的文件
`postmaster.pid`	一个锁定文件，记录当前 postmaster 进程 ID (PID)、集群数据目录路径、postmaster 启动时间戳、端口号、Unix 域套接字目录路径（可能为空）、第一个有效的 listen_address（IP 地址或 `*`，如果未监听 TCP 则为空）以及共享内存段 ID（服务器关闭后此文件不存在）

集群中的每个数据库在 PGDATA/base 目录下都有一个子目录，该子目录以数据库在 pg_database 中的 OID 命名。此子目录是数据库文件的默认位置；特别是，其系统目录存储在此处。

请注意，以下章节描述了内置 heap 表访问方法和内置索引访问方法的行为。由于 PostgreSQL 的可扩展性，其他访问方法可能行为不同。

每个表和索引都存储在单独的文件中。对于普通关系，这些文件以表或索引的 filenode 号命名，可以在 pg_class.relfilenode 中找到。但对于临时关系，文件名形式为 tBBB_FFF，其中 BBB 是创建文件的后端进程号，FFF 是 filenode 号。无论哪种情况，除了主文件（又名主分支）之外，每个表和索引都有一个 空闲空间映射（参见 66.3 节），其中存储有关关系可用空闲空间的信息。空闲空间映射存储在一个以 filenode 号加上 _fsm 后缀命名的文件中。表还有一个 可见性映射，存储在带有 _vm 后缀的分支中，用于跟踪已知没有死元组的页面。可见性映射在 66.4 节中有更详细的描述。未记录的表和索引有一个第三个分支，称为初始化分支，它存储在带有 _init 后缀的分支中（参见 66.5 节）。

注意

请注意，虽然表的 filenode 通常与其 OID 匹配，但情况并非如此；某些操作，如 TRUNCATE、REINDEX、CLUSTER 和某些形式的 ALTER TABLE，可以在保留 OID 的同时更改 filenode。避免假定 filenode 和表 OID 相同。此外，对于某些系统目录（包括 pg_class 本身），pg_class.relfilenode 包含零。这些目录的实际 filenode 号存储在更低级别的结构中，可以使用 pg_relation_filenode() 函数获取。

当表或索引的大小超过 1 GB 时，它将被分成 1 GB 大小的段。第一个段的文件名与 filenode 相同；后续段命名为 filenode.1、filenode.2 等。这种安排可以避免在文件大小有限制的情况下出现问题。（实际上，1 GB 只是默认段大小。段大小可以在构建 PostgreSQL 时使用配置选项 --with-segsize 进行调整。）原则上，空闲空间映射和可见性映射分支也可能需要多个段，尽管在实践中这种情况不太可能发生。

包含可能包含大条目的列的表将有一个关联的 TOAST 表，用于对无法保留在表行中的字段值进行行外存储。pg_class.reltoastrelid 从表链接到其TOAST表（如果存在）。有关更多信息，请参见 66.2 节。

表和索引的内容将在 66.6 节中进一步讨论。

表空间使情况更加复杂。每个用户定义的表空间在 PGDATA/pg_tblspc 目录内都有一个符号链接，该链接指向物理表空间目录（即，在 CREATE TABLESPACE 命令中指定的目录）。此符号链接以表空间的 OID 命名。在物理表空间目录内有一个子目录，其名称取决于 PostgreSQL 服务器版本，例如 PG_9.0_201008051。（使用此子目录的原因是，连续版本的数据库可以使用相同的 CREATE TABLESPACE 位置值而不会发生冲突。）在版本特定的子目录中，有一个目录用于在表空间中有元素的每个数据库，该目录以数据库的 OID 命名。表和索引在此目录内存储，使用 filenode 命名方案。pg_default 表空间不通过 pg_tblspc 访问，而是对应于 PGDATA/base。类似地，pg_global 表空间不通过 pg_tblspc 访问，而是对应于 PGDATA/global。

函数 pg_relation_filepath() 显示任何关系的完整路径（相对于 PGDATA）。它通常用作记忆上述许多规则的替代方法。但请记住，此函数仅提供关系的第一个主分支段的名称 — 您可能需要附加段号和/或 _fsm、_vm 或 _init 来查找与该关系关联的所有文件。

临时文件（用于排序超过内存容量的数据等操作）在 PGDATA/base/pgsql_tmp 中创建，或者如果在它们上指定了非 pg_default 的表空间，则在表空间目录的 pgsql_tmp 子目录中创建。临时文件的名称形式为 pgsql_tmpPPP.NNN，其中 PPP 是拥有后端的 PID，NNN 用于区分该后端的不同临时文件。

上一步	上一级	下一步
第 66 章数据库物理存储	首页	66.2. TOAST

提交更正

如果您在文档中发现任何不正确之处、与您对特定功能的体验不符之处或需要进一步说明之处，请使用此表单报告文档问题。