bytea
数据类型允许存储二进制字符串;请参阅 表 8.6.
表 8.6. 二进制数据类型
名称 | 存储大小 | 描述 |
---|---|---|
bytea |
1 或 4 字节加上实际二进制字符串 | 可变长度二进制字符串 |
二进制字符串是一系列八位字节(或字节)。二进制字符串与字符字符串有两个区别。首先,二进制字符串专门允许存储值为零的八位字节和其他“不可打印” 八位字节(通常是十进制范围 32 到 126 之外的八位字节)。字符字符串不允许使用零八位字节,也不允许使用任何其他八位字节值和根据数据库选择的字符集编码无效的八位字节值序列。其次,对二进制字符串的操作处理实际字节,而字符字符串的处理依赖于区域设置。简而言之,二进制字符串适合存储程序员认为是“原始字节” 的数据,而字符字符串适合存储文本。
bytea
类型支持两种输入和输出格式:“十六进制” 格式和 PostgreSQL 的历史“转义” 格式。两种格式在输入时都始终被接受。输出格式取决于配置参数 bytea_output;默认值为十六进制。(请注意,十六进制格式是在 PostgreSQL 9.0 中引入的;早期版本和某些工具不理解它。)
该SQL标准定义了另一种二进制字符串类型,称为 BLOB
或 BINARY LARGE OBJECT
。输入格式不同于 bytea
,但提供的函数和运算符基本相同。
bytea
十六进制格式 #“十六进制” 格式将二进制数据编码为每个字节 2 个十六进制数字,最高有效 nibble 在前。整个字符串前面是序列 \x
(为了将其与转义格式区分开来)。在某些情况下,初始反斜杠可能需要通过加倍来转义(请参阅 第 4.1.2.1 节)。对于输入,十六进制数字可以是大写或小写,并且在数字对之间允许使用空格(但在数字对内部或起始 \x
序列中不允许使用空格)。十六进制格式与广泛的外部应用程序和协议兼容,并且其转换速度往往快于转义格式,因此建议使用它。
示例
SET bytea_output = 'hex'; SELECT '\xDEADBEEF'::bytea; bytea ------------ \xdeadbeef
bytea
转义格式 #“转义” 格式是 bytea
类型的传统 PostgreSQL 格式。它采用将二进制字符串表示为 ASCII 字符序列的方法,同时将无法表示为 ASCII 字符的字节转换为特殊转义序列。如果从应用程序的角度来看,将字节表示为字符是有意义的,那么这种表示方法可能很方便。但在实践中,它通常会令人困惑,因为它模糊了二进制字符串和字符字符串之间的区别,而且选择的特定转义机制也有些笨拙。因此,这种格式可能应该在大多数新应用程序中避免使用。
在以转义格式输入 bytea
值时,某些值的八位字节必须 转义,而所有八位字节值可以 转义。一般来说,要转义八位字节,将其转换为其三位八进制值并在其前面添加反斜杠。反斜杠本身(八位字节十进制值为 92)也可以用双反斜杠表示。表 8.7 显示了必须转义的字符,并在适用时给出替代转义序列。
表 8.7. bytea
字面量转义八位字节
八位字节十进制值 | 描述 | 转义输入表示 | 示例 | 十六进制表示 |
---|---|---|---|---|
0 | 零八位字节 | '\000' |
'\000'::bytea |
\x00 |
39 | 单引号 | '''' 或 '\047' |
''''::bytea |
\x27 |
92 | 反斜杠 | '\\' 或 '\134' |
'\\'::bytea |
\x5c |
0 到 31 和 127 到 255 | “不可打印” 八位字节 | '\ (八进制值) |
'\001'::bytea |
\x01 |
转义不可打印 八位字节的要求根据区域设置而异。在某些情况下,您可以避免转义它们。
必须加倍单引号的原因(如 表 8.7 所示)是因为对于 SQL 命令中的任何字符串字面量而言,这都是正确的。通用的字符串字面量解析器将消耗最外层的单引号并将任何一对单引号缩减为一个数据字符。bytea
输入函数所看到的是一个单引号,它将其视为一个普通数据字符。但是,bytea
输入函数将反斜杠视为特殊字符,表 8.7 中显示的其他行为是由该函数实现的。
在某些情况下,与上面显示的相比,反斜杠必须加倍,因为通用的字符串字面量解析器也会将反斜杠对缩减为一个数据字符;请参阅 第 4.1.2.1 节.
Bytea
八位字节默认以 hex
格式输出。如果您将 bytea_output 更改为 escape
,“不可打印” 八位字节将转换为其等效的三位八进制值,并在其前面添加一个反斜杠。大多数“可打印” 八位字节通过其在客户端字符集中的标准表示进行输出,例如
SET bytea_output = 'escape'; SELECT 'abc \153\154\155 \052\251\124'::bytea; bytea ---------------- abc klm *\251T
十进制值为 92(反斜杠)的八位字节在输出中加倍。详细信息请参阅 表 8.8.
表 8.8. bytea
输出转义八位字节
八位字节十进制值 | 描述 | 转义输出表示 | 示例 | 输出结果 |
---|---|---|---|---|
92 | 反斜杠 | \\ |
'\134'::bytea |
\\ |
0 到 31 和 127 到 255 | “不可打印” 八位字节 | \ (八进制值) |
'\001'::bytea |
\001 |
32 到 126 | “可打印” 八位字节 | 客户端字符集表示 | '\176'::bytea |
~ |
根据您使用的 PostgreSQL 前端,您可能需要在转义和取消转义 bytea
字符串方面做一些额外的工作。例如,如果您使用的是自动将这些字符翻译成其他字符的接口,那么您可能还需要转义换行符和回车符。
如果您在文档中发现任何不正确的内容,与您对特定功能的体验不符或需要进一步说明,请使用 此表格 报告文档问题。