麦田守望者's profile异想空间PhotosBlogLists Tools Help

Blog


    4/11/2008

    操作bytea类型

    如果想要在PostgreSQL中存储二进制数据,例如存储Word、Excel文档,图片文件等,可以使用bytea类型的列。bytea类型是PostgreSQL特有的存储二进制数据的字段类型,与SQL标准中的BLOB和BINARY LARGE OBJECT类型异曲同工。这在PostgreSQL文档的bytea类型介绍中有所说明。

    接下来先说说如何向表中插入、更新bytea数据。

    PostgreSQL允许在SQL命令中包含bytea类型的数据,以便能够使用INSERT向表中插入含有二进制数据的记录,使用UPDATE和调用与bytea类型相关的函数更新和操作bytea类型数据。二进制数据是一个字节序列,然而SQL命令是文本字符串,怎样在SQL中写入二进制数据呢?答案很简单,把每一个字节转换成对应的三位十进制数字的八进制数字符串表示,以双斜线做为前缀,即0x00表示为\\000、0x2C表示为\\02C、0xFF表示为\\377,并按照bytea类型的要求在字符串前端的单引号外注明E。举例如下:

    INSERT INTO table1 (fileid, filename, content) VALUES (1, 'filename.doc', E'\\000\\001\\002');
    INSERT INTO table1 (fileid, filename, content) VALUES (2, 'anotherfile.jpg', E'\\000\\377');
    UPDATE table1 SET content = E'\\000\\000\\000' WHERE fileid = 1;
    UPDATE table1 SET content = content || E'\\377\\377\\377' WHERE fileid = 2;

    可以在INSERT INTO中包含整个文件的bytea类型字符串,也可以像上面第四行那样,分块追加。对于短小的二进制数据,在命令控制台中编辑SQL命令也未尝不可。但是如果要存储一个图片文件或者Word文档之类的大型二进制数据的时候,就需要借助数据访问借口,或者自己写一个字节转换程序,直接操作SQL语句。

    插入bytea数据后可以使用SELECT语句获取它。如下所示:

    SELECT content FROM table1;

    在命令控制台中,我们会看到以输入时的字符串格式输出二进制数据,这是PostgreSQL做的转换。在Python中使用psycopg2模块,执行上述SELECT语句后能够获得原始的二进制字节字符串,可以直接写入二进制文件。

    顺便说明一下。对于字节的转换,PostgreSQL的文档说的非常详细,按照零字节、单引号、斜线,以及字符的可打印性分别作了讨论。原因是需要逃逸单引号和斜线字符,另外可打印字符可以不作转换,直接出现。

    3/14/2008

    PostgreSQL处理varchar和char的独到之处

    在PostgreSQL中,varchar(n)和char(n)是character varying(n)和character(n)的别名。对于这两种字符类型数据的处理性能与其他某些数据库不同,在PostgreSQL中,没有任何的差别。如果在应用过程中出现性能差别的话,应该从具体应用出发进行分析。
    在声明列类型的时候,可以直接写varchar。这样使得列能够包含任意多的字符数。此种行为不是SQL标准,是PostgreSQL的扩展。类似的行为也出现在SQL Server 2005中。
    3/7/2008

    原来,在列定义中写上NULL不是SQL标准

    NOT NULL是一个约束,出现在列(不同数据库产品有其自己的叫法)定义中。它不同于其他的SQL约束,无法给一个NOT NULL约束命名,或者在表级别定义属于表的约束。相反,我们也可以定义NULL,使得列能够存储NULL值。但是,在列定义中写上NULL不属于SQL标准!
    2/21/2008

    原来PostgreSQL有Sun的支持

    大家都在关注Sun买下MySql。原来PostgreSQL的背后也有Sun的支持!