F.9. cube
这个模块实现了一种数据类型cube来表示多维立方体。
F.9.1. 语法
表 F-3展示了cube类型有效的外部表示。x、y等表示浮点数。
表 F-3. 立方体外部表示
外部语法 | 含义 |
---|---|
x | 一个一维点(或者长度为零的一维区间) |
(x) | 同上 |
x1,x2,...,xn | n-维空间中的一个点,内部表示为一个零容积立方体 |
(x1,x2,...,xn) | 同上 |
(x),(y) | 开始于x并且结束于y的一个一维区间,反之亦然。顺序并不重要 |
[(x),(y)] | 同上 |
(x1,...,xn),(y1,...,yn) | 一个 n-维立方体,用它的对角顶点对表示 |
[(x1,...,xn),(y1,...,yn)] | 同上 |
一个立方体的对角录入的顺序无关紧要。如果需要创建一种统一的"左下 — 右上"的内部表示,cube函数会自动地交换值。当角重合时,cube只存储一个角和一个"is point"标志,这样避免浪费空间。
输入中的空白空间会被忽略,因此[(x),(y)]与[ ( x ), ( y ) ]相同。
F.9.2. 精度
值在内部被存储为 64 位浮点数。这意味着超过 16 位有效位的数字将被截断。
F.9.3. 用法
表 F-4展示了为类型cube提供的操作符。
表 F-4. 立方体操作符
操作符 | 结果 | 描述 |
---|---|---|
a = b | boolean | 立方体 a 和 b 相同。 |
a && b | boolean | 立方体 a 和 b 重叠。 |
a @> b | boolean | 立方体 a 包含 立方体 b。 |
a <@ b | boolean | 立方体 a 被包含在立方体 b 中。 |
a < b | boolean | 立方体 a 小于立方体 b。 |
a <= b | boolean | 立方体 a 小于或者等于立方体 b。 |
a > b | boolean | 立方体 a 大于立方体 b。 |
a >= b | boolean | 立方体 a 大于或者等于立方体 b。 |
a <> b | boolean | 立方体 a 不等于立方体 b。 |
a -> n | float8 | 得到立方体的第n个坐标(从 1 开始数)。 |
a ~> n | float8 | 在"一般化"立方体表达中得到第n个坐标, 在这种形式中坐标已经被重新整理成"左下 — 右上"的形式。也就是说每个维度上较小的端点会先出现。 |
a <-> b | float8 | a 和 b 之间的欧氏距离。 |
a <#> b | float8 | a 和 b 之间的直线距离(taxicab 距离,L1 度量)。 |
a <=> b | float8 | a 和 b 之间的切比雪夫(L-inf 度量)距离。 |
(在 PostgreSQL 8.2 之前,包含操作符@>和<@分别被称为@和~。这些名称仍然可用,但是已经被废弃并且最终将会退休。注意旧的名字与之前核心几何数据类型遵循的习惯相反!)
标量排序操作符(<、>=等)除了用来排序之外没有什么实际用途。这些操作符首先比较第一个坐标,如果它们相等再比较第二个坐标等等。它们主要为支持cube的 b-树索引操作符类而存在,这类操作符对支持cube列上的 uniqUE 约束等很有用。
cube模块也为cube值提供了一个 GiST 索引操作符类。cube GiST 索引可以被用于在WHERE子句中通过=、&&、@>以及<@操作符来搜索值。
此外,cube GiST 索引可以被用在ORDER BY子句中通过度量操作符<->、<#>和<=>来查找最近邻。例如, 3-D 点(0.5, 0.5, 0.5)的最近邻可以用下面的查询很快地找到:
SELECT c FROM test ORDER BY c <-> cube(array[0.5,0.5,0.5]) LIMIT 1;
也可以用这种方式使用~>操作符来高效地检索通过选定坐标排序后的前几个值。例如,可以用下面的查询得到通过第一个坐标(左下角)升序排列后的前几个立方体:
SELECT c FROM test ORDER BY c ~> 1 LIMIT 5;
以及得到通过右上角第一个坐标降序排列后的 2-D 立方体:
SELECT c FROM test ORDER BY c ~> 3 DESC LIMIT 5;
表 F-5展示了可用的函数。
表 F-5. 立方体函数
函数 | 结果 | 描述 | 例子 |
---|---|---|---|
cube(float8) | cube | 制造一个一维立方体,坐标都是相同的。 | cube(1) == '(1)' |
cube(float8, float8) | cube | 制造一个一维立方体。 | cube(1,2) == '(1),(2)' |
cube(float8[]) | cube | 使用数组定义的坐标制造一个零容积的立方体。 | cube(ARRAY[1,2]) == '(1,2)' |
cube(float8[], float8[]) | cube | 用由两个数组定义的右上和左下坐标制造一个立方体,两个数组必须等长。 | cube(ARRAY[1,2], ARRAY[3,4]) == '(1,2),(3,4)' |
cube(cube, float8) | cube | 在一个现有的立方体上增加一维来制造一个新立方体,对新坐标的各个端点都采用相同的值。这可以用于从计算得到的值逐渐地构建立方体。 | cube('(1,2),(3,4)'::cube, 5) == '(1,2,5),(3,4,5)' |
cube(cube, float8, float8) | cube | 在一个现有的立方体上增加一维来制造一个新立方体。这可以用于从计算得到的值逐渐地构建立方体。 | cube('(1,2),(3,4)'::cube, 5, 6) == '(1,2,5),(3,4,6)' |
cube_dim(cube) | integer | 返回该立方体的维数 | cube_dim('(1,2),(3,4)') == '2' |
cube_ll_coord(cube, integer) | float8 | 返回一个立方体的左下角的第 n个坐标值 | cube_ll_coord('(1,2),(3,4)', 2) == '2' |
cube_ur_coord(cube, integer) | float8 | 返回一个立方体的右上角的第n个坐标值 | cube_ur_coord('(1,2),(3,4)', 2) == '4' |
cube_is_point(cube) | boolean | 如果一个立方体是一个点则返回真,也就是两个定义点相同。 | |
cube_distance(cube, cube) | float8 | 返回两个立方体之间的距离。如果两个都是点,这就是普通距离函数。 | |
cube_subset(cube, integer[]) | cube | 从一个现有的立方体制造一个新立方体,使用来自于一个数组的维索引列表。它可以被用来抽取一个单一维度的端点,或者它可以被用来去除维度,或者按照需要对它们重新排序。 | cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[2]) == '(3),(7)' cube_subset(cube('(1,3,5),(6,7,8)'), ARRAY[3,2,1,1]) == '(5,3,1,1),(8,7,6,6)' |
cube_union(cube, cube) | cube | 产生两个立方体的并 | |
cube_inter(cube, cube) | cube | 产生两个立方体的交 | |
cube_enlarge(c cube, r double, n integer) | cube | 用一个指定的半径r在至少n个维度上增加立方体的尺寸。如果该半径是负值,则该立方体会收缩。这有助于围绕一个点创建一个外包盒来搜索附近点。所有已定义的维度都会按照半径r被改变。左下坐标按照r被减小并且右上坐标按照r被增加。如果一个左下坐标被增加得超过对应的右上坐标(这只会发生在r< 0 时),则两个坐标会被设置为它们的均值。如果n大于已定义的维度数并且该立方体被增加(r >= 0), 则额外的维度会被加入以让维度数达到n,对于额外的坐标将使用 0 作为初始值。这个函数可用来创建围绕一个点的外包盒以搜索临近点。 | cube_enlarge('(1,2),(3,4)', 0.5, 3) == '(0.5,1.5,-0.5),(3.5,4.5,0.5)' |
F.9.4. 默认值
我相信这个并:
select cube_union('(0,5,2),(2,3,1)', '0'); cube_union ------------------- (0, 0, 0),(2, 5, 2) (1 row)
不会与常识矛盾,下面的交也不会
select cube_inter('(0,-1),(1,1)', '(-2),(2)'); cube_inter ------------- (0, 0),(1, 0) (1 row)
在所有不同维度立方体的二元操作中,我假定低纬度的那一个要做笛卡尔投影,即为字符串表示中被省略的坐标取零。上面的例子等同于:
cube_union('(0,5,2),(2,3,1)','(0,0,0),(0,0,0)'); cube_inter('(0,-1),(1,1)','(-2,0),(2,0)');
下列包含谓词使用点语法,不过实际上第二个参数在内部被表示为一个盒子。这种语法让我们不必定义一种单独的点类型以及用于(盒子, 点)谓词的函数。
select cube_contains('(0,0),(1,1)', '0.5,0.5'); cube_contains -------------- t (1 row)
F.9.5. 注解
用法的例子可见回归测试sql/cube.sql。
为了不容易出问题,对于立方体的维度数有 100 的限制。如果你想要更大的立方体,可以在cubedata.h中修改。
F.9.6. 工作人员
原作者:Gene Selkov, Jr. <selkovjr@mcs.anl.gov>
,数学与计算机科学部,阿尔贡国家实验室。
我的感谢主要要献给 Joe Hellerstein 教授(Http://db.cs.berkeley.edu/jmh/),他阐明了 GiST (http://gist.cs.berkeley.edu/),还要送给他以前的学生 Andy Dong,他为 Illustra 编写了例子。我也对所有的 Postgres 开发者(现在的和以前的)心存感激,他们让我能够创造自己的世界并且宁静地生活在其中。我也要感谢阿尔贡实验室和美国能源局对我多年数据库研究的支持。
这个包的小更新由 Bruno Wolff III <bruno@wolff.to>
于 2002 年 8/9 月完成。这些修改包括将精度从单精度改为双精度以及增加了一些新的函数。
额外的更新由 Joshua Reich <josh@root.net>
在 2006 年 7 月做出。其中包括cube(float8[], float8[])并且将代码从废弃的 V0 协议改到 V1 调用协议。