Ubuntu下PostgreSQL数据库集群(PL/Proxy)配置方法

三个函数的作用:
plproxy.get_cluster_config: 这个函数其实是获取不同的集群的配置，我们这里可以给不同的集群（比如Arvindb等）不同的类似超时时间、长短连接等的设置。
plproxy.get_cluster_partitions: 这个函数是让plproxy可以找到对应的集群，“Arvindb ”是集群的名称，根据自己的需要指定，这个名称在后面查询的时候要用到；”dbname”, “host” 等参数就是PostgreSQL标准的数据库连接串的配置方法，本试验中就是database0节点和database1节点的信息告诉proxy节点。
plproxy.get_cluster_version: 这个函数其实是plproxy用于判断是否给前端返回已经cache过的结果用的，这样，因为函数本身可以动态更新（无需down机），那么我们可以通过重新创建函数，返回不同RETURN的值，实现cache的失效控制。

plproxy过程语言设计的目的是实现数据库集群，集群受proxy节点管理，proxy获取集群的信息（比如节点的IP地址等等信息）的方法就是调用上面创建的三个函数，所以配置集群信息的方法就是创建/修改这三个函数。

使用plproxy过程语言的用户不需要显式的调用这三个函数，但是在调用plproxy过程语言定义的函数的时候，plproxy过程自己会在内部调用目录plproxy下的这三个函数：
I.对于plproxy.get_cluster_config和plproxy.get_cluster_partitions函数，内部调用一次后就不再调用；
以plproxy.get_cluster_partitions为例子的实验是：
a.执行plproxy 过程语言定义的函数–>成功;
b.删除plproxy.get_cluster_partitions函数，调用plproxy过程语言定义的函数，执行成功。
一个特殊情况:如果删除plproxy.get_cluster_partitions函数之前，数据库系统从未执行过任何plproxy过程语言定义的函数，执行plproxy过程语言定义的函数将会失败).
另外一个实验是：
a.执行plproxy 过程语言定义的函数–>成功;(集群信息为“dbname=Arvindb host=10.13.19.55”和dbname=Arvindb host=10.13.19.70)
b.修改plproxy.get_cluster_partitions函数(集群信息为“dbname=Arvindb host=10.13.19.55”和dbname=Arvindb host=10.13.19.71，调用plproxy过程语言定义的函数，执行成功。但是使用的集群信息仍然是：“dbname=Arvindb host=10.13.19.55”和dbname=Arvindb host=10.13.19.70)。

II.对于plproxy.get_cluster_version函数，执行plproxy过程语言定义的函数的时候，内部每次都会调用plproxy.get_cluster_version函数。实验的方法可与参考前面的方法。

总结一下：如果修改了plproxy.get_cluster_config和plproxy.get_cluster_partitions函数,想立即生效的话，就需要重启postgresql服务(其他方法还没有深究过):/etc/init.d/postgresql-8.4 restart

从网上参考的资料，以及相关pdf中参看的代码会有一些问题：字符不对，同样为单引号，但是pdf中的单引号是‘（看清楚：不是正确的’），等等之类很难发现的错误，严重影响了工作进度。

再补充一下：下面的实验表明 postgresql下的函数定义/修改/删除是及时生效的：
创建一个函数：
CREATE OR REPLACE FUNCTION fun_test() RETURNS integer AS
$BODY$ SELECT 33; $BODY$
LANGUAGE ‘sql’ VOLATILE COST 100;
执行这个函数:
select fun_test();———> 正常执行
删除这个函数：
DROP FUNCTION fun_test;
执行这个函数：
select fun_test(); ——–>执行失败:找不到函数fun_test();

第十一步：在proxy节点上创建三个函数：

public.ddlexec(sql_request text)
public.dmlexec(sql_request text)
public.dqlexec(sql_request text)

root@ubuntuserver:~# sudo -u postgres psql Arvindb
创建的sql代码是：
CREATE OR REPLACE FUNCTION ddlexec(query text)

RETURNS SETOF integer AS

$BODY$

CLUSTER 'arvincluster';

RUN ON ALL;

$BODY$

LANGUAGE 'plproxy' VOLATILE

COST 100

ROWS 1000;

CREATE OR REPLACE FUNCTION dmlexec(query text)

RETURNS SETOF integer AS

$BODY$

CLUSTER 'arvincluster';

RUN ON ANY;

$BODY$

LANGUAGE 'plproxy' VOLATILE

COST 100

ROWS 1000;

CREATE OR REPLACE FUNCTION dqlexec(query text)

RETURNS SETOF record AS

$BODY$

CLUSTER 'arvincluster';

RUN ON ALL;

$BODY$

LANGUAGE 'plproxy' VOLATILE

COST 100

ROWS 1000; ROWS 1000;执行后在pgAdmin3客户端观看到的效果是：

下面是解释，不想了解的话，可以直接跳过。

这三个函数的作用就是：用户通过调用者三个函数操纵集群（比如select ddlexec(‘create table usertable’)就会在集群的database0和database1上同时创建一个表usertable）。

这三个函数都是plproxy过程语言的函数，函数中的RUN指令会调用集群节点上的同名函数，所以还需为集群上的数据库节点database0和database1创建同名的函数（只要同名，不需要也是plproxy过程语言定义）。
RUN ON指令之后的的ALL表示在集群上的所有数据库节点上运行(本试验就是database0和databse1都要执行)
RUN ON指令之后的的ANY表示在集群上的任取一个数据库节点上运行(本试验就是database0和databse1中任意取一个执行)
RUN ON 之后也可以是一个数字: 表示在几号节点上运行，比如 RUN ON 0/RUN ON 1。也可以自己写一个算法决定如何分配任务: 比如RUN ON hashtext(表的主键值)&1。表示将表的主键(文本类型)计算出一个hash值，然和1做与运算。就可以根据主键分配数据库节点。

第十二步：为database0和database1节点的”Arvindb”数据库创建plpgsql过程语言

root@ubuntuserver:~# sudo -u postgres psql Arvindb
Arvindb=# create language plpgsql;
或者：sudo -u postgres createlang plpgsql “Arvindb”
创建的原因是：database0和database1节点需要创建一些函数，这些函数是plpgsql过程语言定义的。

第十三步：在database0和database1节点上创建下面三个函数

public.ddlexec(sql_request text)
public.dmlexec(sql_request text)
public.dqlexec(sql_request text)

root@ubuntuserver:~# sudo -u postgres psql Arvindb
创建的SQL语句如下：
CREATE OR REPLACE FUNCTION ddlexec(query text)

RETURNS integer AS

$BODY$

declare

ret integer;

begin

execute query;

return 1;

end;

$BODY$

LANGUAGE 'plpgsql' VOLATILE

COST 100;

CREATE OR REPLACE FUNCTION dmlexec(query text)

RETURNS integer AS

$BODY$

declare

ret integer;

begin

execute query;

return 1;

end;

$BODY$

LANGUAGE 'plpgsql' VOLATILE

COST 100;

CREATE OR REPLACE FUNCTION dqlexec(query text)

RETURNS SETOF record AS

$BODY$

declare

ret record;

begin

for ret in execute query loop

return next ret;

end loop;

return;

end;

$BODY$

LANGUAGE 'plpgsql' VOLATILE

COST 100

ROWS 1000;执行后在pgAdmin3客户端观看到的效果是：

第十四步：集群创建user表，在proxy上执行：

root@ubuntuserver:~# sudo -u postgres psql Arvindb

Arvindb=# select ddlexec('create table usertable(id integer)');

可以通过pgAdmin3看到创建的结果：

第十五步：向集群的user表中插入一些数据，在proxy上执行：

root@ubuntuserver:~# sudo -u postgres psql Arvindb
select dmlexec(‘insert into usertable values(0)’);
select dmlexec('insert into usertable values(0)');

select dmlexec('insert into usertable values(1)');

select dmlexec('insert into usertable values(2)');

select dmlexec('insert into usertable values(3)');

select dmlexec('insert into usertable values(4)');

select dmlexec('insert into usertable values(5)');

select dmlexec('insert into usertable values(6)');

select dmlexec('insert into usertable values(7)');

select dmlexec('insert into usertable values(8)');

select dmlexec('insert into usertable values(9)');

select dmlexec('insert into usertable values(10)');
可以通过pgAdmin3看到创建的结果（数据存到那个节点取决于分配算法）：

第十六步：查询集群的user表的记录，在proxy上执行：

select * from dqlexec('select * from usertable') as (id integer);
注意：必须要有as之后的内容，原因是， plpgsql过程语言的record返回类型需要有列定义。
可以通过pgAdmin3看到创建的结果：

续:

可能出现的问题	解决方案
用apt-get安装时，无法找到安装包	（1）更新安装源地址，建议用百度安装源输入命令：sudo vim /etc/apt/sources.list(安装源自己找，删除原有代码，复制到里面就可以了) （2）查看网络是否连接，ip、netmask、getway、dns是否正确配置输入命令：sudo vim /etc/network/interfaces （3）更新apt-get 输入命令：apt-get update
运行引用代码时，提示出现错误	（1）双引号，或单引号使用错误，手动更改为符合要求的。（2）丢失分号（；）应特别注意。
apt-get安装pgadmin3时，没有出现图形界面	（1）建议独立下载pgadmin3并安装
…….	……….

著:经过作者实践检验,可以正常实施.若有疑问，请加QQ;505024705

或e-mail:hl_linux@yahoo.cn

转载于:https://my.oschina.net/u/588294/blog/66751