guid主键 oracle_使用GUID作为数据库主键的测试
今天听了MSDN的WebCast,是关于Entlib的数据访问的讲座,末尾我问了两个自己所关心的问题:
在一个较大型的应用中,如果需要用到两套以上的数据库(如:SQL Server和Oracle),是否可以把需要的sql查询全部封装在存储过程里,这样就只需要一套访问代码了,有没有更好的方法解决这个问题?
在数据库的主键的设立中(同时支持多种数据库)直接用GUID作为主键来得简单,但是在查询的时候影响性能的因素大不大,还有没有更好的解决方法?
以上两个问题,由于时间的关系吧,微软的工程师解答的比较简略,第一个应该需要针对具体的应用来考虑,但是第二个问题,性能影响肯定是有的,但是影响大不大呢,带着这个问题,我做了这个小试验。
注:如果您有更好的建议不防贡献出来大家探讨探讨^_^!
测试环境:
Dell笔记本电脑 迅驰1.5G
Win XP professional
512MB DDR RAM
SQL Server 2000 个人版
测试方法:
建立有10个字段的数据库[test_GUID],使用GUID作为主键,以及其他常用的字段类型,模拟现实中的使用情况,建表的SQL代码如下:
CREATE TABLE [dbo].[Test_GUID] (
[GUID] [varchar] (50) COLLATE Chinese_PRC_CI_AS NOT NULL ,
[test1] [varchar] (50) COLLATE Chinese_PRC_CI_AS NULL ,
[test2] [datetime] NULL ,
[test3] [varchar] (50) COLLATE Chinese_PRC_CI_AS NULL ,
[test4] [varchar] (100) COLLATE Chinese_PRC_CI_AS NULL ,
[test5] [varchar] (100) COLLATE Chinese_PRC_CI_AS NULL ,
[test6] [varchar] (50) COLLATE Chinese_PRC_CI_AS NULL ,
[test7] [text] COLLATE Chinese_PRC_CI_AS NULL ,
[test8] [int] NULL ,
[test9] [int] NULL
) ON [PRIMARY] TEXTIMAGE_ON [PRIMARY]
GO
ALTER TABLE [dbo].[Test_GUID] WITH NOCHECK ADD
CONSTRAINT [PK_Test_GUID] PRIMARY KEY CLUSTERED
(
[GUID]
) ON [PRIMARY]
GO
建立有10个字段的数据库[test_IIDD],使用IIDD作为主键,以及其他常用的字段类型,模拟现实中的使用情况,建表的SQL代码如下:
CREATE TABLE [dbo].[Test_IIDD] (
[IIDD] [numeric] (9) IDENTITY(1,1) NOT NULL ,
[test1] [varchar] (50) COLLATE Chinese_PRC_CI_AS NULL ,
[test2] [datetime] NULL ,
[test3] [varchar] (50) COLLATE Chinese_PRC_CI_AS NULL ,
[test4] [varchar] (100) COLLATE Chinese_PRC_CI_AS NULL ,
[test5] [varchar] (100) COLLATE Chinese_PRC_CI_AS NULL ,
[test6] [varchar] (50) COLLATE Chinese_PRC_CI_AS NULL ,
[test7] [text] COLLATE Chinese_PRC_CI_AS NULL ,
[test8] [int] NULL ,
[test9] [int] NULL
) ON [PRIMARY] TEXTIMAGE_ON [PRIMARY]
GO
ALTER TABLE [dbo].[Test_IIDD] WITH NOCHECK ADD
CONSTRAINT [PK_Test_IIDD] PRIMARY KEY CLUSTERED
(
[IIDD]
) ON [PRIMARY]
GO
可以看到,第一个表使用全局唯一标识(GUID)来作为主键,而第二个表使用普通numeric(类似Int型)的数据类型来作为主键,关于GUID这里做一个小小介绍:
GUID,全局唯一标识,常用在COM组件的标识里,因为此几乎不可能生成重复的两个值,所以在各个领域经常用到,具体的值如:“A89C9547-032B-4860-ABB5-6EAEAVE934D5”所示,你一定看到过类似的字符串吧,^_^,在SQL Server2000 中使用newid()函数来获取一个唯一的GUID
分别运行如下两个SQL语句对两个表分别插入10万条语句,我所关心大数据量的情况下的效果,所以不要怪我开始点选择10万条数据的情况^_^。
declare @num int
set @num = 0
while(@num < 100000)
begin
insert into test_Guid
values(
newid(),
'X222222222222222222',
getdate(),
'AAAAAAAAAAAAAAAAAA',
'BBBBBBBBBBBBBBBB',
'CCCCCCCCCCCCCCCCCCCCCC',
'DDDDDDDDDDDDDDDDD',
'479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
',
'1',
'0'
)
set @num = @num+1
end
declare @num int
set @num = 0
while(@num < 100000)
begin
insert into test_IIDD
values(
'X222222222222222222',
getdate(),
'AAAAAAAAAAAAAAAAAA',
'BBBBBBBBBBBBBBBB',
'CCCCCCCCCCCCCCCCCCCCCC',
'DDDDDDDDDDDDDDDDD',
'479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
479C8AAD-3040-4FC5-B53A-D6AF085AD38A
',
'1',
'0'
)
set @num = @num+1
end
开始测试,测试代码及显示结果如下:
#测试一 (GUID)
--------------------
declare @times datetime
set @times = getdate()
--------------------
select * from test_guid
where
guid='A89C9547-032B-4860-ABB5-6EAEA0E934D5' or
guid='FFFA8619-BC9F-4B76-ACE8-B3324105BBDE' or
guid='FFFC26D5-6ECF-479D-838D-0D3E23AC7D2D' or
guid='FFF9FA53-E115-450A-A52D-B0AET36FF539' or
guid='A89C9547-032B-4860-ABB5-6EAEAVE934D5' or
guid='FFF90A0B-CB5B-446F-81FC-CFA661D03CF8' or
guid='FFF85F4A-4554-491F-9D1A-05C8BA3C1266' or
guid='FFFF354A-ED3E-4C3A-A033-3406F229EB34'
order by guid desc
---------------------
select datediff(second,@times,getdate()) as 秒,datediff(ms,@times,getdate()) as 毫秒
---------------------
0秒,0毫秒,有时会有10毫秒的情况
#测试二 (IIDD)
--------------------
declare @times datetime
set @times = getdate()
--------------------
select * from test_IIDD
where
IIDD='1' or
IIDD='2' or
IIDD='200' or
IIDD='8000' or
IIDD='8900' or
IIDD='3' or
IIDD='8' or
IIDD='10000'
order by IIDD desc
---------------------
select datediff(second,@times,getdate()) as 秒,datediff(ms,@times,getdate()) as 毫秒
---------------------
0秒,0毫秒,有时会有10毫秒的情况
可以看到在10万条数据的情况下,普通Select查询的时候效率影响还不大
#测试三 (GUID)
--------------------
declare @times datetime
set @times = getdate()
--------------------
select count(*) from test_guid
---------------------
select datediff(second,@times,getdate()) as 秒,datediff(ms,@times,getdate()) as 毫秒
---------------------
29秒,28793毫秒,效果不好啊!
#测试四(IIDD)
--------------------
declare @times datetime
set @times = getdate()
--------------------
select count(*) from test_IIDD
---------------------
select datediff(second,@times,getdate()) as 秒,datediff(ms,@times,getdate()) as 毫秒
---------------------
第一次运行3秒,第二次运行1秒,第三次运行0秒,50毫秒,my god!
这可如何是好,GUID在没有where子句的聚合运算时吃大亏了
#测试五 (GUID)
--------------------
declare @times datetime
set @times = getdate()
--------------------
select count(*) from test_guid
where
test2 > '2005-06-03 21:05:33.330'
---------------------
select datediff(second,@times,getdate()) as 秒,datediff(ms,@times,getdate()) as 毫秒
---------------------
29秒,29093毫秒,尽管查询出来只有200多条数据但速度没有变化!
#测试六(IIDD)
--------------------
declare @times datetime
set @times = getdate()
--------------------
select count(*) from test_IIDD
where
test2 > '2005-06-03 21:05:33.330'
---------------------
select datediff(second,@times,getdate()) as 秒,datediff(ms,@times,getdate()) as 毫秒
---------------------
第一次运行2秒,第二次运行0秒,160毫秒,比没有Where的情况稍慢
如结果所示,效果很不理想
#测试七 (GUID)
把test_GUID这个表的test2这一列(datetime)添加为索引列
运行【测试三】0秒,50毫秒,原来如此。。。
运行【测试五】0秒,0毫秒,非常明显了吧。
#测试八(IIDD)
把test_IIDD这个表的test2这一列(datetime)添加为索引列
运行【测试四】0秒,40毫秒
运行【测试六】0秒,40毫秒
上面的测试七和测试八在返回值方面不尽相同造成一些微小的差别这个可以忽略(因为我测试了在相同返回值的情况下差别是很小的)
可以看出在以GUID作为主键的表中加一个时间类型或是Int类型的索引可以弥补以GUID作为主键带来的性能损失。
总结:
此次测试由于时间的关系,测试的比较片面也很肤浅,还望能有高手把不足和疏漏的地方进行补充和改进,在这次测试后我想我还会做更多的关于性能方面的测试,有精力再做吧。
此次测试就只得出这么一点肤浅的东西,希望没有浪费您宝贵的时间^_^!
精彩评论:
吕震宇:
我想这个测试还存在一些问题,不是三言两语能说清楚的。挑几个我认为比较关键的说一说:
1、设计表时为什么用[GUID] [varchar] (50) ,是否出于兼容Oracle考虑?SQL Server中有UniqueIdentifier类型。
2、测试结论有问题“在以GUID作为主键的表中加一个时间类型或是Int类型的索引可以弥补以GUID作为主键带来的性能损失”在SQL
Server中,如果在一个有聚簇索引的表上再建立其它索引,那么其它索引链接的就不是页节点了,而是聚簇索引节点。也就是说,一个普通索引上的查询先检索普通索引,然后索引会告诉你对应数据的聚簇索引是什么,然后聚簇索引再告诉你数据再哪里。(可以参考微软SQL
Server培训教程)。不过这并不是问题的关键。关键在下面:
3、在上面的测试中,测试命令是:select count(*) from ... where test2 >
'2005-06-03
21:05:33.330'。问题发生在了count(*)上面。这里的查询只是计数,因此我们管它叫做索引覆盖查询,也就是只查时间索引就可以得到计数值,聚簇索引根本没有派上用场,也就是说根本没有比较聚簇索引的效率,所以你得到了速度一致的结论。这里,测试设计上有问题。你可以试试select
*替换select count(*) ,我想结果差异应当非常明显。关于索引可以参考http://www.cnblogs.com/zhenyulu/articles/25794.html
希望楼主再实验一下。
dragonpro: 我非常想用GUID做主键用在我们开发的系统里面,但是这涉及到的问题也是需要充分考虑的,为了这些问题,特别是性能问题,我都考虑很久了,希望能有个满意的处理方式,我的系统希望支持至少两种数据库,特别需要支持Oracle。
但在做表的时候,如果在表里不使用另外的非聚集索引,我想很多查询都会比较慢,那就比较可怕了。
又做了下测试,用UniqueIdentifier类型的话跟Int型的在查询方面相差不大,但是用varchar类型者需要在其他字段建立非聚集索引来为查询优化创造条件,不知道这样认为是否合适。
再有,在插入数据的时候如果GUID字段为聚集索引的话,由于字段值是随机的,我插入的数据并不知道要放在什么位置,这样是否也需要选择新记录插
入的位置而消耗操作时间,所以我想索性指定一个日期型字段来作为聚集索引,这样增加记录基本上都是在末尾,这样是否能有效减少了数据操作时间呢?
吕震宇: 非常佩服楼主的敬业精神。我还想说两句,不知楼主是否赞同我的看法:
1、"看来用GUID作为主键必须要另外加索引才能保证入count这样的计算不至于消耗太多时间",在这里另外的索引必须是你的Where短语中用到的字段,否则是不会带来性能提升的。
2、“我插入的数据并不知道要放在什么位置,这样是否也需要选择新记录插入的位置而消耗操作时间”,我以前也一直是这么想的,但感觉自己想法有问
题。我猜测加入GUID的聚簇索引主键时不会为选择新的插入位置消耗太多的时间。因为聚簇索引的页节点是数据节点,因此完全可以在枝节点上做文章以减少系
统的消耗。这只是我的猜测。所以用GUID与用时间做聚簇索引性能应当差别不大。当然这也是我的猜测。
3、我不太赞同用时间做聚集索引,说不出为什么,感觉不太好。似乎没有做到“专职专责”。
guid主键 oracle_使用GUID作为数据库主键的测试相关推荐
- mysql主键标识_实体标识与数据库主键
今天,我们将讨论DDD意义上的标识与数据库主键之间的区别. 我们经常将两者混合在一起,但它们真的是一回事吗? 实体标识 在DDD的背景下,标识是实体固有的东西. 只有实体拥有它; 它是用于区别于所有其 ...
- mysql主键自增为什么在插入的时候还要自己写主键值_数据库主键自增插入显示值...
SQL Server 2008 数据库主键自增插入显示值 前几天在工作的时候遇到在删除数据库中表的数据的时候,删除之后,重新添加的数据没有得到原来的数据的id值(表中id为主键,且设置为自增) ,使用 ...
- (转)关于数据库主键和外键(终于弄懂啦)
一.什么是主键.外键: 关系型数据库中的一条记录中有若干个属性,若其中某一个属性组(注意是组)能唯一标识一条记录,该属性组就可以成为一个主键 比如 学生表(学号,姓名,性别,班级) 其中每个学 ...
- 再议《反驳 吕震宇的“小议数据库主键选取策略(原创)” 》
前天发表了篇文章叫<小议数据库主键选取策略(原创)>,随即有网友提出了反驳意见<反驳 吕震宇的"小议数据库主键选取策略(原创)" >,看到后,我又做了做实验 ...
- 小议数据库主键选取策略
我们在建立数据库的时候,需要为每张表指定一个主键,所谓主键就是能够唯一标识表中某一 行的属性或属性组,一个表只能有一个主键,但可以有多个候选索引.因为主键可以唯一标识某一行记录,所以可以确保执行数据更 ...
- 关于数据库主键和外键
一.什么是主键.外键: 关系型数据库中的一条记录中有若干个属性,若其中某一个属性组(注意是组)能唯一标识一条记录,该属性组就可以成为一个主键 比如 学生表(学号,姓名,性别,班级) 其中每个学 ...
- 小议数据库主键选取策略(转自吕震宇老师博文)
< DOCTYPE html PUBLIC -WCDTD XHTML TransitionalEN httpwwwworgTRxhtmlDTDxhtml-transitionaldtd> ...
- 小议数据库主键选取策略(转)
我们在建立数据库的时候,需要为每张表指定一个主键,所谓主键就是能够唯一标识表中某一行的属性或属性组,一个表只能有一个主键,但可以有多个候选索引.因为主键可以唯一标识某一行记录,所以可以确保执行数据更新 ...
- 关于数据库主键和外键,索引
一.什么是主键.外键: 关系型数据库中的一条记录中有若干个属性,若其中某一个属性组(注意是组)能唯一标识一条记录,该属性组就可以成为一个主键 比如 学生表(学号,姓名,性别,班级) 其中每个学生的学号 ...
- 关于数据库主键和外键的作用与区别
一.什么是主键.外键: 关系型数据库中的一条记录中有若干个属性,若其中某一个属性组(注意是组)能唯一标识一条记录,该属性组就可以成为一个主键 比如 学生表(学号,姓名,性别,班级) 其中每个学 ...
最新文章
- HashMap putIfAbsent computeIfAbsent 使用方法
- 在Visual Studio 2010中创建多项目(解决方案)模板【三】
- easyui datebox不可编辑设置
- IOS之同步请求、异步请求、GET请求、POST请求
- 回车ajax显示,ajax返回值中有回车换行、空格的解决方法分享
- Maven的Settings.xml配置文件解释
- 安卓设置原生alert设置圆角_安卓手机设置充电提示音全新最全教程
- 会声会影x4素材_小技巧!灵活使用会声会影
- 测试用例集-9.QQ登录功能测试用例
- Java实现文件上传到服务器(FTP方式)
- 在虚拟机安装windows xp时所需要的序列号
- 服务器主板型号详解,支持Intel Xeon的主板
- 【企业微信】h5调试面板
- 乐播投屏总是自动断开_乐播投屏- 投屏常见问题 投屏在线客服
- chrome 浏览器 FungLeo 常用插件汇总
- 纽约州顶尖计算机科学类学院,美国顶尖高中盘点——纽约州篇
- scanf与空白字符
- Nginx Rewrite的讲解(从新手村到小有成就7)
- Python使用psutil的电脑资源监控软件
- 数仓建设 | ODS、DWD、DWM等理论实战(好文收藏)