Google--PageRank(网页级别)技术解密

1. 什么是PageRank
2. PageRank的决定因素
3. 如何查知PageRank
4. PageRank的重要性
5. Google的前1,000项搜索结果
6. PageRank与其它影响网站排名因素间的区别
一:什么是PageRank(网页级别)
PageRank(网页级别)是Google用于评测一个网页“重要性”的一种方法。在揉合了诸如Title标识和Keywords标识等所有其它因素之后,Google通过PageRank来调整结果,使那些更具“重要性”的网页在搜索结果中另网站排名获得提升,从而提高搜索结果的相关性和质量。
  简单说来,Google通过下述几个步骤来实现网页在其搜索结果页(SERPS)中的排名:
  1) 找到所有与搜索关键词匹配的网页
  2) 根据页面因素如标题/关键词密度等排列等级
  3) 计算导入链接的锚文本中的关键词
  4) 通过PageRank得分调整网站排名结果
  事实上,真正的网站排名过程并不是这么简单,我们会在后面进行详细深入的阐述。

二:PageRank的决定因素
Google的PageRank是基于这样一个理论:若B网页设置有连接A网页的链接(B为A的导入链接时),说明B认为A有链接价值,是一个“重要”的网页。当B网页级别(重要性)比较高时,则A网页可从B网页这个导入链接分得一定的级别(重要性),并平均分配给A网页上的导出链接。

导入链接(也叫逆向链接)指链至你网站的站点,也就是我们一般所说的“外部链接”。而当你链至另外一个站点,那么这个站点就是你的“导出链接”,即你向其它网站提供的本站链接。

PageRank反映了一个网页的导入链接的级别(重要性)。所以一般说来,PageRank是由一个网站的导入链接的数量和这些链接的级别(重要性)所决定的。

三:如何知道一个网页的PageRank得分
可从http://toolbar.google.com上下载并安装Google的工具栏,这样就能显示所浏览网页的PageRank得分了。PageRank得分从0到10,若不能显示PageRank得分,可检查所安装版本号,需将老版本完全卸载,重启机器后安装最新版本即可。

四:PageRank的重要性
搜索引擎网站排名算法中的各排名因子的重要性均取决于它们所提供信息的质量。但如果排名因子具有易操纵性,则往往会被一些网站管理员利用来实现不良竞争。例如初引入的排名因子之一--关键词元标识(Meta Keywords),是由于理论上它可以很好地概括反映一个页面的内容,但后来却由于一些网站管理员的恶意操纵而不得不黯然退出。所以“加权值”--即我们对该因子提供信息的信任程度是由排名因子的易操纵程度和操纵程度共同决定的。

PageRank无疑是颇难被操纵的一个排名因子了。但在它最初推出时针对的只是链接的数量,所以被一些网站管理员钻了空子,利用链接工厂和访客簿等大量低劣外部链接轻而易举地达到了自己的目的。Google意识到这个问题后,便在系统中整合了对链接的质量分析,并对发现的作弊网站进行封杀,从而不但有效地打击了这种做法,而且保证了结果的相关性和精准度。

五:Google的前1,000项搜索结果
一般说来,网站排名因素包括网页标题(META TITLE),网页正文中的关键词密度,锚文本(也叫链接文本,指链接或超链的文本内容)和PageRank所决定的。

请记住:单靠PageRank是无法使你获得比较理想的网站排名的。PageRank只是网站排名算法中的一个乘积因子,若你网站的其它排名因子的得分是零,就算你的PageRank是两百亿,最后的得分还是零。但这并不是说PageRank就毫无价值,而是在什么情况下PageRank才能完全发挥其功力。

如果在Google上进行广泛搜索,看起来好象有几千个结果,但实际显示最多前1,000项结果。例如对“car rental”,显示搜索结果为5,110,000,但实际显示结果只有826个。而且用时只有0.81秒。试想一下,0.84秒的时间就可以计算这五百万搜索结果的每个排名因子得分,然后给出最终我们所看到的网站排名结果吗?

答案就在于:搜索引擎选取与查询条件最相关的那些网页形成一个子集来加速搜索的速度。例如:假设子集中包含2,000个元素,搜索引擎所做的就是使用排名因子中的两到三个因素对整个数据库进行查询,找到针对这两三个排名因子得分较高的前2,000个网页。(请记住,虽然可能有五百多万搜索结果,但最终实际显示的1,000项搜索结果却是从这个2,000页的子集中提炼出来的。) 然后搜索引擎再把所有排名因子整合进这2,000项搜索结果组成的子集中并进行相应的网站排名。由于按相性进行排序,子集中越靠后的搜索结果(不是指网页)相关性(质量)也就越低,所以搜索引擎只向用户显示与查询条件最相关的前1,000项搜索结果。

请注意,在搜索引擎生成这2,000项网页的子集中我们强调了“相关性”这个词。即搜索引擎找寻的是与查询条件有共同主题的网页。如果这时候我们把PageRank考虑进去,就很可能得到一些PageRank很高但主题只是略微相关的一些搜索结果。显然这有违搜索引擎为用户提供最为相关和精准的搜索结果的原则。

一旦理解了为什么会如此,就说明了为什么你应当首先努力在“页面”因子和锚文本上下足工夫,最后才是PageRank。所以关键在于:

你必须首先在页面因素和/或锚文本上下足工夫,使这些排名因子能够获得足够的得分,从而使你的网站能够按目标关键词跻身于这2,000项搜索结果的子集中,否则PageRank再高也与事无补。

六:PageRank和其它排名因子之间的不同

网页Title标识 仅能被列出一次。
正文中的关键词 连续的重复只会降低关键词的重要性,重要的是接近度。
锚文本 加权值极高,但存在上限,超过上限的锚文本信息将被忽略或降低权值。
PageRank 潜质无穷,没有上限的限制,但需要大量工作。
备注 其它排名因子都存在一个上限(阙值),超过上限部分其权值将降低或不再计分。PageRank则不存在此问题。

Google--PageRank(网页级别)技术解密(二)

7. 非PageRank因素阙值
8. 使用阙值推知两种排名策略的价值
9. PageRank的计算

七:非PageRank因子的上限阙值(Non-PageRank Factor Threshold)
除了PageRank外,其它排名因子都存在一个阙值,也叫临界值或差值。即当增长到一定值时,因子的重要性反而开始慢慢降低,则该值就是非PageRank因子的阙值。

设阙值为1,000,如果网页A和B是我们对某一查询条件的其中两个查询结果,且A的总分数(包括页面因子得分和PageRank得分)是900,B是500,则显然A会排在B的前面。但由于A和B的分数均低于我们上面假设的非PageRank因子阙值,因而在不改变PageRank的情况下,我们可以通过对B页进行精心的页面优化使页面因子分数得到提高来使其排名超过A。但如果A的总得分升至1,100分,则B若还只是一味优化页面因子是远远不够的。在这种情况下,提升PageRank就成为首要任务了。

一般说来,Google的查询结果页中既可能包含一些分数超过阙值的网页,也可能包含一些分数低于阙值的网页。所以:

为了提高竞争能力,必须在阙值范围内尽可能提高页面的搜索引擎排名得分,否则会降低页面的竞争力。“页面因子”是接近和达到阙值最迅捷的方式,它与PageRank的结合使用才是提升网站排名得分的最佳优化策略。

八:使用阙值推知两种排名策略的价值
阙值解释了搜索引擎商所遵循的原则和不同的实施途径,同时亦阐述了为什么会产生关于PageRank的一些误解。我们可以把这两种策略当成两个人A和B。

A认为“PageRank”并不重要。他们已有数年网页优化经验并知道如何完美地利用“页面因素”来达到优化的目的。他们亦理解基本的锚文本,但对PageRank得分毫不在意。结果如何呢?由于最大化地使用了“页面因子”,从而使A迅速达到“非PageRank因子的阙值”。所以通过精心选择关键词可使他们获得较好的网站排名。而且只要网站内容比较好,随着时间推移总会有排名高的站点链接,涓涓细流汇成河。A最后亦得到了PageRank得分,并籍此巩固了排名。

B认为“PageRank”十分重要。他掌握了很多关于提升PageRank得分的信息,并为提高该得分下足了工夫。结果又如何呢?B的做法和A相反,但A在非PageRank因子上下工夫,结果却得到了PageRank得分。而B在PageRank因子上下工夫,结果却得到非PageRank因子得分。究其原因,就是由于提高PageRank得分需要外部链接,链接又具有锚文本,从而通过精心挑选外部链接的锚文本,B自发提高了其非PageRank因子的得分,从而赢得了较高的PageRank得分。

虽然这只是两个极端,但我们可以利用它们来推知这两种途径各自的优缺点:

对象 优点 缺点
A:忽略PageRank  网站排名在短期内就可得到提升

自我生成链接节省了工作量
 需投入大量工作维持网站排名

对新竞争者的应变速度较慢
 
B:忽略页面排名因子  可获得可靠网站排名,并可在需要时轻松修改页面因素使排名迅速提升

极可能从非搜索类引擎来源上获得更高访问量
 网站排名提升较慢

操作难度较大

容易为SPAM过滤程序所制

对象 优点 缺点
A:忽略PageRank 网站排名在短期内就可得到提升

自我生成链接节省了工作量
需投入大量工作维持网站排名

对新竞争者的应变速度较慢

B:忽略页面排名因子 可获得可靠网站排名,并可在需要时轻松修改页面因素使排名迅速提升

极可能从非搜索类引擎来源上获得更高访问量
网站排名提升较慢

操作难度较大

容易为SPAM过滤程序所制

事实上,我们前面说过,最终排名得分=所有非PageRank因子实际得分x实际PageRank得分。亦即二者相辅相成,再加上随着网上营销方式的发展壮大,关键词的竞争也变的愈来愈激烈,这种情况下只靠非PageRank因子得到好排名显然是不可能的。而且非PageRank因子存在着阙值的局限性。同时,对于竞争性极高的关键词,还存在着PageRank下限的问题。也就是说,除非网站的PageRank得分超过这个下限标准,否则网站排名很难上去。PageRank的下限由关键词的竞争度所决定。竞争性一般的关键词PageRank下限也不高,而对竞争较为激烈的关键词来说,它所要求的PageRank下限相应就要高。而PageRank得分的提升又非常有难,这时候非PageRank因子就变的非常重要了。
综上所述:我们需要充分发挥各排名因子的优势来赢取理想的综合排名得分。同时关键词(竞争度适宜)的精心选择亦变的非常重要,它可以节省大量的支出。九:PageRank的计算方法
  PageRank (A) = (1-d) + d(PageRank (T1)/C(T1) + ... + PageRank (Tn)/C(Tn))
  其中PageRank (A)表示给定页面A的PageRank得分;
  D为阻尼因子,一般设为0.85;
  PageRank (T1)表示一个指向A页的网站其本身的PageRank得分;
  C(T1)表示该页面所拥有的导出链接数量;
  PageRank (Tn)/C(Tn)表示为每一个指向A页的页面重复相同的操作步骤。

事实上,计算某个页面的PageRank得分需要大量繁复计算。例如若计算A页的PageRank得分则首先要知道所有链至A页的网页(导入链接)的PageRank得分。要想知道这些外部链接页的PageRank得分,又需要先知道这些页面的外部链接的PageRank得分,等等。我们只需要知道:

A页的外部链接B能够带给A的PageRank得分与B的导出链接数量成反比,即随着B上导出链接数的增加,带给A的PageRank得分亦随之降低。这同样表明了一个网页的PageRank得分是该网页对其它页面投票的一个基本的度量形式。一个网页可以投票给一个或多个导出链接,但其总投票权一定,并被平均分配给所有的导出链接。假设B的PageRank得分是5,且B上只有一条指向A的链接,那么A将获得B全部的PageRank得分(B没有损失任何东西,而A赢得了B的PageRank得分)。但如果B上有N个链接,则A只能得到B的PageRank得分的N分之一。

我们可以用图表来阐述其工作原理。假设有四个网页A,B,C和D,它们相互链接,如表-1所示:

表-1:链接前的PageRank得分

表-2:链接后的PageRank得分

假设这四个网页初始PageRank得分均为0。则根据上面的公式它们的PageRank得分都是0.15。我们计算一下链接后各自的PageRank得分情况。
1.A链向B、C和D。A的初始PageRank得分是0.15,所以A的导出链接获得PageRank得分总数为 0.85 * 0.15 = 0.1275。B,C和D三个网页各得0.0425分。
2.B链向C、B的初始PageRank得分也是0.15,所以其唯一链接页面C所能够获得的PageRank得分是0.85 * 0.15 = 0.1275分。
  C链向A,其0.1275的PageRank得分传递给唯一链接对象A。
  D链向C,其0.1275的PageRank得分传递给了C。
  现在各网页的PageRank得分结果如下:
  A:0.15 + 0.1275 (得自C) = 0.2775
  B:0.15 + 0.0425 (得自A) = 0.1925
  C:0.15 + 0.0425 (得自A) + 0.1275 (得自B) + 0.1275 (得自D) = 0.4475
  D:0.15 + 0.0425 (得自A) = 0.1925(如表-2所示)
继续这样的计算,直到每个页面的数值逼近一个定值(PageRank属收敛函数)。最后可以发现,C的PageRank最高。而且外部链接的数量显著地改变了PageRank得的分布。

表-3:最后的PageRank得分结果

表-4:外部链接与PageRank得分对照表:

导入链接 数量 导出链接 数量 最终PageRank得分
C A/B/D 3 A 1 1.4860614724 
A C 1 B/C/D 3 1.4131522515 
B A 1 C 1  0.5503931379 
D A 1 C 1  0.5503931379

十四:网站的内部结构和联接

一:网站的内部页面
说完了“外部链接”,现在让我们来看看“内部链接”。如果PageRank确由页面投票的质量和数量所决定,那么我们立即就可以得出网站内链与PageRank的关系的一个重要结论:

网站上每个已被Google收录的内部网页(内链)都是对该网站的一记投票,不过投票份量很小。因而,一个网站若能拥有更多已被Google收录的内部网页,就有可能获得更多的总投票。

这样一来,我们可以通过创建大量内部网页来提高网站整体的PageRank。但这还远远不够。因为我们此处所指的内部网页是指已被Google收录,即拥有自己的PageRank的那些内链页面。这些网页之所以被Google检索是由于它们具备丰富充实的内容。所以应尽力充实和丰富你的网站,一旦网站内容得到充实和丰富,会有更多的内页得到检索,从而带来更多的PageRank。同时“升值”的网站也会获得更多站点的青睐,从而会有更多的站点主动链接你。

简言之,就提升PageRank而言,对“内”最需要做的就是为网站填充更加丰富和有价值的内容。应确保网页内容不会过长或过短,如有必要可将网页内容分割成若干网页。

二:网站的内部结构&联接
网站有三种内部联方式,宜结合使用这三种联接方式进行网站的建设。假设一个网站由“主页”,“关于我们”页,“产品介绍”页和“更多信息”页这四个页面组成,通过下表我们可以看出每种结构对网站PageRank的影响度。

表-11:层级结构(Hierarchical)

表-12:环路网站结构(Looping)

表-13:内页广泛互联的网站结构(Extensive Interlinking)

表14-16是内部页面在不同结构网站上的PageRank分布情况。了解了这一点我们就可以从“内部链接”着手来获得最大的PageRank反馈。

表-14:层级结构的PageRank分布(总PageRank=4)

表-15: 环路结构的PageRank分布(总PageRank=4)

表-16:内页广泛互联结构的PageRank分布(总PageRank=4)

在未考虑外部链接因素的前提下,可以看出类层级结构(Hierarchical-Like)能够改变网站内部页面的PageRank分布。(注意:我们所指的并不一定是严格意义上的层级结构,不过必须比环路结构(Looping)或广泛互联(Extensive Interlinking)结构包含更多层级结构的属性。)

若PageRank均匀分布于网站内部页中,那么网站管理员可以通过层级结构这种能够使PageRank发生转移的性能来有选择地转移内部网页的PageRank:即把一些不太重要的页面的PageRank适当地转移到那些关键词竞争性比较强的网页上,或想提高特定关键词排名的网页上去,从而使网站获得最大的收益。

上面只是封闭网站设计结构(即无导入也无导出链接的结构)下内部各网页的分布情况,如果加入外部链接--即导入和导出链接后情况又会怎样呢?如表17-19所示:

表-17:非封闭层级网站结构的PageRank分布

表-18:非封闭环路网站结构的PageRank分布

表-19:非封闭内页广泛互联网站结构的PageRank分布

无导入/导出链接PageRank分布  有无导入/导出链接PageRank分布 
网站结构  主页的PageRank  其它各页的PageRank  PageRank总数  主页PageRank  其它各页PageRank  PageRank总数 
层级  1.9189189189  0.6936936937
0.6936936937
0.6936936937  4  1.4984293194  0.5745549738
0.5745549738
0.5745549738  3.2220942408 
环路  1  1
1
1  4  0.6836928438  0.7311389172
0.4778739338
0.7714680796  2.6641737744 
广泛互联  1  1
1
1  4  0.954115.523  0.8547644030
0.8547644030
0.9046990932  3.5683429515 
结论:  内页广泛互联(Extensive Interlinking)的网站结构(表13)可以最大程度地保留一个网站内部的PageRank,其次是层级(Hierarchical)结构(表11),最后才是环路(Looping)的网站结构(表12)。 
注意:  理论上是这样,但实际上如果让上万个内部网页互联起来又不太可能。所以还必须为网站各分枝选择合适的结构。不过对层级结构来说,越是增加子页数量效果越好。这是由于在导出链接页上增加了更多内部链接,按照PageRank平均分配给所有内/外链接的原则,受益最多的还是你。不过,如果增加太多内页,也会明显影响主页的PageRank。

十五:Google如是说
关于PageRank,最权威的发言人自然还是Google。虽然Google不会也不可能提供相关的技术信息,但我们亦可从中窥得一斑:
  Chris:PageRank的命名是基于“Page”,还是和某个创始人有关?
  Google:PageRank是以Google的联合创始人兼总裁Larry Page的名字命名的。
  Chris:Google是否把PageRank视做显著区别于其它搜索引擎的一个特性?
  Google:PageRank是一种能够使Google在搜索速度和搜索结果的相关性上区别于其它搜索引擎的技术。不唯如此,在排名公式中Google还使用了100种其它的算法。
  Chris:Google是否认为引入PageRank可以显著提高搜索结果的质量?以后是否仍将继续使用PageRank?
Google:由于PageRank使用了量化方法来分析链接,所以它仍将是决定Google搜索结果页排名的一个重要因素。
  Chris:您认为Google工具栏上的PageRank的信息对普通用户/网站管理员/搜索引擎优化专家来说各有什么意义?
  Google:Google工具栏上所提供的PageRank信息仅作为一种网站评估信息使用。用户们会觉得它很有趣,网站管理员一般用它来衡量网站性能。不过,由于PageRank只是一个大体评估,所以对搜索引擎专家的价值并不大。
  Chris:常有网站试图通过“链接工厂”和访客簿的手段达到提升PageRank的目的。对这样的网站Google有什么举措?
  Google:Google的工程师会经常更新Google的排名算法以防止对Google排名的恶意操纵。
结束语:
  选择导入链接时应首先考虑对方网站的内容如何,然后再考察其导出链接的数量进行决策。而在建立本站的导出链接时则应尽量使自己网站的PageRank维持在最大回馈和最小流失上。

应确保合理的网站设计结构和内部联接方式。网站的结构和内部联接方式也会对PageRank产生影响,可利用其特性有效进行PagaRank在网站内部页面的再分布及尽可能保持网站整体的PageRank。

网站的PageRank的提升应与该网站的访问者体验息息相关。即使获得再高的PageRank,如果没有客户访问,一样毫无价值。所以网站的内容始终是提升PageRank最关键的因素之一

十:PageRank的反馈性[出自chinaseo]
  
PageRank的反馈机制说明了为什么一个网站的导出链接能够使网站自身受益。
假设A页链向B,根据PageRank计算公式,其初始PageRank为0.15,链接后的PageRank变为1。如果A链向C,而C又链回A,则A此时的PageRank变成了1.4594594595。也就是说若A链向一个外部网页,而那个网页又回链向A的话,则使A的PageRank会增加。(如果A链向一个网页,而该网页又链向C,C再链向A的话,也会发生同样的情形)。如果把所有相互链接的页面看做是一个系统整体的话,其实链接前后系统总的PageRank并没有发生改变,只是由于不同链接关系的发生导致了PageRank对系统内每个链接页面的重新分布。

表-6-1:无链接交换时:A到E页都是已被Google收录的页面。其中A和B是我们网站的内页

表-7  未提供导出链接前  提供导出链接后 
A的PageRank得分:  1  1.3599321536 
B的PageRank得分:  1  0.7279711653 
网站的PageRank总分:  2  2.0879033189

其增量比较小,整体则视情况而定。但有一点是显而易见的 – 提供导出链接的网页往往会通过一种叫做PageRank反馈的机制提升了自身的PageRank。
结论:
这表明和一些大型站点进行互惠链接交换是比较明智的。这些大网站均采用链接结构,并对链接页给予高度关注。你所链接的对象站点所包含的网页数量及其设计结构对于你网站的PageRank反馈总数有着显著的影响。

十一:如何控制PageRank
虽然PageRank因子很难控制,但我们可以通过其它技术来得到理想的结果。而且,良好优化过的页面因子整合较高的PageRank得分无疑会使网站更具竞争力。

PageRank因子的优化可从下面三个方面着手:
  1. 导入链接。包括如何选取导入链接,获得导入链接所付出的努力是与收获呈正比的。
  2. 导出链接。包括导出链接的选取及它们在你网站上的合适位置,应使PageRank得到最大回馈(Feedback) 和最小损耗(Leakage)。
  3. 网站内部导航结构和内部页面的联接。实现PageRank在网站内部的良好分布。

十二:导入链接(Links to Your Site)
寻找导入链接时,一般总是容易陷入这样的误区:只看链接页的PageRank得分,得分越高就越好。而事实上,一个链接页的PageRank得分遵循平均分配原则被平均分配给该页面上的所有链接。所以,只注重外部链接的PageRank得分的链接策略无疑是片面的。正确的做法应该是既要考虑链接页的PageRank,又要考虑该页的链接数量(应注意:PageRank的单位是网页而不是网站,即每个页面都有其特定的PageRank。所以在寻找链接时应查看“链接”页面的PageRank,也就是说,需要考虑的是放置你网站链接的那个页面的PageRank得分情况。) 而且PageRank较高的站点对链接请求一般总是比较挑剔的。

结论:
  那些看起来较为适宜,具有良好质量的网站都是理想的链接对象。先别去管它们的PageRank到底是多少,倘若它们既与你的网站相关,又具有较高的质量,那么总是会有益你的PageRank,只是个时间问题罢了。另外,网站被DMOZ和Yahoo收录亦能相当有效地提升PageRank。

十三:导出链接(Links out of your site)
导出链接并不会损失PageRank,但网站整体的PageRank将会降低。所以,选择导出链接时宜遵循这样的定律:
  1. 尽量保持自己网站的PageRank
  2. 尽量使内部页面分得尽可能多的PageRank

向大家推荐一种方法:可以在网站上设立一个对导出链接的“评审”页。用于放置对外部链接站点的评审内容。每条评审内容应包括指向其相应外部站点的超链。(注意:由于搜索引擎的SPIDERS无法支持JAVASCRIPT,所以不宜用JAVA程序打开这些页面。)

“评审”页应链回网站内部等级较高的一个页面 (最好是主页,其它重量级页也可)。这样做可显著降低网站PageRank的流失。放置外部链接的页面亦需链回主页及其它重要内部页面。但“评审”页上只要放置一个重量级内部页面即可(最好是主页)。此外,可以告诉你的”评审“链接对象你已经”评审“过他们的网站,这样一来他们很有可能会把你的这个”评审“页链接到他们自己的网站上,这样就可以从他们那里得到两个导入链接。自然效果就更好了。用文字描述太麻烦了,我们还是用图表来说明吧。(下表包括主页A,外部链接页页D和其它两个内页B和C)

如果进行相同的计算,但包括review pages,则结果如下:
表-9:加“评审”页后的各网页PageRank得分情况

如果只看A,B,C和D页,则结果如下:

无评审(Review)页  有评审(Review)页 
主页的PageRank:  0.9536152797  2.439718935 
B/C/D页的PageRank:  0.4201909959
0.4201909959
0.4201909959  0.8412536982
0.8412536982
0.8412536982 
PageRank总计:  2.2141882674  4.9634800296

在放置导出链接的页面上同时放一些网站的内部链接是提高PageRank的相当重要的内部因素之一。这种收益虽然无法和网站所从导入链接上获得的收益相提并论,但却极易操作,并可有益于网站读者。

十五:Google如是说
关于PageRank,最权威的发言人自然还是Google。虽然Google不会也不可能提供相关的技术信息,但我们亦可从中窥得一斑
Chris:PageRank的命名是基于“Page”,还是和某个创始人有关?
Google:PageRank是以Google的联合创始人兼总裁Larry Page的名字命名的。
Chris:Google是否把PageRank视做显著区别于其它搜索引擎的一个特性?
Google:PageRank是一种能够使Google在搜索速度和搜索结果的相关性上区别于其它搜索引擎的技术。不唯如此,在排名公式中Google还使用了100种其它的算法。
Chris:Google是否认为引入PageRank可以显著提高搜索结果的质量?以后是否仍将继续使用PageRank?
Google:由于PageRank使用了量化方法来分析链接,所以它仍将是决定Google搜索结果页排名的一个重要因素。
Chris:您认为Google工具栏上的PageRank的信息对普通用户/网站管理员/搜索引擎优化专家来说各有什么意义?
Google:Google工具栏上所提供的PageRank信息仅作为一种网站评估信息使用。用户们会觉得它很有趣,网站管理员一般用它来衡量网站性能。不过,由于PageRank只是一个大体评估,所以对搜索引擎专家的价值并不大。
Chris:常有网站试图通过“链接工厂”和访客簿的手段达到提升PageRank的目的。对这样的网站Google有什么举措?
Google:Google的工程师会经常更新Google的排名算法以防止对Google排名的恶意操纵。

结束语:
选择导入链接时应首先考虑对方网站的内容如何,然后再考察其导出链接的数量进行决策。而在建立本站的导出链接时则应尽量使自己网站的PageRank维持在最大回馈和最小流失上。

应确保合理的网站设计结构和内部联接方式。网站的结构和内部联接方式也会对PageRank产生影响,可利用其特性有效进行PagaRank在网站内部页面的再分布及尽可能保持网站整体的PageRank。

网站的PageRank的提升应与该网站的访问者体验息息相关。即使获得再高的PageRank,如果没有客户访问,一样毫无价值。所以网站的内容始终是提升PageRank最关键的因素之一

googleadwords 发表于 >2005-5-10 11:50:17  [全文] [评论] [引用] [推荐] [档案] [推给好友]

2005-5-10google中文关键词广告效果测试报告与问题分析

在google投放广告,是许多国内网站感兴趣的一个话题,本文以时代营销在google投放广告的基本过程和真实数据进行整理,形成了测试报告的基本内容。在此基础上,也对google关键词广告相关的其他基本问题进行了分析讨论,以提供更多有关google关键词广告的实际应用信息。

在google投放广告,是许多国内网站感兴趣的一个话题,在google搜索结果页面也可以看到,出现了越来越多的中文网站广告,可见google中文关键词广告正处于快速发展时期。时代营销(http://www.emarketer.cn)曾于2003年9月3日发布过一篇介绍“如何在GOOGLE上投放广告”的文章,受到广泛关注,许多网站给予转载,这也从一个侧面反映了许多企业/网站对在google投放广告方面的问题并不是很熟悉,仅仅处于关注和了解阶段。如果真正希望将google键词广告应用于网络营销活动中,那么,除了了解投放广告的过程之外,对于关键词广告的效果、费用等方面应给予更多的关注。

由于google关键词广告目前的应用还不够广泛,也缺乏权威的效果调查报告,作为中国网络营销的专业门户网站,为了让更多的企业了解google关键词广告的效果,时代营销将自己在google投放广告的基本过程和真实数据进行整理,形成本测试报告的基本内容。在此基础上,本文也对google关键词广告相关的其他基本问题进行了分析讨论,以提供更多有关google关键词广告的实际应用信息。这里有必要说明的是,由于点击率等测试结果仅仅是时代营销网站本次广告活动所获得的数据,因此并不代表关键词广告的一般点击率,所有数据仅供参考。

时代营销的关键词广告投放过程

从2003年8月26日开始到10月25日,时代营销在google投放了为期2个月的关键词广告,活动分为三个阶段。

第一个阶段共选择了2个关键词,平均点击率为1.2%;每次点击平均价格为0.06美元。(说明:这个每次点击的价格是系统默认的数据,时代营销并未进行修改,目前这个价格即可保证时代营销网站在所设定关键词检索页面中排名第一,当选择同一关键词广告的网站数量增加时,如果希望自己的广告排名靠前,可设定通过调整每次点击价格的方式来实现,广告结果的排名与所支付的价格是密切相关的。)

第二阶段增加了2个关键词,总共4个关键词,平均点击率为和每次点击的价格均没有明显变化,但不同的关键词所获得的点击率则有一定差异,与网络营销密切相关的关键词点击率一般为1.0-1.3%;

第三阶段又增加了2个关键词,关键词总数为6个,平均点击率仍然为1.2%,每次点击平均价格也仍然保持在0.06美元,不过每天的平均点击数量较前两个阶段略有增长,很显然是多个关键词所发生的作用。

google关键词广告测试结论

根据时代营销的关键词广告投放测试,我们可以得出下列基本结论:

(1)关键词广告点击率比BANNER广告高。利用google关键词广告来进行网站推广是一种有效的方法,不仅操作简单,而且点击率也比一般的BANNER要高。除了直接的点击之外,由于关键词广告的定位程度较高,还可以获得额外的广告浏览价值。

(2)关键词广告价格比较低廉。相对于CPM计价方式来说,由于按点击付费,google关键词广告的价格相当低廉(除非用户很多的特别热门的关键词),使得网络广告投放费用大大降低,而且完全可以自行控制,使得网络广告改变了只有大型企业才能问津的状况,成为小型企业自己可以掌握的网络营销手段。

(3)没有最低限额,并且广告预算可自行控制。与国内一些服务商要求投放广告每月最低限额不同,直接在google投放关键词广告没有“最低消费”,也不用担心选择的关键词太热会超过财务预算,因为每次点击的费用和每天最高限额都是由自己设定的,而且可以随时改变设置,甚至暂停或取消广告活动。

(4)操作不复杂但国内企业存在财务方面的麻烦。在google投放关键词广告的操作过程并不复杂难,只要稍微有点英文阅读能力,任何个人或企业都根据网站说明完成广告投放。但对于国内企业来说,主要有两个方面的问题:一是在线支付,需要具有美元支付的信用卡;二是无法取得财务认可的发票,这为正规企业的财务问题带来了一定麻烦。也正是因为这些原因,才为一些国内的“google代理商”提供了机会,可以帮国内企业“代理”google的广告业务,从而可以实现以人民币支付并取得国内的发票。不过,这种操作模式也有很多问题,因此这里顺便也提醒一下,由于部分希望在google投放广告的企业自己对此了解不深,或者因为财务方面的问题而选择了国内服务商代理google的关键词广告业务,由于某些服务商在操作过程中存在一定的误导或者“猫腻”现象,应给予必要的警惕(这方面的问题本文暂不深入分析)。

(5)google关键词广告是实时显示的。google关键词广告几乎是实时完成的,所有的关键词和链接地址都是自行设定的(可以随时修改),因此是一种高效的广告投放方式,虽然这样大大提高了投放广告的效率,但也存在一定的弊端。由于不存在审批和人工控制问题,因此也可能会出现一些潜在的虚假广告甚至恶意广告的问题,一旦出现纠纷,解决过程会有较大的麻烦。

(6)存在一定的不可预测风险。由于google目前在国内没有任何注册机构,是否会再次出现“网站无法打开”的情况成为无法预知的风险之一。一旦google无法正常访问,不要说广告效果无法保证,即使已经开通广告服务的企业也无法对自己的广告投放情况进行管理,即使想终止广告也无法操作,这种状况必然会为国内网站带来很大麻烦。

(7)关键词广告与网站优化排名并不矛盾。一般的网站不可能保证通过优化设计使得很多关键词都能在google检索结果中排名第一,关键词广告是免费登录的一种补充,两者并不矛盾,即使在google的搜索排名中处于第一位置,也可以采用付费的关键词广告,这是因为搜索结果排名信息与关键词广告的信息并不一定相同,用户的偏好也有差别。【关于这个问题的详细分析见笔者文章“google搜索引擎优化与关键词广告(AdWords)的关系”】
【摘要】:在了解了google关键词广告的一般操作和基本问题之后,最重要的一项工作通过选择合适的关键词,以及对广告效果进行跟踪分析和控制,本文介绍了说明关键词选择和广告投放过程中值得注意的一般问题。

在本文的第一部分中,简单介绍了时代营销在google投放关键词广告的测试过程,并对google关键词广告得出了基本的测试结论。在了解了google关键词广告的一般操作和基本问题之后,最重要的一项工作通过选择合适的关键词,以及对广告效果进行跟踪分析和控制,以获得最理想的广告效果,由于各个企业或者网站的情况不同,因此在开展有关工作时所面对的问题并不完全一样,但至少有两个方面是类似的:一个是关键词的选择原则与技巧,另一方面是对关键词广告活动的跟踪控制问题。关键词时有较大的区别,例如生产某专用产品的企业,这种产品的名称应该就是最好的关键词,而对于一些通用性行业则很难通过一两个关键词就来反映出用户使用搜索引擎检索的主要方法。 时代营销在测试过程中对此进行了充分的分析和验证,下面根据时代营销网的特点以及在测试过程中的体会来说明关键词广告投放过程中值得注意的一般问题。

在google投放关键词广告时几个值得注意的问题:

(1)应尽量选择点击率较高的关键词

google提供了一个流量预测工具,值得注意的是,有些使用频率高的关键词未必获得高的点击率,因此google的关键词建议不能作为选择关键词的依据,仅供参考,最重要的还是自己对网站访问者有一定的了解,通过近期的流量统计资料看看用户使用频率最高的关键词有哪些,这样才能做到有的放矢。

(2)可同时选择多个关键词

由于关键词广告的费用总额由自己设定,因此并不受关键词数量多少的影响,因此在本测试过程中的第二、第三阶段采用增加关键词的方式了解更多与网络营销相关的关键词在google中的被点击情况。根据笔者在2002年5月份的一项研究,用户通过搜索引擎网络营销网站所使用的关键词有明显的分散性:读者使用“网络营销”这一关键词的比例仅为7.8%,与网络营销相关的通用的词并不多,往往是网络营销与其他各种词汇的组合,但其核心内容与“教程、下载、理论、方法、案例、管理”等相关,所有包含“网络营销”的关键词也只有30.7%。
正是因为这个原因,因此网络营销网站在google投放关键词广告时选择关键词需要从多方面入手,仅有少数几个关键词会大大影响被检索到的机会,否则,造成的可能结果是广告显示次数少,即使获得较高的点击率,但由于总的显示和点击次数比较少,广告的总体效果仍然不够明显。

(3)google关键词广告不一定获得显著效果

这当然不是否认google关键词广告的价值,但不同的行业、不同的网站、或者不同的关键词,所产生的效果并非完全一样的,有时即时获得较高的点击率,但由于广告显示总数较少,因此同样不能在短期内获得明显的推广效果。 时代营销的测试表明,如果与一般BANNER广告相比,1.2%的点击率应该算比较高了,但由于网络营销是一个相对专业的领域,每天实际的检索数量并不是很多,因此,点击率本身并不能说明最终效果,还应看点击数量。在时代营销本次测试活动中,设定了每天最高限额为10美元,但实际上每天点击所产生的费用远远不到10美元,这说明这次广告投放获得的最终效果(点击总数,即为网站带来的直接访问者)并不是很显著,对网站新增加的访问量微乎其微,从网站流量统计报告中也可以看出,在关键词广告投放期内,网站流量保持基本稳定,略有增长的访问量也并非都是google关键词广告所产生。

(4)定期跟踪分析关键词广告效果是必要的

对广告活动进行定期的跟踪记录是必要的,这样便于及时发现问题,对于点击率过低的关键词做出必要的调整(尽管google会根据关键词最近出现的情况自动禁止点击率低于0.3%的关键词继续显示广告,但如果长期处于广告被禁止的状态会贻误时机,并且对广告真实效果失去信心)。 如果点击率和点击数量都比较高,那么可能很快达到所设定的每日最高限额,广告便无法继续出现在google的检索结果中,这时可根据财务状况是否调整每日限额,以在较短时间内获得理想的营销效果。

googleadwords 发表于 >2005-5-10 11:47:35  [全文] [评论] [引用] [推荐] [档案] [推给好友]

2005-5-10google中文关键词广告效果测试报告与问题分析

在google投放广告,是许多国内网站感兴趣的一个话题,本文以时代营销在google投放广告的基本过程和真实数据进行整理,形成了测试报告的基本内容。在此基础上,也对google关键词广告相关的其他基本问题进行了分析讨论,以提供更多有关google关键词广告的实际应用信息。

在google投放广告,是许多国内网站感兴趣的一个话题,在google搜索结果页面也可以看到,出现了越来越多的中文网站广告,可见google中文关键词广告正处于快速发展时期。时代营销(http://www.emarketer.cn)曾于2003年9月3日发布过一篇介绍“如何在GOOGLE上投放广告”的文章,受到广泛关注,许多网站给予转载,这也从一个侧面反映了许多企业/网站对在google投放广告方面的问题并不是很熟悉,仅仅处于关注和了解阶段。如果真正希望将google键词广告应用于网络营销活动中,那么,除了了解投放广告的过程之外,对于关键词广告的效果、费用等方面应给予更多的关注。

由于google关键词广告目前的应用还不够广泛,也缺乏权威的效果调查报告,作为中国网络营销的专业门户网站,为了让更多的企业了解google关键词广告的效果,时代营销将自己在google投放广告的基本过程和真实数据进行整理,形成本测试报告的基本内容。在此基础上,本文也对google关键词广告相关的其他基本问题进行了分析讨论,以提供更多有关google关键词广告的实际应用信息。这里有必要说明的是,由于点击率等测试结果仅仅是时代营销网站本次广告活动所获得的数据,因此并不代表关键词广告的一般点击率,所有数据仅供参考。

时代营销的关键词广告投放过程

从2003年8月26日开始到10月25日,时代营销在google投放了为期2个月的关键词广告,活动分为三个阶段。

第一个阶段共选择了2个关键词,平均点击率为1.2%;每次点击平均价格为0.06美元。(说明:这个每次点击的价格是系统默认的数据,时代营销并未进行修改,目前这个价格即可保证时代营销网站在所设定关键词检索页面中排名第一,当选择同一关键词广告的网站数量增加时,如果希望自己的广告排名靠前,可设定通过调整每次点击价格的方式来实现,广告结果的排名与所支付的价格是密切相关的。)

第二阶段增加了2个关键词,总共4个关键词,平均点击率为和每次点击的价格均没有明显变化,但不同的关键词所获得的点击率则有一定差异,与网络营销密切相关的关键词点击率一般为1.0-1.3%;

第三阶段又增加了2个关键词,关键词总数为6个,平均点击率仍然为1.2%,每次点击平均价格也仍然保持在0.06美元,不过每天的平均点击数量较前两个阶段略有增长,很显然是多个关键词所发生的作用。

google关键词广告测试结论

根据时代营销的关键词广告投放测试,我们可以得出下列基本结论:

(1)关键词广告点击率比BANNER广告高。利用google关键词广告来进行网站推广是一种有效的方法,不仅操作简单,而且点击率也比一般的BANNER要高。除了直接的点击之外,由于关键词广告的定位程度较高,还可以获得额外的广告浏览价值。

(2)关键词广告价格比较低廉。相对于CPM计价方式来说,由于按点击付费,google关键词广告的价格相当低廉(除非用户很多的特别热门的关键词),使得网络广告投放费用大大降低,而且完全可以自行控制,使得网络广告改变了只有大型企业才能问津的状况,成为小型企业自己可以掌握的网络营销手段。

(3)没有最低限额,并且广告预算可自行控制。与国内一些服务商要求投放广告每月最低限额不同,直接在google投放关键词广告没有“最低消费”,也不用担心选择的关键词太热会超过财务预算,因为每次点击的费用和每天最高限额都是由自己设定的,而且可以随时改变设置,甚至暂停或取消广告活动。

(4)操作不复杂但国内企业存在财务方面的麻烦。在google投放关键词广告的操作过程并不复杂难,只要稍微有点英文阅读能力,任何个人或企业都根据网站说明完成广告投放。但对于国内企业来说,主要有两个方面的问题:一是在线支付,需要具有美元支付的信用卡;二是无法取得财务认可的发票,这为正规企业的财务问题带来了一定麻烦。也正是因为这些原因,才为一些国内的“google代理商”提供了机会,可以帮国内企业“代理”google的广告业务,从而可以实现以人民币支付并取得国内的发票。不过,这种操作模式也有很多问题,因此这里顺便也提醒一下,由于部分希望在google投放广告的企业自己对此了解不深,或者因为财务方面的问题而选择了国内服务商代理google的关键词广告业务,由于某些服务商在操作过程中存在一定的误导或者“猫腻”现象,应给予必要的警惕(这方面的问题本文暂不深入分析)。

(5)google关键词广告是实时显示的。google关键词广告几乎是实时完成的,所有的关键词和链接地址都是自行设定的(可以随时修改),因此是一种高效的广告投放方式,虽然这样大大提高了投放广告的效率,但也存在一定的弊端。由于不存在审批和人工控制问题,因此也可能会出现一些潜在的虚假广告甚至恶意广告的问题,一旦出现纠纷,解决过程会有较大的麻烦。

(6)存在一定的不可预测风险。由于google目前在国内没有任何注册机构,是否会再次出现“网站无法打开”的情况成为无法预知的风险之一。一旦google无法正常访问,不要说广告效果无法保证,即使已经开通广告服务的企业也无法对自己的广告投放情况进行管理,即使想终止广告也无法操作,这种状况必然会为国内网站带来很大麻烦。

(7)关键词广告与网站优化排名并不矛盾。一般的网站不可能保证通过优化设计使得很多关键词都能在google检索结果中排名第一,关键词广告是免费登录的一种补充,两者并不矛盾,即使在google的搜索排名中处于第一位置,也可以采用付费的关键词广告,这是因为搜索结果排名信息与关键词广告的信息并不一定相同,用户的偏好也有差别。【关于这个问题的详细分析见笔者文章“google搜索引擎优化与关键词广告(AdWords)的关系”】
【摘要】:在了解了google关键词广告的一般操作和基本问题之后,最重要的一项工作通过选择合适的关键词,以及对广告效果进行跟踪分析和控制,本文介绍了说明关键词选择和广告投放过程中值得注意的一般问题。

在本文的第一部分中,简单介绍了时代营销在google投放关键词广告的测试过程,并对google关键词广告得出了基本的测试结论。在了解了google关键词广告的一般操作和基本问题之后,最重要的一项工作通过选择合适的关键词,以及对广告效果进行跟踪分析和控制,以获得最理想的广告效果,由于各个企业或者网站的情况不同,因此在开展有关工作时所面对的问题并不完全一样,但至少有两个方面是类似的:一个是关键词的选择原则与技巧,另一方面是对关键词广告活动的跟踪控制问题。关键词时有较大的区别,例如生产某专用产品的企业,这种产品的名称应该就是最好的关键词,而对于一些通用性行业则很难通过一两个关键词就来反映出用户使用搜索引擎检索的主要方法。 时代营销在测试过程中对此进行了充分的分析和验证,下面根据时代营销网的特点以及在测试过程中的体会来说明关键词广告投放过程中值得注意的一般问题。

在google投放关键词广告时几个值得注意的问题:

(1)应尽量选择点击率较高的关键词

google提供了一个流量预测工具,值得注意的是,有些使用频率高的关键词未必获得高的点击率,因此google的关键词建议不能作为选择关键词的依据,仅供参考,最重要的还是自己对网站访问者有一定的了解,通过近期的流量统计资料看看用户使用频率最高的关键词有哪些,这样才能做到有的放矢。

(2)可同时选择多个关键词

由于关键词广告的费用总额由自己设定,因此并不受关键词数量多少的影响,因此在本测试过程中的第二、第三阶段采用增加关键词的方式了解更多与网络营销相关的关键词在google中的被点击情况。根据笔者在2002年5月份的一项研究,用户通过搜索引擎网络营销网站所使用的关键词有明显的分散性:读者使用“网络营销”这一关键词的比例仅为7.8%,与网络营销相关的通用的词并不多,往往是网络营销与其他各种词汇的组合,但其核心内容与“教程、下载、理论、方法、案例、管理”等相关,所有包含“网络营销”的关键词也只有30.7%。
正是因为这个原因,因此网络营销网站在google投放关键词广告时选择关键词需要从多方面入手,仅有少数几个关键词会大大影响被检索到的机会,否则,造成的可能结果是广告显示次数少,即使获得较高的点击率,但由于总的显示和点击次数比较少,广告的总体效果仍然不够明显。

(3)google关键词广告不一定获得显著效果

这当然不是否认google关键词广告的价值,但不同的行业、不同的网站、或者不同的关键词,所产生的效果并非完全一样的,有时即时获得较高的点击率,但由于广告显示总数较少,因此同样不能在短期内获得明显的推广效果。 时代营销的测试表明,如果与一般BANNER广告相比,1.2%的点击率应该算比较高了,但由于网络营销是一个相对专业的领域,每天实际的检索数量并不是很多,因此,点击率本身并不能说明最终效果,还应看点击数量。在时代营销本次测试活动中,设定了每天最高限额为10美元,但实际上每天点击所产生的费用远远不到10美元,这说明这次广告投放获得的最终效果(点击总数,即为网站带来的直接访问者)并不是很显著,对网站新增加的访问量微乎其微,从网站流量统计报告中也可以看出,在关键词广告投放期内,网站流量保持基本稳定,略有增长的访问量也并非都是google关键词广告所产生。

(4)定期跟踪分析关键词广告效果是必要的

对广告活动进行定期的跟踪记录是必要的,这样便于及时发现问题,对于点击率过低的关键词做出必要的调整(尽管google会根据关键词最近出现的情况自动禁止点击率低于0.3%的关键词继续显示广告,但如果长期处于广告被禁止的状态会贻误时机,并且对广告真实效果失去信心)。 如果点击率和点击数量都比较高,那么可能很快达到所设定的每日最高限额,广告便无法继续出现在google的检索结果中,这时可根据财务状况是否调整每日限额,以在较短时间内获得理想的营销效果。

googleadwords 发表于 >2005-5-10 11:46:39  [全文] [评论] [引用] [推荐] [档案] [推给好友]

2005-5-10Google全接触

■ 1、搜索入门

要用Google做搜索,当然首先要进Google网站--www.Google.com;不过,163.com和yahoo.com.cn使用的实际上也是Google搜索引擎(因种种原因,网易和雅虎中国现已改用百度引擎 — 本站注),只是对搜索结果进行了编排,而且无法提供一些特色功能,如图片搜索等。因此,如果你要搜索网页的话,就直接使用Google.com吧。
第一次进入Google,它会根据你的操作系统,确定语言界面。需要提醒的是,Google是通过cookie来存储页面设定的,所以,如果你的系统禁用cookie,就无法对Google界面进行个人设定了

Google的首页很清爽,LOGO下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,假定你是个搜索新手,想要了解一下搜索引擎的来龙去脉和搜索技巧。在搜索框内输入一个关键字“搜索引擎”, 选中“搜索中文(简体)网页”选项,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。

搜索:“搜索引擎”
结果:已搜索有关搜索引擎的中文(简体)网页。 共约有707,000项查询结果,这是第1-10项 。 搜索用时0.08秒。

仔细看一下搜索结果的前十项,就会发现绝大部分链接是搜索引擎本身,而不是对搜索引擎的或者搜索技巧方面的介绍。

注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。

 ■ 2、初阶搜索

上例是最基本的搜索,即查询包含单个关键字的信息。但是,你可以发现,上例中,单个关键字“搜索引擎”,搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢?我们需要进一步缩小搜索范围和结果。

2.1、搜索结果要求包含两个及两个以上关键字

一般搜索引擎需要在多个关键字之间加上“ ”,而Google无需用明文的“ ”来表示逻辑“与”操作,只要空格就可以了。现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上有“搜索引擎”和“历史”两个关键字。

示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页
搜索:“搜索引擎 历史”
结果:已搜索有关搜索引擎 历史的中文(简体)网页。 共约有78,600项查询结果,这是第1-10项 。 搜索用时0.36秒。

用了两个关键字,查询结果已经从70多万项减少到7万多项。但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的“历史”,并不是我们所需要的“搜索引擎的历史”。 怎么办呢?删除与搜索引擎不相关的“历史”。我们发现,这部分无用的资讯,总是和“文化”这个词相关的,另外一些常见词是“中国历史”、“世界历史”、“历史书籍”等。

2.2、搜索结果要求不包含某些特定信息

Google用减号“-”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。

示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页
搜索:“搜索引擎 历史 -文化 -中国历史 -世界历史”
结果:已搜索有关搜索引擎 历史 -文化 -中国历史 -世界历史的中文(简体)网页。 共约有36,800项查询结果,这是第1-10项 。 搜索用时0.22秒。

我们看到,通过去掉不相关信息,搜索结果又减少了将近一半。第一个搜索结果是:

搜索引擎直通车≡搜索引擎发展历史
搜索引擎直通车, ... 搜索引擎专业介绍站点. ...
www.se-express.com/about/about.htm - 14k - 网页快照 - 类似网页

非常符合搜索要求。另外,第八项搜索结果:

463搜索王
本站检索 整个网站 在此输入关键词. 你的当前
位置:首页 >> Internet搜索手册 >> 搜索引擎的历史. ...
www.cnco.net/search/history.htm - 21k - 网页快照 - 类似网页

也符合搜索要求。但是,10个结果只有两个符合要求,未免太少了点。不过,在没有更好的策略之前,不妨先点开一个结果看看。点开se-express.com的这个名为“搜索引擎发展历史”的网页,我们发现,搜索引擎的历史,是与互联网早期的文件检索工具“Archie”息息相关的。此外,搜索引擎似乎有个核心程序,叫“蜘蛛”,而最早成型的搜索引擎是“Lycos”,使搜索引擎深入人心的是“Yahoo”。了解了这些信息,我们就可以进一步的让搜索结果符合要求了。

注意:这里的“ ”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“搜索引擎 - 文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“-”被忽略。

2.3、搜索结果至少包含多个关键字中的任意一个

Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。在上例中,我们希望搜索结果中最好含有“archie”、“lycos”、“蜘蛛”等关键字中的一个或者几个,这样可以进一步的精简搜索结果。

示例:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。
搜索:“搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo -文化”
结果:已搜索有关搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo -文化的中文(简体)网页。 共约有8,400项查询结果,这是第1-10项 。 搜索用时0.16秒。

我们看到,搜索结果缩小到8千多项,前20项结果中,大部分都符合搜索要求。如果你想了解一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果吧。

注意:“与”操作必须用大写的“OR”,而不是小写的“or”。

在上面的例子中,我介绍了搜索引擎最基本的语法“与”“非”和“或”,这三种搜索语法Google分别用“ ”(空格)、“-”和“OR”表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“ ”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用“OR”连起来)。

■ 3、杂项语法
3.1、通配符问题
很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用""引起来。比如,“"以*治国"”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。

3.2、关键字的字母大小写

Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。

3.3、搜索整个短语或者句子

Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。

示例:搜索关于第一次世界大战的英文信息。
搜索:“"world war I"”
结果:已向英特网搜索"world war i". 共约有937,000项查询结果,这是第1-10项 。 搜索用时0.06秒。

3.4、搜索引擎忽略的字符以及强制搜索

Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。

示例:搜索关于www起源的一些历史资料。
搜索:“www的历史 internet”
结果:以下的字词因为使用过于频繁,没有被列入搜索范围: www 的. 已搜索有关www的历史 internet的中文(简体)网页。 共约有75,100项查询结果,这是第1-10项 。 搜索用时0.22秒。

我们看到,搜索“www的历史 internet”,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求。这里我顺便说一点搜索引擎分词的知识。当我们在搜索“www的历史”的时候,搜索引擎实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。

如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。
搜索:“+www +的历史 internet”
结果:已搜索有关+www +的历史 internet的中文(简体)网页。 共约有25,000项查询结果,这是第1-10项 。 搜索用时0.05秒。

另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“”world war I””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。

搜索:“"www的历史" internet”
结果:已搜索有关"www的历史" internet的中文(简体)网页。 共约有7项查询结果,这是第1-6项 。 搜索用时0.26秒。

我们看到,这一搜索事实上把“www的历史”作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。

注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
■ 4、进阶搜索
上面已经探讨了Google的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。

4.1、对搜索的网站进行限制

“site”表示搜索结果局限于某个具体网站或者网站频道,如“www.sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。

示例:搜索中文教育科研网站(edu.cn)上关于搜索引擎技巧的页面。
搜索:“搜索引擎 技巧 site:edu.cn”
结果:已搜索有关搜索引擎 技巧 site:edu.cn的中文(简体)网页。 共约有608项查询结果,这是第1-10项 。 搜索用时0.05秒。

示例:上著名IT门户网站ZDNET和CNET搜索一下关于搜索引擎技巧方面的资讯。
搜索:“"search engine" tips site:www.zdnet.com OR site:www.cnet.com”
结果:已在www.zdnet.com内搜索有关"search engine" tips OR site:www.cnet.com的网页。 共约有1,040项查询结果,这是第1-10项 。 搜索用时0.09秒。

注意,在这里Google有个小BUG。“已在www.zdnet.com内搜索…”,其实应该表述成“已在www.zdnet.com和www.cnet.com内搜索…”。

示例:搜索新浪科技频道中关于搜索引擎技巧的信息。
搜索:“搜索引擎 技巧 site:tech.sina.com.cn”
结果:已在tech.sina.com.cn搜索有关搜索引擎 技巧 的中文(简体)网页。 共约有163项查询结果,这是第1-10项 。 搜索用时0.07秒。

注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。

4.2、在某一类文件中查找信息

“filetype:”是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。其中最实用的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索几个资产负债表的Office文档。
搜索:“资产负债表 filetype:doc OR filetype:xls OR filetypept”
结果:已搜索有关资产负债表 filetype:doc OR filetype:xls OR filetypept的中文(简体)网页。 共约有481项查询结果,这是第1-10项 。 搜索用时0.04秒。

注意,下载的Office文件可能含有宏病毒,谨慎操作。

示例:搜索一些关于搜索引擎知识和技巧方面的PDF文档
搜索:“"search engine" tips OR tutorial filetypedf”
结果:已向英特网搜索"search engine" tips OR tutorial filetypedf. 共约有12,600项查询结果,这是第1-10项 。 搜索用时0.22秒。

我们来看其中的一个结果:

[PDF]Search Engines Tips
文档类型: PDF/Adobe Acrobat - HTML 版
... http://www.google.com/press/zeitgeist.html  See what people are searching on at Google.com
* Search Engine Watch http://searchenginewatch.com/  Some free tips ...
www.allvertical.com/PromoKits/SearchEngineTips.pdf - 类似网页

可以看到,Google用[PDF]来标记这是一个PDF的文档检索,另外,它还给出了该PDF文档的HTML版本,该HTML版保留了文档的文字内容和结构,但没有图片。

4.3、搜索的关键字包含在URL链接中

“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。

示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi “沧海一声笑””
结果:已搜索有关inurl:midi "沧海一声笑"的中文(简体)网页。 共约有27项查询结果,这是第1-10项 。 搜索用时0.34秒。

注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。例如,Google会把“cgi-bin/phf”中的“/”当成空格处理。

“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。

示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
搜索:“allinurl:"cgi-bin" phf +com”
结果:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有51项查询结果,这是第1-10项 。 搜索用时0.11秒。

4.4、搜索的关键字包含在网页标题中

“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。

示例:查找日本明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 "写真集"”
结果:已搜索有关intitle:藤原纪香 "写真集"的中文(简体)网页。 共约有315项查询结果,这是第1-10项 。 搜索用时0.15秒。

4.5、搜索的关键字包含在网页的“锚”(anchor)链点内

所谓“锚”,就是在同一个网页中快速切换链接点。与URL和TITLE类似,Google提供了两种对anchor的检索,“inanchor”和“allincnchor”。对此不作详述。

■5、其他罕用语法

5.1、搜索所有链接到某个URL地址的网页
如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“link”语法就能让你迅速达到这个目的。

示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接到www.newhua.com的网页 。 共约有920项查询结果,这是第1-10项 。 搜索用时0.12秒。

注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被Google忽略。另外还要说明的是,link只列出Google索引链接很小一部分,而非全部,所以如果你用Google没有搜到链到你的主页的链接,也不必灰心丧气。 除了上述功能,link语法还有其它妙用。一般说来,做友情链接的网站都有相似地方。这样,你可以通过这些友情链接,找到一大批具有相似内容的网站。比如说,你是个天文爱好者,你发现某网站非常不错,那么,可以用link语法查一下与之做链接的网站,也许可以找到更多符合你兴趣的内容。

5.2、查找与某个页面结构内容相似的页面

“related”用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:wwwsina.com.cn/index.shtml”。我到现在也不明白这个语法有什么作用,如果有谁知道,请不吝指教。预先感谢。

5.3、从Google服务器上缓存页面中查询信息

“cache”用来搜索Google服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。

其它罕用语法如info、stock等不一一介绍,有兴趣的读者可以参阅Google大全。
■ 6、图片搜索

Google自称可以检索390,000,000张图片,并称自己为“互联网上最好用的图像搜索工具”。从使用结果来看,Google的图片搜索的确不错,但个人以为比AltaVista的还是要差一些,主要体现在检索图片数量比不上AV,匹配度比AV的图片搜索器也差了些。但AltaVista国内用户无法正常访问,因此对中国用户而言,Google的图片搜索引擎已经是最好的了。

Google首页点击“图像”链接就进入了Google的图像搜索界面“images.Google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,就会搜索到大量的小甜甜布兰妮的图片。我目前尚不是很清楚图片的排列标准,不过以观察来看,似乎图片文件名完全符合关键字的结果排列比较考前,然后才按照普通的页面搜索时的标准排列。

Google给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。

Google图像搜索目前支持的语法包括基本的搜索语法如“ ”、“-”、“OR”、“site”和 “filetype:”。其中“filetype:”的后缀只能是几种限定的图片类似,如JPG,GIF等。

示例:查找新浪网上本拉登的图片
搜索:“拉登 OR 拉丹 site:sina.com.cn”
结果:搜索有关 拉登 OR 拉丹 site:sina.com.cn 的图片。 共有6项查询结果,这是第1-6项。 搜索用时0.36秒。

这里我想说明一点的是,images.google.com作为专门的图片搜索引擎,实际上有其特殊的用途。

举个例子,互联网上本拉登的照片成千上万,但是,它们都是分散的,往往随机的分布于各种新闻报道中。如果用搜索图片库的方式(最容易想到的如“Ben Ladin photo”),来搜索本拉登的照片,显然是不恰当的,因为很少有人专门为拉登建一个在线相册。在这个时候,images.google.com就派上用场了。

但是,如果查找的图片在网上有很多主题“gallary”,如诸多电影电视明星的照片,则明显就不适合用images.google.com来查找了。

images.google.com对于很多报纸杂志的编辑,绝对是一个雪中送炭式的工具。比如要在某个版面上插一张专题图片,用google的图片搜索功能几秒钟就可以搞定。

综上,可以有这样的一般性结论:如果要搜索的图片是分散的,则用google图片搜索;如果要搜索的图片通常是处于某个图片集合中的,则不适合用google图片搜索。

■ 7、目录检索

如果不想搜索广泛的网页,而是想寻找某些专题网站,可以访问Google的分类目录“http://directory.Google.com/”,中文目录是“http://directory.Google.com/Top/World/Chinese_Simplified/”。分类的网站目录一般由专人负责,分类明确,信息集中。因此读者应该养成这样的习惯:首先考虑所需要的信息能否在一个专门主题的网站上找到。不过需要说明的是,用目录检索,往往需要用户对查询的领域很熟悉。否则,连查询的内容属于哪个类目都不知道,目录浏览也就无从谈及了。

目前Google使用的分类目录采用了ODP的内容。“Open Directory Project”是网景公司所主持的一项大型公共网页目录。由全世界各地的义务编辑人员来审核挑选网页,并依照网页的性质及内容来分门别类。因此,在某一目录门类中进行搜索往往能有更高的命中率。另外,Google根据其专业的“网页级别”(PageRank)技术对目录中登录的网站进行了排序,可以让一般的检索更具高效率。

示例:查找一下介绍搜索引擎方面的中文网站
搜索:先进入中文简体分类目录,再进入“计算机”目录,再进入“互联网络”子目录,再进入“搜寻”子目录。我们看到在“World > Chinese Simplified > 计算机 > 互联网络 > 搜寻”下,还有两个子目录“分类目录 (33) 搜索引擎 (10)”,以及6个相关网站。显然,这些都是我们所需要的信息。

除了用鼠标层层点入,也可以在目录中检索。比如,在上例的“互联网络”目录下,选中“只在互联网络中搜索”选项,在搜索栏内填入“搜索引擎”进行搜索。
结果:在分类Google 网页目录项中搜索搜索引擎。 共约有387项查询结果,这是第11-20项 。 搜索用时0.09秒。

可以看到,上述查询结果比普通的检索更有效,因为在分类“互联网络”下进行搜索剔除了很多不相关的诸如新闻之类的无效信息。不过,对于中文用户而言,现在最大的问题是志愿的中文目录编辑太少,导致收录站点太少,因此搜索结果范围显得过于狭隘。但愿这个问题能随着Google以及ODP项目在国内名声的响亮而能得到改观。

■ 8、新闻组搜索

新闻组有详尽的分类主题,某些主题还有专人管理和编辑,具有大量的有价值信息。由于新闻组包含的信息实在是海量,因此不利用工具进行检索是不大可能的。DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,Google将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,Google还支持新闻组的WEB方式浏览和张贴功能。

进入Google新闻组“http://groups.Google.com/”,你有两种信息查找方式。一种是一层层的点击进入特定主题讨论组,另一种则是直接搜索。现在,我们进行一个最简单的搜索试验,查找一下新闻组中关于山顶洞人的讨论信息。

搜索:“山顶洞人”
结果:在各群组内搜索 山顶洞人 共约有2,400项查询结果,这是第1-10项 。 搜索用时0.94秒。

搜索结果默认按照“留言内容”排列,但是你也可以点击“依照日期”按钮,让帖子按照发布日期排列。

因为新闻组中的帖子实在是多,而且又涉及一些普通搜索所没有的语法,所以建议使用“高级群组搜寻”进入高级搜索界面。新闻组高级搜索提供留言内容、分类主题、标题、留言者、留言代码、语言和发布日期作为条件进行搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。

■ 9、Google的其他杰出功能

9.1、网页快照
网页快照是Google抓下来缓存在服务器上的网页。它有三个作用:

第一, 如果原地址打开很慢,那么可以直接查看Google缓存页面,因为Google服务器速度极快。

第二, 如果原链接已经死掉或者因为网络的原因暂时链接不通,那么可以通过Google快照看到该页面信息。当然,快照内容不是该页最新页面。

第三, 如果打开的页面信息量巨大,一下子找不到关键词所在位置,那么可以通过Google快照,因为快照中Google用黄色表明关键字位置。

9.2、集成化的工具条

为了方便搜索者,Google提供了工具条,集成于浏览器中,用户无需打开Google主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在Google主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装Google的工具条,可以访问“http://toolbar.Google.com/”,按页面提示可以自动下载并安装。不过,Google工具条目前只支持IE5.0以上版本。

对于经常进行网络搜索者而言,Google工具条实在是必备的东西!!

9.3、单词英文解释

写英文文章的时候,最头疼的事情就是对某个英文单词的用法不确定。现在有了Google,一切就迎刃而解了!无论你是想查找某个生词的意思还是想了解某个单词的用法,均可使用在线词典。

进入英文Google,输入你要查的单词。举个例子,我想查一下suggest的用法。结果如下:“Searched the web for suggest. Results 1 - 10 of about 8,000,000. Search took 0.08 seconds. ”注意看上面句子中,单词suggest下出现了一个横线,点击这个链接,就跳转到另外一个网站“http://www.dictionary.com/”,Google已经把单词提交给该网站的查询脚本。看看这个网站所提供的详尽解释吧。

9.4、网页翻译

你懂英文,但是你不见得就懂德文、法文、拉丁文。如果搜索出来的页面是这些语言怎么办?呵呵,Google提供了网页翻译功能!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个杰出功能。

试着做以下搜索:“big bang site:fr”。这个表示查找关于宇宙大爆炸的法文网页。看第一条结果:

The Big Bang Website - [ Translate this page ]
... A propos de Big Bang. Le dernier numéro en date. Les anciens numéros. Autres
activités. Concerts progressifs en France. Emissions de radio. Liens.
perso.club-internet.fr/calyx/bigbang/ - 3k - Cached - Similar pages

有点晕。没关系,点击“Translate this page”按钮。再看结果,嗯,大致能看明白,这原来是个叫“big bang”的乐队的网站,与大爆炸无关...

机器翻译是一个很前沿的人工智能课题,想指望翻译出来的结果跟专门用英语撰写的内容是不可能的。但西文间的互相转译比中英文机译强得多得多了。至少能看明白。

9.5、单词纠错

笔者记忆力很差,英文单词经常拼写错误。但Google有纠错功能。比如在写上文的时候,我要用到英文单词“tutorial”,我只是依稀记得好像是“tatorial”的样子,但不肯定,于是用Google查了一下,它马上提醒:“您要找的会不会是: tutorial ”,呵呵,正是这个单词。

9.6、繁简转换

对中文用户而言,常希望能同时检索繁体和简体信息。Google能做到这一点。Google默认使用繁简自动转换功能,因此你输入的简体关键字也将被转换成繁体做检索。这样省了不少力气。当然,如果你不希望这样的话,也可以在“使用偏好”中把这个选项关掉。

9.7、搜索结果过滤

网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,Google新设立了成人内容过滤功能,见Google的设置页面,http://www.Google.com/preferences,最底下有一个选项SafeSearch  Filtering。不过,中文状态下的Google尚没有这个功能。

9.8、Google的另类野心

有兴趣者可以参看http://www.Google.com/apis/。我就不多介绍了。

■ 10、Google尚未发布的一些新特性和功能
10.1、对网页更新日期做出限定“daterange:”

评价一个搜索引擎的好坏,更新频率是一个很关键因素。通常情况下,我们总希望能找到最新的网页。Google已经开发了对更新日期做限定的搜索语法,但目前还未公布。而且比较麻烦的是,Google现在支持的日期格式为julian(凯撒日)格式,把通用日期数值切换成julian格式需要借助第三方网站:http://www.tesre.bo.cnr.it/~mauro/JD/。不过,在下面这个自称是“Google终极搜索界面”的网页上,你已经可以利用Google的这项新特性了,它自动提供日期转换功能。

Google Ultimate Interface:http://www.faganfinder.com/google.html

Google为什么要这样做呢?也许是在测试阶段,不想让太多人使用吧。

10.2、新闻搜索“http://news.google.com/”

Google的新闻搜索尚在B测试阶段,但使用起来已经非常不错了。新闻首页按头条新闻,各国新闻,以及不同领域做了分类。你可以通过Google搜索各大门户和新闻网站的新闻,简单、快捷、方便。遗憾的是,目前Google新闻只检索英文信息。

10.3、分类广告搜索“http://catalogs.google.com/”

这也在B测试阶段。主要是对电子分类广告做检索。广告页为JPG图片格式。

10.4、其它Google的最新发展动态

想了解Google公司的工程师们都在忙些什么吗?去看一下Google实验室(http://labs.google.com/)吧。Google的最新设想都在这个地方向访问者展现出来。现在处于发展和试验阶段的新功能有:术语查询、语音查询、键盘查询等等。

网络工程师和程序员可以看看这个地方:http://www.google.com/apis/,我想可以让你喜出望外的。

10.5、一个有趣的地方

想看看世界各国网民都用Google搜索什么信息么?到http://www.google.com/press/zeitgeist.html 看一下就知道了。从这些资讯中,你大致可以了解到世界热点和流行时尚走向。

■ 后记
这个文章4.0版本与3.0版本相比,变更很大,主要把一些与Google无关的东西删除了,另外随Google的变化作了一些修正,并增加了一些Google尚未发布的新功能。关于搜索技巧和搜索实例,是各个搜索引擎共通的东西,是搜索者长期的经验积累,要写出来,是件工程很浩大的事情,因此在这个小文章中我就不献丑了。

随着时间的推移,我发现搜索已经成为网络生活的一部分。工作需要搜索技术文档、客户信息;购物需要搜索商品信息和指南;娱乐需要搜索相关背景资料和图片。搜索已经变得无处不在,而Google则相应的成了工作和生活中的一个必备工具。套用雅虎的一句广告词,我们也许应该这样说:“今天你Google了吗?”

googleadwords 发表于 >2005-5-10 11:45:01  [全文] [评论] [引用] [推荐] [档案] [推给好友]

2005-5-10关于Gmail的百科全书

Gmail是Google公司在2004年4月1日愚人节宣布的一个免费的电子邮件服务。目前仍然处于测试阶段。

目录
1 特色

1.1 GB级的容量
1.2 支持全程SSL加密安全连接
1.3 Labels(标签)取代传统的资料夹
1.4 界面

1.4.1 拼写检查
1.4.2 地址自动完成
1.4.3 键盘快捷键

2 竞争

3 用户资格

4 参考文献

5 外部链接

特色

GB级的容量
第一年容量为1GB,第二年其容量达2GB以上。在刚推出时,比起其他受欢迎的webmail服务如雅虎和微软的Hotmail多出过百倍。Gmail采用归纳式存档,将同一主题的邮件放在一起。而且Gmail内置了基于Google搜索技术的邮件搜索引擎,方便在大容量的邮箱中搜索邮件。同时google在Gmail邮箱中插入基于AdWords服务的广告,希望以此盈利。

在Google宣布推出Gmail服务后,许多人对用户隐私权感到担忧。在Gmail服务的隐私保护政策中指出,“不会采取人工方式阅读用户的电子邮件,以便确定发送什么内容的广告,也不会提供未经用户许可的其他信息”,对用户电子邮件内容的分析完全是通过电脑来进行的。Google在服务隐私条款中同时指出,即使用户将邮箱中的电子邮件删除了,该邮件的副本仍然会保留在系统中,但是google公司并不如此认为。

第二年(2005年4月1日)愚人节,,容量加倍为2GB以上,而且容量随着时间继续增长,以开始速度大约为每秒100K涨至2050MB后开始以每秒10KB的速度增长,目前尚未停止。同时增加了富文本 (RTF格式) 编辑功能。之后的几天(4月10日),更提供多国语言的服务,其中也包括繁体中文以及简体中文。

到目前为止,Gmail仍处于Beta测试阶段,尚未开放大众使用。

支持全程SSL加密安全连接
如果GMAIL的WEB用户使用 https://gmail.google.com/ 登陆服务器,则整个连接过程全部为HTTPS协议加密传输。用客户端软件POP协议存取GMAIL,如OUTLOOK、Entourage、Eudora、Netscape Mail、Mozilla等也可设置为SSL安全连接。

相比之下,大多数免费邮件服务器,不提供或者只在用户身份认证时,才提供SSL连接。

Labels(标签)取代传统的资料夹
另一项创新功能是一个称之为Labels的分类制度,以取代资料夹。每封邮件可以有无限个Labels属性,而不是只能属于一个资料夹。另外,有Filters功能让你自动label邮件。

界面
Gmail运用JavaScript,建立了一个良好的使用者界面。

拼写检查
在Gmail里面,它不会主动标示出错误的语法。你需按下"Check Spelling"的按钮,它才会检查错字。假如有错字,它会将错字划上底线,并以红色表示。按上错字上可以选择可能的正确串法来修正,或选择编辑该字。

地址自动完成
一个自动的工具,打入首几个字,会自动在下面显示曾经联络过的人们的名字以供选择。在Mozilla Mail,Mozilla Thunderbird和Outlook等流行的电子邮件客户端软件里早已经提供这种功能,但是在网络上收发电子邮件的系统上这还是第一次。

键盘快捷键
可以使用键盘键。比如,按下 c 就可以直接撰写邮件,从而取代鼠标操作。

竞争
在Gmail推出后不久后,一个叫Spymac (http://www.spymac.com/)的网站也宣布提供1GB的电子邮件服务。

2004年6月15日,雅虎将它的免费用户的容量提升至100 MB,又在7月27日零点之前推出容量为250MB的免费邮箱(简体中文版更可享用1GB的邮箱)。付费用户的容量则全部升至1GB(日本则为3GB),连界面也有所改变。2005年5月1日起,雅虎香港的繁体中文版亦可享用1GB的邮箱。

微软则计划在2004年年底之前将Hotmail美国免费用户的信箱容量则增加至250MB,付费用户的信箱容量增至2GB。不过,自从有留学生发觉可以透过更改地址而提早享用更大容量的邮箱之后,引起其他人争相效仿。这使微软感到困扰。

用户资格
用户的来源主要有三种。由2004年3月21日开始,约一千名Google员工及其亲友开始测试。由4月25日开始,在Google旗下Blogger.com的活跃使用者会受到邀请,参与测试。Gmail使用者会不定期受到Google给予的邀请权,可邀请其他人使用Gmail。

Gmail邀请开始成为一种商品,可以在拍卖网站找到其踪迹,甚至出现不少提供以物易Gmail邀请平台的网站。各种交换Gmail的圈子亦如雨后春笋地出现。

2005年2月初,Google开始大量地向Gmail使用者发放邀请权,通常每个使用者都会拥有50个Gmail邀请权,用掉一些后,不久,Google会再次将邀请权的数量补充至50个。同时简化了发送邀请函的方式,只需输入一个E-mail地址就可以将邀请函发出,而在这之前还需要提供First name和Last name。这使得Gmail邀请更容易被得到了。

googleadwords 发表于 >2005-5-10 11:36:17  [全文] [评论] [引用] [推荐] [档案] [推给好友]

2005-5-10关于Google公司

页是关于Google公司的,若想了解Google公司的搜索引擎产品Google, 请参见条目Google

Google公司
 
公司类型 公开 (NASDAQ: GOOG (http://quotes.nasdaq.com/asp/SummaryQuote.asp?symbol=GOOG&selected=GOOG)) 
口号 Don't be evil
成立于 加州山景城(1998年)
总部位于 加州山景城
重要人物 Eric E. Schmidt, CEO/经理
Sergey Brin, 技术主管
Larry E. Page, 产品主管
雇员数目 约1000. (2004年)
产品 参见公司产品和服务
网站 www.google.com
Google公司((NASDAQ: GOOG (http://quotes.nasdaq.com/asp/SummaryQuote.asp?symbol=GOOG&selected=GOOG)) ),是一家位于美国的公司,成立于1998年, 拥有着著名的搜索引擎Google, Google总部Googleplex位于美国加州圣克拉拉县的山景城, 公司拥有3000多名雇员.在创建者 Larry Page退下后, Novell公司的前CEO, Eric Schmidt 博士,成为了Google的CEO.

目录
1 公司

1.1 历史
1.2 融资和IPO
1.3 公司年薪
1.4 Google和法律

2 公司文化

2.1 公司哲学
2.2 Googleplex
2.3 IPO和文化

3 公司产品和服务

3.1 Google搜索引擎
3.2 Gmail
3.3 Blogger
3.4 Orkut
3.5 Picasa
3.6 Hello
3.7 Gmail Notifier
3.8 Google的GBrowser浏览器
3.9 Google Desktop Search
3.10 Google Web Accelerator
3.11 Keyhole
3.12 AdWords
3.13 AdSense

4 外部链接

4.1 Google.com的链接
4.2 关于Google的网站

5 参见

公司

历史
Google搜索项目是由二名斯坦福大学的理学博士生Larry Page和Sergey Brin在1996年早期建立的,他们开发了一个对网站之间的关系做精确分析为基础的搜寻引擎, 他的使用结果上胜于当时使用的基本搜索技术。当时项目被称作BackRub因为系统需要检查backlinks(反向链接)去估计站点的重要性。

由于深信得到从其他高相关网站得到最多链接的网页一定是最有关的页面,Page和Brin决定把这作为他们研究的一部分进行测试,这为他们的搜寻引擎打下了基础。他们正式在1998年9月7日在位于加州Menlo Park的朋友的车库里建立了Google公司。在稍后搬到“Googleplex”之前的1999年二月,公司先搬进了加州的Palo Alto大学街165号办公,那里是很多著名的硅谷新建立技术公司荟萃的地方。

Google搜索引擎以它简单,干净的页面设计和最有关的搜寻结果赢得了英特网使用者。广告被以关键字的形式出售,以便他们只对感兴趣是最终使用者出现,而且,为了要使页面设计不变而且快速,广告是以文本的形式出现的。这种以关键字卖广告概念本来是Overture[1] (http://www.content.overture.com/d/USm/about/news/mile.jhtml)开发的(即原来的Goto.com)。当大部份的网络公司倒下时,Google则一直安静地在稳步发展着并开始盈利。

2001年九月,Google的网页评级机制PageRank被授予了美国专利。专利正式地被颁发给利兰斯坦福大学, Lawrence Page作为发明人列于文件中。[2] (http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&p=1&u=/netahtml/search-bool.html&r=1&f=G&l=50&co1=AND&d=ptxt&s1=6,285,999.WKU.&OS=PN/6,285,999&RS=PN/6,285,999)

2003年二月,Google接管了Blogger的所有者Pyra实验室,一个主导Weblog网络服务的先锋。似乎这与Google的使命矛盾。然而,这实际上巩固了公司从blog发布改善Google新闻搜索的速度和其搜索相关性的能力.

2004年初的一个最高峰时期,通过它的网站及其客户网站如雅虎,美国在线和CNN,Google处理了万维网上的80%的搜寻请求。[3] (http://www.onestat.com/html/aboutus_pressbox21.html)Google的份额在2004年2月跌落一些,因为雅虎放弃了Google的搜寻技术,  决定给出自己独立的搜索结果。

Google做事的行为准则是拒绝邪恶的事物,他们的站点时常包括富有幽默感的特征,如他们的图标有选择的在特定时机内风趣的变化[4] (http://www.google.com/holidaylogos.html),还提供幻想或幽默的语言接口,如Klingon语和Leet语,还有愚人节里公司的笑话。

很多人推测Google对于yahoo的反应是籍由从Orkut,Gmail和Froogle搜集到的个人信息,Google下一步将会引入个性化搜索,事实上,在Google实验室网站里,有一个个性化的搜寻测试页面。

融资和IPO
Google的主要投资者是投机资本公司Kleiner Perkins Caufield & Byers和Sequoia Capital。2003年10月,当讨论可能的IPO(初始公开募股)的时候,公司几乎有被微软占股或吞并的可能。

2004年1月,Google宣布雇用摩根士丹利和高曼萨克斯集团管理及IPO。IPO被估计(最高)达40亿美元。因为银行的牵涉,对于Google估计有120亿美元在市场上被销售资本化。

2004年4月29日,Google从证券交易委员会为IPO申请了高达2,718,281,828美元的S-1表单。有文件显示Google自从2001年以后的每年里都是赢利的,而且仅在2003年还从赚的9亿6180万美元中获利1亿560万美元。

2004年5月,Google正式地减少来自高曼萨克斯IPO,留下摩根士丹利和瑞士信贷第一波士顿做联合承保人。

在开始的短暂踌躇之后,Google在2004年8月19日首次公开募股的19,605,052股被以每份$85的价值出售。14,142,135股被Google筹得,5,462,917股卖给股东。销售上升到16亿7000万元,其中大约12亿元在Google里。Google股票中的2亿7100万股在Google的掌控中。IPO给了Google超过230亿美元的市场资本。大部份Google雇员立即变成了百万富翁。

Google目前在纳斯达克证券交易所下以股票代号GOOG进行交易。

公司年薪
很多人都认为在Google工作的基本年薪太低了.举例来说,系统管理只有不超过$33,000-37,000,这以湾区标准来看是非常非常少的了.

Google和法律
有一些组织(其中最具争议性的是科学神教)已经开始根据千禧数字版权法要求Google把其他的站点上的被版权保护的材料移除。Google一般是按要求把连接移除然后在搜索结果里添上一个连接到这个问题的连接。也有一些人抱怨“Google缓存”违犯了著作权。然而,多数人似乎是认为缓存是网络正常功能的一部分,并且HTTP对那些无效的缓存提供了合适的机制(这也是Google所尊重的;网站所有人可以使用robots.txt文件使他们站点的一部分或全部不被包含在搜寻引擎索引内)。

2002年,新闻报告了Google搜寻引擎在中国大陆被封。一个叫做elgooG的镜像站点(镜像包括所有的方面:所有文字也是反的)证实了这个封锁的存在。封锁稍后被解除,有报告指出,不只是Google本身被封,而且,Google网站的缓存功能由于可能准许中国使用者绕开任何对网站的封锁而访问缓存也被封锁。这里有一个类似代理服务器的动态Google像镜站点http://www.zensur.freerk.com/google/.

Google努力精炼的数据库已经导致一些法律论战,一个叫SearchKing的公司于2002年10月的一个诉讼Google故意夸大页面评级卖广告。在辩护中,Google说了它的页面等级是受保护的。2003年中旬,法官以这个理由驳回了SearchKing的诉讼。

2003年下半年和2004开始,传出了Google会因为使用Linux而受到SCO集团起诉的谣言,这是SCO对IBM在Linux版权归属诉讼的一部分。

2004年5月,巴尔的摩太阳报采访了Peri Fleisher——Edward Kasner的侄女,Edward Kasner是发明单词“googol”的数学家,Peri Fleisher说Kasner的子孙们正在探讨合法行为对抗Google的名字。 [5] (http://www.baltimoresun.com/technology/bal-as.googol16may16,0,1939718.story)

2004年9月,香港的Google由于未经本地两家电视台允许而私自下载了他们放在网上的电视片断并提供与Google的用户,而被控侵权。同月的27日,动态网络公司的夏比尔撰文指出Google新闻中国版进行自我审查,去除了一些可能引起中国官方不快的新闻源,这则消息被世界各大通讯社转载,Google则在其官方Blog (http://www.google.com/googleblog/)上发表文章  (http://www.google.com/googleblog/2004/09/china-google-news-and-source-inclusion.html)说这样做是出于无奈.

公司产品和服务

Google搜索引擎
公司产品Google是全世界最受欢迎的搜索引擎, 使用一种自创的称为PageRank™(网页级别)技术来索引网页, 索引是由程序“Googlebot”执行的,它会定期地请求访问已知的网页新拷贝。页面更新愈快,Googlebot访问的也愈多。再通过在这些已知网页上的链接来发现新页面,并加入到数据库。索引数据库和网页缓存大小是以兆兆字节(terabyte)来衡量的。A culture has grown around the very popular search engine and the word to google has come to mean, "to search for something on Google."

Gmail
2004年4月1日愚人节,Google宣布推出1GB空间的电子邮件服务Gmail,次年4月1日更是增加为2GB以上, 并增加了多语言入口以及富文本编辑功能. 这个邮箱会利用广告词服务扫描邮件内容以显示特定的广告来营利。无论如何, 最初发布的消息引发了业界的怀疑。Google的产品副主管Jonathan Rosenberg稍后向英国广播公司的新闻重申“我们对Gmail的发布是严肃的。”

Gmail邮箱拥有2000MB以上的存储空间。比起大部分其他免费的网络邮箱服务都要大很多——例如,微软的Hotmail和雅虎的邮箱。为了回击Gmail,这两家公司稍后推出了邮箱升级计划,Hotmail英文免费邮箱将由2MB升级到250MB,雅虎英文免费邮箱由4-6MB升级到100MB,后来很快变成250MB,雅虎中文免费邮箱升级到1GB(至2005.4.24日止雅虎台湾免费信箱容量仍为250MB)。其他的邮箱服务提供商也紧跟其后,有一些邮箱现在已经比Gmail还要大了。

2004年8月25日,这项服务开始进行内部测试。公众目前还不能自由注册。不管怎么样,一些Blogger用户还有收到已有的Gmail用户邀请的人已经可以使用他了。由于在类似Gmail swap (http://www.gmailswap.com/)的交换系统上Gmail邀请被人用钱和物品交换,Google后来改变了他的政策:不允许用钱来换Gmail邀请。

有许多人批评Gmail的隐私策略 (http://gmail.google.com/gmail/help/privacy.html)/其中有很多是批评“残留的电子邮件拷贝可能会在我们的系统上保留一段时间,甚至是你把它从邮箱里删除或是终止你的帐号后也是这样。”这一条款的。很多人相信这意味着Google会有意的永久存档已被删除的邮件副本。Google稍后宣称他们将“使用时将尽快地使合理有效的从我们的系统里删除信息”。然而,很多的批评仍然反对Google计划在邮箱内添加自动扫描邮件的文本关联广告。

Blogger
2003年,Google接管了Pyra实验室及其Blogger服务。Google使得先前需要收费的一些功能对用户免费。

Blogger工具及服务,使得发布weblog变得更加简单。用户不需要书写任何代码或是安装任何软件和脚本。而且,用户可以自由的改变blog的设计方案。

Orkut
Orkut没有被在Google的页面上提及,Orkut是一个服务提供商,它被Google工程师们创建并维护。Orkut是一种社会性网络服务,在oukut用户可以留下他们的个人或专业信息,创建与朋友之间的关系或者因为共有的兴趣爱好加入虚拟社团.

有传言说Orkut和Gmail是Google有效搜集他们用户信息计划的一部分,为了将来提供更好的个性化搜索。Google已经在Google实验室开始提供个性化搜索测试。

Picasa
2004年7月13日,Google接管了Picasa (http://picasa.com)公司软件的开发,Picasa软件可以管理共享数字图像。Picasa同时被整合进Google的Blogger内。现在它是免费的。

Hello
Hello (http://hello.com)是Picasa公司的另外一个产品。它允许身处异地的朋友一同浏览图片或交换评论。它也是免费的。

Gmail Notifier
Gmail Notifier是Google出品的用来检查Gmail邮件的软件。

Google的GBrowser浏览器
在Google注册“gbrowser.com”域名之后,很多人相信它计划开发一个万维网浏览器,用以与Internet Explorer竞争。执行主管们想秘密的开发浏览器。一个发言人暗示说,“Google可能再次发明浏览器技术。”Google雇佣了Adam Bosworth,他之前在微软工作并写了Internet Explorer,还有Joe Beda,他曾在微软工作并致力于开发下一代图像引擎。最近,Firefox的项目负责人之一Ben Goodger也加入了GOOGLE公司。但是Google官方从来没有承认过任何Google的浏览器开发计划。

Google Desktop Search
2004年Google推出本地资源搜索工具,需要安装一个几百KB的程序在硬盘,便可通过桌面搜索搜索本地硬盘里的文档。Google桌面搜索推出后,Yahoo!、MSN以及一些中国大陆搜索网站也相继推出了桌面搜索工具。

之前据报 (http://www.nytimes.com/2004/05/19/technology/19google.html?ex=1091505600&en=2c6b32d3e5c0a6d4&ei=5070)Google正在开发一款下载工具,内部开发名称为Puffin,它可以搜索本地文件。Puffin似乎是为了迎战下一代开发名称为Longhorn的微软视窗操作系统中将提供的文件和网络搜寻能力而开发的——Longhorn中的这项功能将与Google的技术核心万维网搜索业务产生直接的竞争。

2004年下半年Google公司推出了这一桌面搜索工具,它的正式名称是Google Desktop Search,这个工具主要用来通过关键字方式搜索安装了该软件的计算机硬盘上的MS OFFICE和TXT文档。

2005年3月8日该软件英文正式版于推出正式版。同时推出中文、韩文测试版。该英文正式版产品增加了众多功能,包括插件的使用。Google Blog (http://www.google.com/googleblog/2005/03/taking-plunge.html)。该软件对中文的支持程度较微软和雅虎的桌面搜索工具更好且软件体积更小,GDS的速度也较其它软件快。

Google Web Accelerator
2005年5月4日, Google公司推出一款新的软体[6] (http://www.google.com/googleblog/2005/05/time-waits-for-no-one.html):  Google Web Accelerator, 这是一款为宽频连接设计的软体. 该软体可以利用 Google 位于世界各地的服务器加速网页的访问, 其原理类似于破网软件:架设本地代理, 浏览器的连接请求皆通过此代理访问实现, 与一般的破网软件不同的是, Google Web Accelerator 会向 Google 网站返回诸如页面请求, 临时cookies之类的数据, 通过与位于 Google 服务器上的版本比对只下载更新的部分, 而且因为一般访问 google 网站较其他网站快, 这也加快了网络访问. 该软件更可以对经常访问的网页进行存档以加速访问. Google网页加速器可以利用Google全球的计算机网络的处理能力,提高网站的加载速度。还能够在向计算机发送前对网站数据进行压缩。Google的这一系统存储用户经常访问的网站的拷贝,并自动获取这些网站的新数据,当用户请求访问这些网站时,浏览器仅仅需要加载网站上更新的部分。

对于隐私问题, 该软件不会访问任何 https 网站, 也可以自定义某些网站不允许加速. Google 宣称不会搜集或转售个人信息.

该软件目前默认支持 Firefox 和 IE 浏览器. 对于其他浏览器需要手动配置代理服务器.

AdSense
Google建立一个广告联盟,加盟的网站根据CPC,CPS的广告方式运行。目前有成千上万的网站加入此联盟。

外部链接

Google.com的链接
Google网站 (http://www.google.com) 
Google网上论坛 (http://groups.google.com/) 
Google图像 (http://images.google.com/) 
Google新闻 (http://news.google.com/)(活跃测试中) 
Google Web Accelerator (http://webaccelerator.google.com/index.html) 
Froogle (http://froogle.google.com)  产品搜索引擎(活跃测试中)
Google功能接口 (http://www.google.com/options/index.html) 
Google网页目录 (http://directory.google.com/) 
Google Print (http://print.google.com/) 
Google商店 (https://www.googlestore.com/)
AdWords (https://adwords.google.com)
AdSense (https://www.google.com/adsense/)
Gmail (http://www.gmail.com/)(β版) 
Google实验室 (http://labs.google.com/)(一个测试服务试验场) 
Google Groups 2 (http://groups-beta.google.com/) 
Google Web Accelerator (http://webaccelerator.google.com/) 
Blogger (http://www.blogger.com/) 
Google正式雇员用的weblog (http://www.google.com/googleblog) 
googlesyndication.com (http://www.googlesyndication.com/)-Google官方镜像 
早期Google.com接口 (http://web.archive.org/web/19981111184551/google.com/)-1998年11月11日的Google界面,来自Internet  Archive
Google超级界面 (http://www.faganfinder.com/google.html) 
Google彩蛋 (http://www.google.com/Easter/feature_easter.html)

关于Google的网站
Google Fight (http://www.googlefight.com/)  - instantly compare two search queries
非官方Google网页目录 (http://www.google-directory.co.uk/)  - 工具和资源的搜集
Google世界 - a directory to find any type of information about the world according to Google (http://google.indicateur.com/) 
The Unofficial Google迷俱乐部 (http://www.ugfc.org/) 
Google观察(Why we nominated Google for the 2003 U.S. corporate Big Brother of the Year) (http://www.google-watch.org/bigbro.html) 
Google观察的观察 (http://www.google-watch-watch.org) 
Google的新闻 (http://www.realseo.com/archives/cat_google_news.html) 
Logoogle.com - Google図标 (http://www.logoogle.com) 
Zorgloob - The french news about Google (http://www.zorgloob.com) 
- A blog entry detailing the answers to a public math challenge issued by Google (http://www.mkaz.com/math/google/) 
PageRank™计算 (http://www.webworkshop.net/pagerank_calculator.php3) 
IPO:
Google IPO Coverage (http://www.google-ipo.com/) 
Google Initial Public Offering, Google IPO (http://www.ipogoogle.org/) 
Prospectus as filed with the Securities and Exchange Commission on August 18, 2004 (http://www.sec.gov/Archives/edgar/data/1288776/000119312504142742/ds1a.htm)

googleadwords 发表于 >2005-5-10 11:33:38  [全文] [评论] [引用] [推荐] [档案] [推给好友]

2005-5-10关于Google的百科全书

Google 是一个位于美国 的 万维网 搜索引擎 ,是网上最流行的搜索引擎之一, Google公司 的搜索引擎 网站 Google和其客户网站如 美国在线 那里每天接受2亿次搜索请求。其公司总部位于美国 加州 圣克拉拉县 的 山景城 (被称为“ Googleplex ”)。

除了搜索 网页 之外,Google也提供对图象,存在于 Usenet 上的 新闻讨论组 ,新闻和在线销售商品的搜索服务。截至 2005年 2月 ,Google数据库已经索引了80.5 亿 个网页,11亿8千万图象及8亿4千5百万新闻组 帖子 -总共为95 亿 。它也 缓存 了编入索引中的绝大多数网页的内容。

因为Google的名声(也许有80%的网路使用者都使用她),“Google”一个事物做动词表示的是“在Google上寻找某事”。它有宽泛的“搜索网路”的意思。Google官方并不鼓励这种滥用他们公司名字的习惯,因为它可能导致Google变成一个 通用商标 名。

历史

语源

“Google”这个词来自于“ googol ”。“googol”一词是由美国 数学家 Edward Kasner 的侄子 Milton Sirotta 创造的,表示1后面有100个零的数字(1 followed by 100 zeroes)。Google使用这个词代表公司想征服网上无穷无尽资料的雄心。最初时公司的名字就叫作“Googol”,但是当创办人将该计划推荐给一个投资人 Andy Bechtolsheim 时,这个投资人寄来的支票上写的收款人是“Google”,为了接收这一张支票,公司的名字由此而来。

公司总部Googleplex来自于英语单词Googolplex,意思是10的Googol次方(1后面有Googol个0,1 followed by a googol zeroes).

搜索引擎

物理构造

Google 周围的万维网 Google使用位于世界各地的 GNU/Linux 服务器场计算机回答搜索要求并索引网页。服务器场被以 shared nothing architecture 结构建造.索引是由程序“Googlebot”执行的,它会定期地请求访问已知的网页新拷贝。页面更新愈快,Googlebo访问的也愈多。再通过在这些已知网页上的链接来发现新页面,并加入到 数据库 。索引数据库和网页缓存大小是以 兆兆字节 (terabyte)来衡量的。

Google使用的这些机器的精确大小和位于何处至今未知,Google官方刻意含糊其词。在 John Hennessy 和 David A. Patterson 所着的《计算机建筑:走进大数》中,推测Google的 服务器场 中 群集计算机群 形成的“搜寻场”在2000年大约应该有6000个処理器,12000个普通 IDE 硬盘(即每个机器2个硬盘1个处理器),他们位于四个地方:二个在 硅谷 和二个在 维吉尼亚 。每个都以OC 48的线路(2488 Mbit/s,参见 宽带 )连接着因特网并且有一个OC 12(622 Mbit/s)线路连接着其他3个Google分站点。这些连接使用 思科12000 网关 ,用二个 Foundry Networks BigIron 8000 的 以太网交换器 分流成4 x 1 Gbit/s的线路连接到64个服务器夹,里面前后各是40台电脑和1台 惠普 以太网交换机,所以一个架子共有80个机器和2个 惠普 交换机。

Google在 2004年4月 发布的IPO S-1表单后,大财政公司的英特网开发单位副总裁Tristan Louis估计了现在的服务器场包含下列各项 [1] ( http://www.tnl.net/blog/entry/How_many_Google_machines   :

719个服务器架

63,272台机器

126,544个処理器

253,088 GHz的処理能力

126,544 GB内存

5,062 TB的硬盘空间

依照这一估计,Google服务器场组成了全球最强大的 超级计算机 ,每秒运行速度至少三倍于 地球模拟器 。

PageRank™和索引

Google惟一被公开过的算法是使用一种自创的称为 PageRank ™( 网页级别 )技术来索引网页。该 算法 根据其他链接到特定网页的 加权系数 来整理。因此网页级别技术其实是根据由人所建立的链接来编排网页。此前许多与Google一样流行的搜索引擎使用基于关键词的方法来排列搜索结果。这种方法是以搜索关键词出现的次数或相关性来排列最后的搜索结果。先前的那些曾经比Google更流行的搜索引擎只是查看关键字在文中出现的次数或关键字于网页的关联程度。除了网页级别技术外,Google 还有使用其他秘密的标准来决定网页排名的先后。Google创新的搜索技术和典雅的用户界面设计使Google从第一代搜索引擎中脱颖而出。Google并非只使用 关键词 或 代理 搜索技术,它将自身建立在高级 PageRank™ (网页级别)技术基础之上。这项专利技术可确保始终将最重要的搜索结果首先呈现给用户。网页级别可对网页的重要性进行客观的分析。用于计算网页级别的公式包含5亿个 变量 和20多亿个项。网页级别利用巨大的网络链接结构对网页进行组织整理。当从网页A链接到网页B时,Google就认为“网页A投了网页B一票”。Google还对 投票 的网页进行分析。Google复杂的自动搜索方法和结构设计被认为可以避免任何人为感情因素提供公正的搜索结果。随着搜索引擎优化( SEO )和各种针对PageRank的交换链接的行为的流行,Google的PageRank及公正性也越来越受到人们的质疑。

Google不但索引并缓存 HTML 文件, 而且还索引其他12种文件类型, 包括 .PDF , .txt , .doc 和 .xls 。除了文本文件,其他文件的是先转换为HTML版本后缓存的。所以借助Google可以不需要有这些文件的相应程序就可以看见这些非网页文件,如Word或是Excel。

使用者能自定义搜寻引擎。他们能设定一个缺省语言或使用 "SafeSearch" 过滤技术,设定在每页上被显示的结果多少。Google受争议的放置永久 cookie 在用户的机器上以储存这些信息,这使他们能够了解过去用户的搜索内容。任何一次搜索请求(只有头10个关键字被查询),每次最多查询头 1000 个结果(以每一页最多100个结果的方式显示)。

尽管它有极大的索引数目,仍然有相当多数量的数据库的数据只能是从网站访问到,而不是借由连接。这所谓的 深网 暂时不能被Google数据库所复盖,举例来说包含了 图书馆 的 目录 ,官方的 法定 (政府)公文, 电话簿 等。

(关于 PageRank™ 的介绍,参见 Google的PigeonRank™页 ( http://www.google.com/technology/pigeonrank.html   )

“Google跳舞”和SEO

Google跳舞是一种经常被讨论的现象,Google跳舞指的是Google月底大量更新数据库和算法的几天时间,因为可以发现,这几天对Google搜索关键字如www.yahoo.com得到的结果数是不一样的.

在跳舞期间,一个站点的等级可能在短时间里戏剧般的改变,而且不同的Google服务器(举例来说,www.google.com,www2.google.com,www3.google.com,www.google.co.uk,www.google.com.tw等)可能为相同的关键字提供不同的结果。跳舞似乎当是googlebot机器人抓取网页期间随即发生的。快速更新的网站,高级别的网页和新闻网站是最经常被检查的,虽然新闻不一定如此。小的调节在每月里持续进行以确定网页级别。在一些情况下,可能需要二到三个月让新建页面出现在搜索结果里。从 2003年 的夏季开始,每月的搜索,索引和等级更新被不见断的持续更新所取代。这种改变大大减少了Google搜索结果的不稳定性。2003年 11月15日 ,Google似乎进行了有史以来最重要的一次算法升级,后来被称为“ 佛罗里达更新 ”。在这次更新中,几乎所有商业领域的关键词都受到了影响,尤其是一些热门的关键词,Google搜索的结果页完全变了个样儿,很多头一天还排在首位的网站被远远甩到了500名之后。

Google目前的主要挑战之一是,它的算法和结果越是得到网路使用者的信赖,商业网站为了利益而暗中破坏结果的风险就越戏剧般的增加。一些搜索引擎优化公司已经开始尝试使用各种不同的技巧提升Google网页评级,以使他们客户的网站更多的被搜索到。Google已经设法减少了一些已知的使用这种方法的网站的Google页面评级。

SEO (Search Engine Optimization),即“搜索引擎优化”。由于Google实际上已经成为最流行的搜索引擎之一,很多网站管理员十分热衷于跟踪他们网站在Google上的左侧排名,并试图解释他们排名变化的原因。现在已有不少网站提供排名Google 搜索引擎优化 服务,如在一些高流量的讨论区内刻意加入商业网站的链接,从而使该网站在Google的排名提高。这种“发明”虽然的确有一定成效,但这种收取客户金钱,在第三者的讨论区上大卖广告,一方面对讨论区的读者造成困扰,也侵害了讨论区的商业利益;这种做法也明显违反了商业道德。

还有一种被普遍采用的技术是很多网站使用一个相同的关键字连接到某一个特定的网站,以使用户在Google搜索这个关键字的时候,这个网站的排名会出现在结果的较前面。这种方法被称为 Google炸弹 。现在Google算法更新的频率非常快,距猜测,现在算法公式中涉及的变量有300多个,PageRank™在整个Google算法中的影响力已经下降到20%左右,最终平衡的算法中最重要的变量所占的比例不会超过10%,单纯靠技术手段提升排名的网站已经禁不住时间的考验。

Google发布了一系列的 文章 ( http://www.google.com/webmasters/guidelines.html   以指导站长们提升他们网站的页面评级。

其他的Google服务

Google网上论坛( 新闻组 和Google图片搜索服务

Google维护着一个重要的 新闻组 存档,它被叫做Google网上论坛(即从前一个叫做 DejaNews 的独立网站)和一个图像搜索服务(被叫做“Google图像”)。前者保存了几十年内几乎所有的新闻组 帖子 ,后者的搜索则是以与图片相关的网页的文本,图片的标题为基础进行的,图片被以 合理使用 原则缓存进了Google服务器。

Google现在正在尝试一个新版的网上论坛服务(Google Group-beta),它除了增加新闻组投递功能外还有 邮件列表 功能,可以使用如类似Gmail这类的接口完成操作。(见下)

Google Group-beta 目前还存在 一些未解决的缺陷 ( http://groups-beta.google.com/group/google-labs-groups2/msg/b54c12517c75eb24   。

Google新闻

Google有一个 测试版 的自动化 新闻 服务, 2004年 9月“Google新闻”包括有 美国 版, 英国 版, 德国 版, 法国 版, 西班牙 版, 意大利 版, 新西兰 版, 印度 版, 澳洲 版, 台湾 版, 韩国 版, 日本 版, 中国 版和 香港 版。为了公正客观没有偏见的报到任何新闻,Google新闻的产生是完全由电脑算法决定的,没有人类编辑参与其中。

该服务包括在过去30天内所含语言新闻网站上出现新闻的存档,不同的国家有不同数量的新闻来源;对于英语它包括大约4,500个新闻源,其他语言比较少一些。并且提供新闻的大约头200个字和一个指向全文的连接。一些需要先订阅才能阅读的网站;Google新闻标题中还会有明显的提示信息。

Google新闻提供搜索服务,结果可以以新闻发生日期(这样就不会再对新闻发生的时间感到困扰了)或相关性成类排序(也可以直接分类查看)。在英语版中,有一个可以选择对应国家的选项。

还可以使用关键字订阅Google新闻警报。这样,当与关键字相关的新闻发生时,Google新闻会发出一封 电子邮件 通知订阅者。

2005年 3月10日 Google新闻增加了自定义功能,用户可以自己随意定义自己喜欢看的新闻,甚至不同语言的新闻也可以混和在一页内。这是网络新闻提供方式的一个重大革新。

Google新闻服务也可以按来自国家分别查看

Google网页目录

Google网页目录是一个包括了世界多种语言网页的目录集。在网页目录里面的网页内容一般不会被翻译为其他语言,而总是包括其语言在 万维网 中的内容的。

网页目录功能与网页搜索是集成的,当搜索网页时,相关网页在目录中的内容会以链接的形式在搜索结果中显现。点击链接就可以找到在同一个目录下相似网页或其它类似分类,这当你不确定到底要找什么时是非常有用的。当搜索范围涵括太广,使用网页目录可缩小搜索于指定范围。例如察看“ 中文 / 新闻 / 杂志 ”分类子目录,则可知道有哪些中文杂志有网页。网页目录可略去类似但无关的网页。如检索“ 大学 ”,将搜索范围设定“ 教学机构 ”分类,即可略去像“大学书城”、 古书 里“大学”、 论语 的内容.网页目录只包括经编辑群审核过网站。因为网页目录是在 开放式目录 (Open Directory)工程下运作的。网页重要性排列是网页级别技术及人工的结合。Google还可辨出常用重要网站,排放在目录前面(用 粗体字 标出)提升网页搜索效率并借由绿线长短表明网页评级。(参见 PageRank ™)

Google Answer

2002年 4月,Google启动了名为" Google Answers "的新服务.Google Answers是传统搜索功能的扩展-用户不用自己搜索内容,他们请专家搜索然后付费.顾客问问题,并为问题提供一个相应的价钱,然后研究者们回答他们的问题.研究者们经过程序的筛选以测试他们的水平和交际能力.问题的价格从$2到$200不等;Google从中提取25%回扣,剩下的归研究者所有,他们还要付$0.50的列出费.一旦一个问题被回答了,它的答案对所有人就都可以免费浏览了.这个服务在 2003年 5月开始公共测试.现在大约一天会有100个问题被回答.

Froogle

2003年 12月,Google发布了 Froogle ,一个搜索网页目录上特定产品的副产品.这个站点活跃测试了几个月.现在它也提供 无线可标记语言 (WML)格式以使得电话或其他支持WML的无线设备可以访问它.

Google Web API

Google Web API (网络应用程序接口或网络服务)是Google为注册的开发者提供的公共接口.使用 Simple Object Access Protocol (SOAP,简单对象访问协议),程序员可以依据Google搜索结果开发搜索服务和进行数据挖掘.同样的,网虫们也可以访问页面缓存然后对页面提出建议.

缺省的,一个开发者每天只能有1,000次搜索请求.这个程序仍然処于测试中.Google是很少的几个把其结果通过公共网络应用程序接口公开给大众的搜索引擎; Technorati 是另外一个这样做的公司. Google这项服务的一些流行应用包括, Google Alert最新资料快报 FindForward ( http://www.findforward.com   ,它同时也是一个调查 Google跳舞 情况的工具,它监视着Google 蜘蛛 在万维网上的活动情况.

Google Print

Missing image
Google.Print.png

In August, 2004, Google released its new "Google Print" feature. This tool searches the contents of books submitted by publishers, and displays matches before the regular web matches. It offers links to purchase the book, as well as advertisements related to the content. Google will only allow users to view a limited number of pages from each book. In order to enforce these limits, they will track users of the system. As of early August, 2004 , this service is still in beta. This feature is in response to the "Search inside this book" feature from A9.com .

Google Scholar

Missing image
Google.Scholar.png

In November, 2004, Google released "Google Scholar", which indexes and searches academic literature across an array of sources and disciplines. Results are ranked by "relevance", which is based largely on the number of citations and in this sense is similar to PageRank.

Google Special

Allows you to perform special searches such as U.S. Government Search, Linux Search, BSD Search, Apple Macintosh Search, and Microsoft Search.

Google University

集中搜寻大学的网页。

Google Wireless

Google 无线 可以让用户通过无线设备例如 手机 或者 掌上电脑 来搜索。

Google Video

2005年 1月25日 , Google公司 推出 Google Video ( http://video.google.com/   服务,该服务可以通过Google网站搜索最近播出的电视节目。目前该服务仍处于 β测试 阶段,且仅能搜索 美国 播出的电视节目。

Google Search History

Google搜索历史,记录用户的每一个搜索关键词以及相关网页的点击情况,还可以显示出每天的搜索频率。需要用Google帐户登陆才能使用这项服务。

Gmail

2004年 四月一日由Google推出1GB的免费邮箱,目前处于测试阶段,需要 Gmail 用户的电子邮件邀请才能申请。

2005年 四月一日,Gmail推出“无限加一”计划,邮箱的储存量将随着时间而增加,增长速度大约为每秒10KB。

其他工具

Google提供一个 点击付费 的广告服务叫做 AdWords ,它允许广告商们在Google搜索结果页和参与使用 AdSense 项目的网站上显示他们的广告条。

AdSense允许站长们显示Google广告在他们的站点上并以访问者点击获得收益。这项服务使用Google的相关文本技术以使广告内容与页面内容一致。

Google提供几种语言间实验性的 机器翻译 服务。

Google内置一个 计算器 和 单位转换 ,见 下 。

2002年 5月,Google在Google实验室里启动Google术语测试版。它可以对给定的词提供其不同网站上的定义。测试之后,Google现在将其与Google搜索合并;现在它称作Google Definitions。

2003年 9月,Google启动地点搜索测试版,其类似与普通搜索,但它允许用户限制搜索美国境内的州,城市或 邮政编码 。它还提供用户相关地区的地图,估计距离,方位信息。这项服务最近重命名为Google Local。

2004年 3月,Google实验室启动了两个测试。一个是个性化网页搜索,这是一个依赖于用户特征或兴趣的搜索引擎。另一个是Google网页提醒,这个工具会当网页上有用户定义的相关搜索新信息时会给用户发送提醒电子邮件。

Google工具软件

Google工具栏

Google工具栏是一个免费的IE插件。功能包括:在不打开Google网页的情况下随时搜索并查看相关页面信息;查看Google对网页的PageRank;阻止 自动弹出窗口 ;自动填写表单;用不同颜色标识关键字。

有人指称使用它会带来安全风险,因为它会在无用户干预的情况下自动更新。

英语版的Google工具栏可以参与 Google Compute 计划,这是一个由 美国 斯坦福大学 进行的帮助研究蛋白质折叠、误解、聚合及由此引起的相关疾病的 分布式计算 工程(参见 Folding@home )。

其他浏览器,如 Mozilla Firefox , Opera 和 Safari ,有提供相同功能的内建搜寻工具。Mozilla Firefox还有一个专门的Google工具栏:Googlebar,它是被独立开发的,并不被Google或Mozilla Firefox开发者所支持。它在官方的Google工具栏上做了扩展,惟一没被取代的功能是Google PageRank™。Google功能也已经被 苹果电脑 的新 操作系统 OS X 的 Safari 所内建。

Google工具栏目前已经推出“3β”版本,其中主要的新功能包括了 拼写检查 、 字词翻译 和“自动链接”。自动连接功能能在鼠标指向的相关 超链接 下显示相关信息,如鼠标指向一个 ISBN 号,则在下方就可以显示出 Amason网上书店 中这本书的相关信息。目前,该连接功能只适用于 美国 。最近。也有人批评该项创新功能是破坏了网页创建者的网页自主权。因为此项功能实际是通过修改原 网页 HTML 代码实现。

Google Deskbar

2003年 12月,Google启动了测试版的Google Deskbar,这是一个运行在 Microsoft Windows 系统 任务栏 上的搜索工具,而不必打开 网页浏览器 。它还可以搜索电评论, 股票 价格,在在线 字典 和 辞典 中查找某字词的释义,查找任何预定义的第三方网站(例如 eBay 或 亚马逊 网上书店)。Deskbar被很多人认为最强大的功能之一就是所谓的全局指令键(Ctrl+Alt+G),无论在任何文档中选择关键字后都可以直接进行搜索。

Google Desktop Search 桌面搜索

参见 Google Desktop Search

Google Web Accelerator

参见 Google Web Accelerator

对Google的批评

当Google显然已经开始被大众作为首选的搜索工具后,Google也同时成为被批评的对象.在线新闻站点们不喜欢Google新闻的发行. 2003年2月 ,Google封了 Oceana 这个有着两年半历史的 非盈利组织 的广告,他们抗议了一个主巡航线的排污方法.在 华盛顿 电子隐私信息中心 的副执长 Chris Hoofnagle 警告说"因为法院正在变得更为经常的用电子记录作为证据,Google的风险正在变大...这是一个严重的隐私威胁."

指责其产生的结果偏见的主张

2004年 4月,Google接到了关于在其网站上搜索"Jew"( 犹太 人)时产生的结果的抱怨, 反犹主义 网站 Jew Watch 排在结果的首位.Google坚持他们的结果是由内容中立的算法计算的, Jew Watch网站 ( http://www.google.com/explanation.html   这个网站因为被人在英文 维基百科 上放置了一个 Google炸弹 : Jew 而排在结果首位的.Jew Watch在其他的搜索引擎上同样排名前列,如Yahoo!和MSN,但这些公司很少收到指责.

Jew Watch的主页四月末开始从Google搜寻结果中排名下降.因为期间Jew Watch的网络空间服务提供商 EV1 取消了它的帐号,这个网站因此有几天完全无法访问.因为Google的蜘蛛程序在重复尝试后无法到达该网站,于是它的排名在Google索引里开始滑落. [2] ( http://news.com.com/2100-1038_3-5200203.html   这个站点之后找到了另一家服务提供商于是其在Google中的排名在五月的第一个星期开始上升.Google在 2004年 4月23日 在其"讨厌的搜索结果里"解释说"被我们删除的网站都是法律上强迫我们删除的".

指责其进行自我审查的主张

宣扬种族优势和历史修正主义的网站已经在法国和德国Google上封锁很多年了,因为那些言论在当地不合法.简体中文版的Google也限制了上万个关键字,技术上讲,这等同于是参与了中国中央政府的控制政策 [3] ( http://www.weeklystandard.com/Content/Public/Articles/000/000/004/699bevot.asp   .其它潜在的争议性网站如赤裸裸的 色情图片 网站大部分没有收到影响,无论如何(缺省支持的"SafeSearch"滤镜) 网络过滤程序 在Google图像搜索上的作用并不是很明显.

指责其滥用隐私的主张

有人指责Google利用惟一标识 cookies 破坏了访问者的隐私.这些cookies不会过期并且用户的搜索请求在未得到同意的情况下被用于广告目的.Google宣称cookies是用来获取用户在不同session和网站的参数选择的,用户可以自己选择关闭cookies.

一些人相信Google的 GMail 会过度的処理信件内容.支持这观点的人一般没有GMail帐号,因为他们不同意GMail的服务条款,但问题是向GMail发信的用户也会收到未经批准的信件内容分析.Google宣称使用GMail发送或接受的信件不会被人类分析,它只用来改进广告内容关联性服务.

对PageRank系统的批评

Google的PageRank系统已经受到批评,一些人宣称其'不民主'. 普通的Google批评者称这套系统更偏向于大型网站,并且页面重要性的的标准并没用经过 同业审查 .

外部链接

其他国家/地区的Google

1. 美属萨摩亚 ( http://www.google.as/   , 2. 安圭拉岛 ( http://www.google.off.ai/   , 3. 安提瓜和巴布达岛 ( http://www.google.com.ag/   , 4. 阿根廷 ( http://www.google.com.ar/   , 5. 澳洲 ( http://www.google.com.au/   , 6. 奥地利 ( http://www.google.at/   , 7. 阿塞拜疆 ( http://www.google.az/   , 8. 比利时 ( http://www.google.be/   , 9. 巴西 ( http://www.google.com.br/   , 10. 英属维京群岛 ( http://www.google.vg/   , 11. 保加利亚 ( http://www.google.com/webhp?hl=bg   (Google.bg域名已经注册但还未开通) 12. 布隆迪 ( http://www.google.bi/   , 13. 加拿大 ( http://www.google.ca/   , 14. 乍得 ( http://www.google.td/   , 15. 智利 ( http://www.google.cl/   , 16. 哥伦比亚 ( http://www.google.com.co/   , 17. 哥斯达黎加 ( http://www.google.co.cr/   , 18. 科特迪瓦 ( http://www.google.ci/   , 19. 古巴 ( http://www.google.com.cu/   , 20. 刚果民主共和国 ( http://www.google.cd/   , 21. 丹麦 ( http://www.google.dk/   , 22. 吉布提 ( http://www.google.dj/   , 23. 多米尼加共和国 ( http://www.google.com.do/   , 24. 厄瓜多尔尔 ( http://www.google.com.ec/   , 25. 萨尔瓦多 ( http://www.google.com.sv/   , 26. 密克罗尼西亚联邦 ( http://www.google.fm/   , 27. 斐济 ( http://www.google.com.fj/   , 28. 芬兰 ( http://www.google.fi/   , 29. 法国 ( http://www.google.fr/   , 30. 冈比亚 ( http://www.google.gm/   , 31. 格鲁吉亚 ( http://www.google.ge/   , 32. 德国 ( http://www.google.de/   , 33. 直布罗陀 ( http://www.google.com.gi/   , 34. 希腊 ( http://www.google.com.gr/   , 35. 格陵兰 ( http://www.google.gl/   , 36. 英属格恩西 ( http://www.google.gg/   , 37. 洪都拉斯 ( http://www.google.hn/   , 38. 香港 ( http://www.google.com.hk/   , 39. 匈牙利 ( http://www.google.co.hu/   , 40. 印度 ( http://www.google.co.in/   , 41. 爱尔兰 ( http://www.google.ie/   , 42. 英属马恩岛 ( http://www.google.co.im/   , 43. 以色列 ( http://www.google.co.il/   , 44. 意大利 ( http://www.google.it/   , 45. 牙买加 ( http://www.google.com.jm/   , 46. 日本 ( http://www.google.co.jp/   , 47. 英属泽西岛 ( http://www.google.co.je/   , 48. Kazakhstan ( http://www.google.kz/   (哈萨克), 49. 韩国 ( http://www.google.co.kr/   , 50. 拉脱维亚 ( http://www.google.lv/   , 51. 莱索托 ( http://www.google.co.ls/   , 52. 列支敦士登 ( http://www.google.li/   , 53. 立陶宛 ( http://www.google.lt/   , 54. 卢森堡 ( http://www.google.lu/   , 55. 马拉维 ( http://www.google.mw/   , 56. 马来西亚 ( http://www.google.com.my/   , 57. 马耳他 ( http://www.google.com.mt/   , 58. 毛里求斯 ( http://www.google.mu/   , 59. 墨西哥 ( http://www.google.com.mx/   , 60. 英属蒙特塞拉特岛 ( http://www.google.ms/   , 61. 纳米比亚 ( http://www.google.com.na/   , 62. 尼泊尔 ( http://www.google.com.np/   , 63. 荷兰 ( http://www.google.nl/   , 64. 新西兰 ( http://www.google.co.nz/   , 65. 尼加拉瓜 ( http://www.google.com.ni/   , 66. Norfolk Island ( http://www.google.com.nf/   , 67. 巴基斯坦 ( http://www.google.com.pk/   , 68. 巴拿马 ( http://www.google.com.pa/   , 69. 巴拉圭 ( http://www.google.com.py/   , 70. 秘鲁 ( http://www.google.com.pe/   , 71. 菲律宾 ( http://www.google.com.ph/   , 72. 英属皮特克恩岛 ( http://www.google.pn/   , 73. 波兰 ( http://www.google.pl/   , 74. 葡萄牙 ( http://www.google.pt/   , 75. 波多黎各 ( http://www.google.com.pr/   , 76. 刚果共和国 ( http://www.google.cg/   , 77. 罗马尼亚 ( http://www.google.ro/   , 78. 俄罗斯联邦 ( http://www.google.ru/   , 79. 卢旺达 ( http://www.google.rw/   , 80. Saint Helena ( http://www.google.sh/   , 81. 圣马力诺 ( http://www.google.sm/   , 82. 新加坡 ( http://www.google.com.sg/   , 83. 斯洛伐克 ( http://www.google.sk/   , 84. 南非 ( http://www.google.co.za/   , 85. 西班牙 ( http://www.google.es/   , 86. 瑞典 ( http://www.google.se/   , 87. 瑞士 ( http://www.google.ch/   , 88. 台湾 ( http://www.google.com.tw/   , 89. 泰国 ( http://www.google.co.th/   , 90. 特立尼达和多巴哥 ( http://www.google.tt/   , 91. 土耳其 ( http://www.google.com.tr/   , 92. 乌克兰 ( http://www.google.com.ua/   , 93. 阿拉伯联合酋长国 ( http://www.google.ae/   , 94. 联合王国 ( http://www.google.co.uk/   , 95. 乌拉圭 ( http://www.google.com.uy/   , 96. 乌兹别克斯坦 ( http://www.google.uz/   , 97. 新赫布里底群岛 ( http://www.google.vu/   , 98. 委内瑞拉 ( http://www.google.co.ve/   , 99. 越南 ( http://www.google.com.vn/   ,

所有的Google网站产生相似但可能顺序不相同的结果。在当地违法的网站会被Google的那个地方版本所删除,如“whitepower.com”在Google德国中的那样。Google国家版允许用户搜索全球或只是这个国家域。一些国家会有不同的缺省语言设定。

Google新闻地区连接

澳洲 ( http://news.google.com/news/en/au/main.html

加拿大 ( http://news.google.com/news/en/ca/main.html

中国 ( http://news.google.com/news?ned=cn

法国 ( http://news.google.com/news/fr/fr/main.html

德国 ( http://news.google.com/news/de/de/main.html

香港 ( http://news.google.com.hk/news?ned=hk

印度 ( http://news.google.com/news/en/in/main.html

意大利 ( http://news.google.com/news/it/it/main.html

日本 ( http://news.google.com/news?ned=jp

韩国 ( http://news.google.com/news?ned=kr

新西兰 ( http://news.google.com/news/en/nz/main.html

西班牙 ( http://news.google.com/news/es/es/main.html

台湾 ( http://news.google.com.tw/news?ned=tw

联合王国 ( http://news.google.com/news/en/uk/main.html

美利坚合众国 ( http://news.google.com/news/en/us/main.html

第三方Google工具

GGSearch ( http://www.frysianfools.com/ggsearch/   Floating search tool for Google that works with any browser

Internet based Free SEO Tools ( http://www.seocompany.ca/tool/seo-tools.html   page with over 60 different tools.

模仿Google的网站

Cthuugle Search Fhtagn! ( http://www.cthuugle.com/   , 完整的 HP Lovecraft 搜寻引擎

elgooG ( http://www.alltooflat.com/geeky/elgoog/   镜象搜寻引擎

googleadwords 发表于 >2005-5-10 11:29:56  [全文] [评论] [引用] [推荐] [档案] [推给好友]

2005-5-10雅虎和Google的搜索功能比较

——调查显示:雅虎在多媒体搜索领域领先Google
   雅虎日前已发布了视频搜索服务的正式版本,它称,这项服务能使用户搜索互联网上包括从新闻、电影、广告到电视节目在内的所有类型的视频内容。内容提供商包括哥伦比亚广播公司新闻、路透社、MTV、VH1、Country Music Television、iFILM.com。家园电视频道、饮食电视网、发现频道、动物星球、旅游频道也将成为雅虎公司的内容合作伙伴。

  Yahoo Search部门多媒体搜索技术负责人约翰表示,我们强大的多媒体爬行、摘要、排名技术,以及与内容合作伙伴的广泛关系,将使Yahoo! Video Search能够向用户提供很好的网络视频搜索体验。

  扬基集团的分析师沃克表示,大多数的主要搜索服务厂商都瞄上了多媒体搜索。约翰表示,消费者对上网感到更舒适了,他们能够毫无障碍地下载视频内容了。搜索引擎提供或考虑提供视频搜索是非常重要的。

  但约翰指出,尽管雅虎公司已经正式发布了视频搜索服务,视频搜索服务仍然处于其发展的早期阶段,尤其是并非所有的搜索引擎厂商都提供这一服务。

  另一家知名的视频搜索服务厂商是Google,它在1月份发布了β版视频搜索服务,使用户能够搜索电视节目内容。Google的内容合作伙伴包括PBS、C-SPAN、NBA、福克斯新闻网、发现频道、动物星球、发现健康频道、美国有线新闻网络。

  但最近对搜索用户进行的调查表明,在视频搜索领域雅虎公司占有优势。尽管在搜索领域具有整体优势,但多媒体内容搜索却是它的短板儿,竞争对手可能在这一领域称雄。

  沃克表示,Blinkx等新兴的搜索引擎提供商都在努力夺取市场份额。她指出,通过在视频搜索领域提供最好的服务,规模较小的提供商也能够与Google、雅虎竞争。

googleadwords 发表于 >2005-5-10 11:12:40  [全文] [评论] [引用] [推荐] [档案] [推给好友]

2005-5-10Google全球网站中断数小时

5月9日消息 据外电报道,一个尚未查清原因的“与域名服务相关”的故障使Google搜索网站在星期六晚些时候关闭了一段时间。

这一事件使人们推测Google成了最近出现的一波域名服务中毒攻击的受害者。

Google的网站中断达几个小时,影响到了Google.com主页、Gmail服务、Google新闻、Froogle、Google图像搜索、Google兴趣组和Google本地搜索等多项网络服务。

Google企业通信部门主管David Krane证实了出现网络中断的问题。但是,他坚持说出现这个问题的原因并不是恶意黑客攻击的结果。他说,Google的全球网站在今年早些时候有一段时间无法访问。我们已经修复了这个问题。Google的全球网站已经恢复了。

据报道,一个与搜索有关的论坛和网络日志以及许多网络用户被重新引导到了一个名为SoGoSearch.com的网站。那是一个与Google无关的第三方搜索引擎。

但是,Krane否认了黑客攻击的说法。他说,这绝不是黑客攻击的结果。这是与域名有关的故障。我们研究了SoGoSearch的报告,发现这个事情与我们网站出现的故障无关。

Google网站几天前还出现了一个问题。Google在5月4日推出了一个测试版的网络加速器。然而,这个网络加速器不仅使网络用户难以登录网站,而且还不兼容一些网络应用程序。Google在星期六(5月7日)晚上不得不关闭了这个测试版的网络加速器。

googleadwords 发表于 >2005-5-10 11:10:02  [全文] [评论] [引用] [推荐] [档案] [推给好友]

2005-5-10如何让站点搜索排位更高 搜索专家有秘诀

  你想确保你的站点能够被搜索引擎找到,并被赋予一个好的排位?很简单,你只要遵循几条基本的规则就行了,搜索专家说。

  首先,你要弄懂Google的PageRank机制是如何检索网页和为网页排位的,Google的产品市场经理Debbie Jaffe表示。

  本周,在多伦多举行的“搜索引擎策略会议”上,Jaffe向人介绍了Google内容检索所使用的不同爬行周期。例如,Google站点的“主”搜索部分,检索的是那些不经常变动的、并且在一个月内至少被检索过一次的内容。然而,在“新闻”搜索部分,则是检索那些每天被检索过多次的内容。

  同时,不要尝试通过一些方法来愚弄搜索引擎,以提高自己站点的排位,SearchEngineWatch.com的副编辑Chris Sherman表示。

  专家称,利用好网站服务器中的Robots.txt标准,来帮助搜索引擎来分析你网站中那些内容是可检索、那些内容是不可检索会带来好处。同时,使用301或者302 HTTP重定向页面同样会有好处。

  Ask Jeeve的搜索工程师Matias Cuenca表示,文明、新鲜和完整是Ask Jeeves搜索算法检索和排名站点是的三个主要依据。

  雅虎的国际搜索运作主管Tomi Poutanen表示,雅虎的搜索引擎是目前唯一使用Meta关键字信息的搜索引擎。然而,Poutanen称,曾作为搜索引擎优化的标准工具之一的Meta关键字,有可能会被人滥用。因此,雅虎的搜索引擎只会在Meta关键字真正出现在页面上,并且不是作为愚弄搜索引擎的一种手段时,才会利用到Meta关键字帮助搜索。

Google--PageRank(网页级别)技术解密[转]相关推荐

  1. 这是 Google 工程师 Amit Singhal 发表在 Google 官方博客的一篇文章,讲述了 Google 搜索排名背后的一些技术,涉及到 Google 对网页,对语义,对用户意图的理解。

    XEIM这是 Google 工程师 Amit Singhal 发表在 Google 官方博客的一篇文章,讲述了 Google 搜索排名背后的一些技术,涉及到 Google 对网页,对语义,对用户意图的 ...

  2. 搜索引擎重复网页发现技术分析

    /*版权声明:可以任意转载,转载时请务必标明文章原始出处和作者信息 .*/   搜索引擎重复网页发现技术分析 中科院软件所  张俊林 TIMESTAMP:2006年6月1日 一.  介绍 统计结果表明 ...

  3. CAD/DWG图Web网页可视化技术之栅格和矢量瓦片

    CAD/DWG图Web网页可视化技术之栅格和矢量瓦片 - vjmap - 博客园 背景 在上一篇博文中CAD图DWG解析WebGIS可视化技术分析总结提到,实现CAD/DWG图形Web展示的思路一般为 ...

  4. Google PageRank算法

    1. PageRank算法概述: page rank,或PageRank,也称为PageRank.Google left rank或PageRank. 这是谷歌创始人拉里•佩奇(Larry·:page ...

  5. 亿级商品详情页架构演进技术解密 | 高可用架构系列

    亿级商品详情页架构演进技术解密 | 高可用架构系列 --http://mp.weixin.qq.com/s?__biz=MzAwMDU1MTE1OQ==&mid=210272034&i ...

  6. Google PageRank的计算源代码

    最近对google的PageRank(网页等级)比较感兴趣,一直想知道如何不用google toolbar来获取pr值.苦苦搜索之后,找到如下代码: <?php /** This code is ...

  7. 让餐厅放心的云服务-雅座CRM技术解密

     让餐厅放心的云服务-雅座CRM技术解密 发表于2015-07-02 16:03| 2036次阅读| 来源CSDN| 4 条评论| 作者杨砚 云计算SaaS雅座CRM width="22 ...

  8. java web 截图_如何以Java实现网页截图技术

    今天看到某网友关于"如何以Java实现网页截图技术"的咨询帖,由于出现该咨询的地点非常不适合较长回复,故以博文形式回答. 事实上,如果您想以Java实现网页截图,也就是" ...

  9. 雅虎JavaScript架构师:网页开发技术安全优先

    由于当前技术仍偏向功能强化为主要思维,指令码趋向庞杂的结果,容易产生更多安全漏洞,且失去快速因应攻击调整架构的灵活性. 身为JavaScript网路技术重要推手的雅虎(Yahoo!)架构设计师Doug ...

  10. google地图网页版_谷歌收录查询方法大全,如何让Google快速收录网页?

    谷歌收录是指,Google有没有将你的网页,放入自己的数据库.这样可以在谷歌seo的时候,达到可以通过自然流量搜索到你,并且产生询盘.订单等目的.在过去的几年,也就是Google缺数据的时候,你的谷歌 ...

最新文章

  1. 未处理的异常:进程性能计数器已禁用
  2. [C++11]可调用对象包装器function
  3. redhat 9.0 mysql 配置_RedHat 9.0下Apache+PHP+MySQL服务器安装配置
  4. 运行php程序cpu 100%,php 应用 cpu 100% 调试方法
  5. Java_Decimal
  6. 秒杀/抢购系统设计优化
  7. PHP高并发场景的三种解决方案
  8. BOSS直聘免费下载个人简历为PDF的方法
  9. tumblr_向您的Tumblr博客添加高级主题
  10. 供应链金融与区块链02——论文阅读
  11. finally这样写会吞掉异常?
  12. spring boot 项目 事务 不能回滚 代理(not eligible for auto-proxying)
  13. PGSQL学习——触发器
  14. what is MacPorts?
  15. 【解决】长虹电视连接不上WiFi
  16. 如果手里有现金,是提前还房贷还是买基金?
  17. HTML5:canvas基础
  18. Extmail修改模板及其它配置
  19. css3实现折纸效果
  20. TMS320F2812和TMS320F28335的差别

热门文章

  1. 浅谈前端开发过程中使用的代理方法
  2. 网页格式html转换成pdf的方法,将网页内容转化为PDF的三种方法
  3. Linux安装SSH
  4. Sentaurus 入门之二视频教程合集
  5. 教你设置技嘉主板bios中文图解
  6. 如何将origin pro的界面切换变成中文显示?
  7. Python爬取淘宝商品附加cookie修改
  8. 反垄断重锤字节跳动,投资业务原地熄火 腾讯阿里争做“普通公司”
  9. 使用PowerDesigner创建JAVA类图
  10. 定向士官学计算机网络技术可以吗,山东信息职业技术学院2016年定向培养士官招生问答...