[Google API](4)搜索结果
现在您可以开始看看个别结果;事实上,GoogleSearchResult 对象是查询返回的所有结果的整体:
...
import com.google.soap.search.GoogleSearchResultElement;
public class GoogleSearchTutorial {
...
GoogleSearchResult result = search.doSearch();
GoogleSearchResultElement[] resultElements = result.getResultElements();
System.out.println("Start index = "+ result.getStartIndex() );
System.out.println("End index = "+ result.getEndIndex() );
} catch (GoogleSearchFault gsf) {
...
getResultElements() 方法将返回一组 GoogleSearchResultElement 对象,每个对象占据整个结果集中的一个位置。它是以 1 开始的索引,因此,找到 1790000 个结果的搜索将返回一组 GoogleSearchResultElement 对象,索引号从 1 开始到 10 结束。(请记住,每条请求最多返回 10 个结果。)
访问个别结果
访问每个个别结果简单到只要循环这个数组:
import com.google.soap.search.GoogleSearch;
import com.google.soap.search.GoogleSearchResult;
import com.google.soap.search.GoogleSearchFault;
import com.google.soap.search.GoogleSearchResultElement;
public class GoogleSearchTutorial {
public static void main (String[] args) {
String searchTerm = args[0];
try {
GoogleSearch search = new GoogleSearch();
search.setKey("00000000000000000000000000000000");
search.setQueryString(searchTerm);
GoogleSearchResult result = search.doSearch();
GoogleSearchResultElement[] resultElements = result.getResultElements();
int startIndex = result.getStartIndex() - 1; int endIndex = result.getEndIndex() - 1; for (int i = startIndex; i <= endIndex; i++) { GoogleSearchResultElement resultElement = resultElements[(i)]; String title = resultElement.getTitle(); String url = resultElement.getURL(); System.out.println(title); System.out.println(url); System.out.println(""); }
} catch (GoogleSearchFault gsf) {
System.out.println("Google Search Fault: "+gsf.getMessage());
}
}
}
因为数组是从零开始的,所以要减去 1 才能得到真正的起始和结束的值。
显示个别结果
如下所示,GoogleSearchResultElement 对象代表数组内的每一个结果,它的方法可以访问如标题等信息。对于 "science fiction" 搜索,打个比方,结果可能是:
<b>Science</b> <b>Fiction</b> Weekly
http://www.scifi.com/sfw/
SCIFI.COM
http://www.scifi.com/
<b>Science</b> <b>Fiction</b> and Fantasy Writers of America, Inc.
http://www.sfwa.org/
The Link?ping <b>Science</b> <b>Fiction</b> & Fantasy Archive
http://www2.lysator.liu.se/sf_archive/
Asimov's <b>Science</b> <b>Fiction</b>
http://www.asimovs.com/
The SF Site: The Best in <b>Science</b> <b>Fiction</b> and Fantasy
http://www.sfsite.com/home.htm
World <b>Science</b> <b>Fiction</b> Society / Worldcon [Official]
http://worldcon.org/
Analog <b>Science</b> <b>Fiction</b> & Fact
http://www.analogsf.com/
ULTIMATE <b>SCIENCE</b> <b>FICTION</b> WEB GUIDE
http://www.magicdragon.com/UltimateSF/SF-Index.html
Feminist <b>Science</b> <b>Fiction</b>, Fantasy & Utopia
http://www.feministsf.org/femsf/
请注意,在 Web 搜索中,使用黑体标记突出显示结果中的搜索项;这一信息将延续到结果从 Web 服务返回为止。
目录类别
Google 返回的结果并不限于站点。它还返回每个结果的 Goolge 分类:
...
import com.google.soap.search.GoogleSearchDirectoryCategory;
public class GoogleSearchTutorial {
...
for (int i = startIndex; i <= endIndex; i++) {
GoogleSearchResultElement resultElement = resultElements[(i-1)];
String title = resultElement.getTitle();
String url = resultElement.getURL();
GoogleSearchDirectoryCategory category =
resultElement.getDirectoryCategory(); String categoryViewable = category.getFullViewableName(); String categoryString = category.toString();
System.out.println(categoryViewable + " " + categoryString);
System.out.println(title);
System.out.println(url);
System.out.println("");
}
...
GoogleSearchDirectoryCategory 对象中包含了 Google 类别名(表示为有格式的字符串)和 Open Directory Project 类别名(由 getFullViewableName() 返回)方面的信息。Open Directory 项目将在Open Directory 信息中述及。
运行应用程序将返回目录信息和结果,而且目录信息会在每个结果之前:
Top/Arts/Literature/Genres/Science_Fiction/Magazines_and_E-zines
{SE="", FVN="To p/Arts/Literature/Genres/Science_Fiction/Magazines_and_E-zines"}
<b>Science</b> <b>Fiction</b> Weekly
http://www.scifi.com/sfw/
Top/Arts/Genres/Science_Fiction_and_Fantasy
{SE="", FVN="Top/Arts/Genres/Science _Fiction_and_Fantasy"}
SCIFI.COM
http://www.scifi.com/
Top/Arts/Writers_Resources/Fiction/Science_Fiction_and_Fantasy
{SE="", FVN="Top/Arts/Writers_Resources/Fiction/Science_Fiction_and_Fantasy"}
<b>Science</b> <b>Fiction</b> and Fantasy Writers of America, Inc.
http://www.sfwa.org/
Top/Arts/Literature/Genres/Science_Fiction
{SE="", FVN="Top/Arts/Literature/Genres/Science_Fiction"}
The Linköping <b>Science</b> <b>Fiction</b> & Fantasy Archive
http://www2.lysator.liu.se/sf_archive/
...
片断和上下文
确定一个结果是否恰当部分要通过在该页面其余部分的上下文中看搜索项。API 允许您检索“片断”,即使得该页面被包含在结果中的那部分。
...
String categoryViewable = category.getFullViewableName();
String snippet = resultElement.getSnippet();
System.out.println(categoryViewable + " " + categoryString);
System.out.println(title);
System.out.println(url);
System.out.println(" " + snippet );
System.out.println("");
}
...
请注意,片断并不一定会包括搜索项。例如,您的查询返回:
Top/Arts/Literature/Genres/Science_Fiction/Magazines_and_E-zines
{SE="", FVN="Top/Arts/Literature/Genres/Science_Fiction/Magazines_and_E-zines"}
<b>Science</b> <b>Fiction</b> Weekly
http://www.scifi.com/sfw/
<b>...</b> Hollywood will choose to adapt better SF, and
more. <b>...</b> (c)<br> Copyright 2002, <b>Science</b> <b>Fiction</b> Weekly
(tm).
Top/Arts/Genres/Science_Fiction_and_Fantasy
{SE="", FVN="Top/Arts/Genres/Science_Fiction_and_Fantasy"}
SCIFI.COM
http://www.scifi.com/
[ Farscape/Stargate SG-1 ]. Apr 28, 2002, Today's<br> News Hodder Talks
More 'Daredevil' 'Sub-Mariner <b>...</b>
Top/Arts/Writers_Resources/Fiction/Science_Fiction_and_Fantasy {SE="", FVN="Top/
Arts/Writers_Resources/Fiction/Science_Fiction_and_Fantasy"}
<b>Science</b> <b>Fiction</b> and Fantasy Writers of America, Inc.
http://www.sfwa.org/
<b>...</b> not of SFWA.
Except where otherwise noted, content and design c ]
copyright 1995-2002<br> by <b>Science</b> <b>Fiction</b> and Fantasy Writers of America, Inc. ("SFWA"). SFWA <b>...</b>
...
请再次注意搜索项,如果出现,则应当使用黑体标记突出显示。而且注意到片断是页面内的 HTML 格式的内容。
Open Directory 信息
Open Directory Project 是自愿发起为因特网上有价值的站点编制目录的工作。ODP不是自动的网上搜索程序生成的索引,而是人工编写的站点列表。ODP 数据库是免费使用的,Google 在其结果中利用这一信息。API 可以直接检索这一信息。
import com.google.soap.search.GoogleSearch;
import com.google.soap.search.GoogleSearchResult;
import com.google.soap.search.GoogleSearchFault;
import com.google.soap.search.GoogleSearchResultElement;
import com.google.soap.search.GoogleSearchDirectoryCategory;
public class GoogleSearchTutorial {
public static void main (String[] args) {
String searchTerm = args[0];
try {
GoogleSearch search = new GoogleSearch();
search.setKey("00000000000000000000000000000000");
search.setQueryString(searchTerm);
GoogleSearchResult result = search.doSearch();
GoogleSearchResultElement[] resultElements = result.getResultElements();
int startIndex = result.getStartIndex();
int endIndex = result.getEndIndex();
for (int i = startIndex; i <= endIndex; i++) {
GoogleSearchResultElement resultElement = resultElements[(i-1)];
String title = resultElement.getTitle();
String url = resultElement.getURL();
GoogleSearchDirectoryCategory category =
resultElement.getDirectoryCategory();
String categoryString = category.toString();
String categoryViewable = category.getFullViewableName();
String snippet = resultElement.getSnippet();
String directoryTitle = resultElement.getDirectoryTitle(); String directorySummary = resultElement.getSummary();
System.out.println(categoryViewable + " " + categoryString);
System.out.println(title);
System.out.println(url);
System.out.println(" " + snippet);
System.out.println("Open Directory Information:"); System.out.println(" " + directoryTitle); System.out.println(" " + directorySummary);
System.out.println("");
}
} catch (GoogleSearchFault gsf) {
System.out.println("Google Search Fault: "+gsf.getMessage());
}
}
}
总结 ODP 的信息
请注意,根据长度,摘要会在结果中被截断:
Top/Arts/Literature/Genres/Science_Fiction/Magazines_and_E-zines {SE="",
FVN="Top/Arts/Literature/Genres/Science_Fiction/Magazines_and_E-zines"}
<b>Science</b> <b>Fiction</b> Weekly
http://www.scifi.com/sfw/
<b>...</b> Hollywood will choose to adapt better SF, and more. <b>...</b>
(c)<br> Copyright 2002, <b>Science</b> <b>Fiction</b> Weekly(tm).
Open Directory Information: <b>Science</b> <b>Fiction</b> Weekly The leading electronic publication covering the world of <b>Science
</b><b> Fiction</b>, with news, reviews, original...
Top/Arts/Genres/Science_Fiction_and_Fantasy {SE="",
FVN="Top/Arts/Genres/Science_Fiction_and_Fantasy"}
SCIFI.COM
http://www.scifi.com/
[ Farscape/Stargate SG-1 ]. Apr 29, 2002, Today's<br> News Hodder Talks
More 'Daredevil' 'Sub-Mariner <b>...</b>
Open Directory Information: SCIFI.COM News, reviews, games and shopping from the SCI FI Channel.
Top/Arts/Writers_Resources/Fiction/Science_Fiction_and_Fantasy {SE="",
FVN="Top/Arts/Writers_Resources/Fiction/Science_Fiction_and_Fantasy"}
<b>Science</b> <b>Fiction</b> and Fantasy Writers of America, Inc.
http://www.sfwa.org/
<b>...</b> not of SFWA. Except where otherwise noted,
content and design copyright A 1995-2002
<br> by <b>Science</b> <b>Fiction</b> and Fantasy Writers of
America, Inc. ("SFWA"). SFWA <b>...</b>
Open Directory Information: <b>Science</b> <b>Fiction</b> & Fantasy
Writers of America, Inc. The official Website of the premier professional <b>science</b>
<b>fiction< /b> writer's association. The SFWA site... ...
选择结果范围
到目前为止,示例已经展示的搜索都只请求检索搜索的前 10 条记录。API 支持请求前 1000 个结果内的任何记录,条件是每次在 10 条以内。通过设置起始位置和结果的最多个数,应用程序可以得到可用的结果。
...
search.setQueryString(searchTerm);
int startResult = 100;
search.setStartResult(startResult);
int maxResult = 5;
search.setMaxResults(maxResult);
GoogleSearchResult result = search.doSearch();
GoogleSearchResultElement[] resultElements = result.getResultElements();
int startIndex = result.getStartIndex() - 1 - startResult ;
int endIndex = result.getEndIndex() - 1 - startResult ;
for (int i = startIndex; i <= endIndex; i++) {
GoogleSearchResultElement resultElement = resultElements[i];
...
注意,起始位置的计算和您的想象并不完全相同。例如,startResult 实际上表示最后一条“没有”包括在内的记录索引。例如,上面的代码实际上返回的不是 100 到 105 而是 101 到 106。
为此,startIndex 和 endIndex 不仅要根据 startResult 进行调整,而且还要以 1 为单位进行调整(如前)。
[Google API](4)搜索结果相关推荐
- [Google API](3)创建搜索
需要的类 要通过 Java 使用 Google API,请确保适当的类都能找到.Google 为方便起见已经将这些类捆绑到了 googleapi.jar 文件中,这个文件作为分发包的一部分被包含.这个 ...
- [Google API](8)构建使用Google API的Java应用程序
Google 搜索引擎建立起了通过 Web 服务接口可用的索引.拼写建议和缓存页面,从而允许所有语言的程序员都能就个人使用存取信息.Google 搜索引擎还提供了 Java API,从而存取数据更为便 ...
- [Google API](7)直接使用Web服务
到目前为止,本教程一直在讨论通过 Java 应用程序使用 API 来达到 Google Web 服务的使用目的,但这只是一种方便的办法.可以直接通过 SOAP 消息(在 http://api.goog ...
- [Google API](6)拼写检查器和缓存页面
作为 Google 创建索引过程的有机组成部分,Google 要检索被建立索引的页面副本,在搜索结果中为用户提供到缓存页面的链接.主要的缺点是用户看不到更新后的内容,但一些优点也是存在的. 检索缓存页 ...
- [Google API](2)什么是google API
什么是 Google? Google 是一个搜索引擎,它为 Web 站点.Usenet 新闻组和新闻来源建立索引.Web 上有几十亿个页面,能否得出有用的搜索结果的困难就在于弄清楚哪些页面是真正与用户 ...
- [Google API](1)简介
简 介 Google 搜索引擎现在可以通过基于 SOAP 的 Web 服务来访问了.这意味着,开发人员现在可以在他们自己的应用程序中嵌入 Google 搜索结果和其它信息. 本教程将教您如何使用G ...
- Google API 设计指南-设计模式
翻译自 API Design Guide - Design Patterns 空响应体 标准的 Delete 方法 必须(must) 返回 google.protobuf.Empty 来实现全局一致性 ...
- Google 谷歌网页搜索, 学术搜索
Google 谷歌网页搜索, 学术搜索 1. 网页搜索引擎-Google * https://letsgg.tk/ * https://google.kfd.me/ 谷歌搜索镜像: http://d ...
- Google缩进40%搜索结果,微信公众号/今日头条开放搜索引擎
如图显示,Google已有40%搜索结果是缩进展示. 之前提过的Google新展现形式-缩进搜索结果,现在有了统计数据.已经有40%的搜索结果是缩进结果,没想到比例这么大了28%有一个缩进结果,8%有 ...
最新文章
- matlab matlabpool,Matlab matlabpool函数undefined
- MPB:扬大林淼组-​瘤胃混合细菌连续传代培养技术
- CLI、终端 (Terminal)、Shell、TTY、Console、Bash都是什么?
- linux java编译后生成文件_Linux终端编译并执行Java文件
- python中字典长度可变吗_python中列表长度可变吗
- TW实习日记:第16天
- 能用10块大洋去解决的事,千万不要用时间
- (已解决)iOS真机运行 Xcode报错(libpng error: CgBI: unhandled critical chunk)
- 拓端tecdat|R语言Black Scholes和Cox-Ross-Rubinstein期权定价模型案例
- 不念过往,不畏将来:2022年6月我辞职了...
- 中南林业科技大学的计算机研究生分数线,2020中南林业科技大学研究生分数线(以及历年复试)...
- 如何在Win11中安装wsl Ubuntu系统
- 【php学习之路】微信公众帐号
- Eclipse生成jar包和导入jar包
- python列表拆包_python拆包
- 电脑风扇转一下就停开不了机原因及解决方法
- CSS 的权重和优先级
- 游戏中接入第三方渠道时 关于meta-data的一些小问题
- 关于全局鼠标钩子卡的原因分析
- 类似qq分组栏-动态分组
热门文章
- 深度学习理论与实战:基础篇电子书
- YOLOv5x6模型来了! 同样支持CPU上ONNX部署与推理
- Bags of Binary Words | 词袋模型解析
- 从清洁工到斯坦福教授,一路开挂的她近日入选美国国家医学科学院!
- 汇总|Yolo开源项目
- Chem. Sci. | SyntaLinker: 基于Transformer神经网络的片段连接生成器
- 第二十九课.回声状态网络ESN
- Linux下编译运行C程序
- Shiny平台构建与R包开发(一)——ui布局
- python绘制动态图表怎么存下来_用python如何实现导入excel数据后自动生成图表?python如何实现交互式动态图表?...