一、xxxxxx获取指定任务爬取的所有url的接口

接口名称:xxxxxx获取指定任务爬取的所有url的接口

访问链接:

http://IP:PORT/crwalTask/findUrlExceptionById?ctId=ctIdVal&time=timeVal&limit=limitVal

传入参数类型:String,int

参数内容:

返回类型:JSONArray

返回内容:

调用方法Demo

1 public static void main(String[] args) throws Exception {

2 //爬虫访问接口地址

3 String req_url = "http://192.168.1.105:8080/crwalTask/findUrlExceptionById?ctId=ctIdVal&time=timeVal&limit=limitVal";

4 JSONArray jsonArray = httpRequest(req_url,"ba716af7-105c-481b-bf28-2e9231529947",SelectUtil.time,SelectUtil.number);//200

5 System.out.println(jsonArray);

6 }

7

8 public class SelectUtil {

9 public static final String time = "2018-03-05".replaceAll(" ", "=");//按时间筛选 格式"yyyy-mm-dd"或"yyyy-mm-dd HH:mm:ss"

10 public static final int number = 162;//查询限制数量

11 }

12 /**

13 * 获取指定任务爬取的所有url信息

14 * @param req_url 访问指定任务爬取的url的链接地址

15 * @param ctId 指定的任务Id

16 * @param time 查询时间

17 * @param limit 查询限制的条数

18 * @return

19 */

20 public static JSONArray httpRequest(String req_url,String ctId,String time,int limit) {

21 req_url = req_url.replace("ctIdVal",ctId);

22 req_url = req_url.replace("timeVal",time);

23 req_url = req_url.replace("limitVal",String.valueOf(limit));

24 StringBuffer buffer = new StringBuffer();

25 JSONArray jsonArray = null;

26 try {

27 URL url = new URL(req_url);

28 HttpURLConnection httpUrlConn = (HttpURLConnection) url.openConnection();

29

30 httpUrlConn.setDoOutput(false);

31 httpUrlConn.setDoInput(true);

32 httpUrlConn.setUseCaches(false);

33

34 httpUrlConn.setRequestMethod("POST");

35 httpUrlConn.connect();

36

37 // 将返回的输入流转换成字符串

38 InputStream inputStream = httpUrlConn.getInputStream();

39 InputStreamReader inputStreamReader = new InputStreamReader(inputStream, "utf-8");

40 BufferedReader bufferedReader = new BufferedReader(inputStreamReader);

41

42 String str = null;

43 while ((str = bufferedReader.readLine()) != null) {

44 buffer.append(str);

45 }

46 bufferedReader.close();

47 inputStreamReader.close();

48 // 释放资源

49 inputStream.close();

50 inputStream = null;

51 httpUrlConn.disconnect();

52 if("".equals(buffer.toString())){

53 String exception = "[\"exception\",\"查询的记录数超过240\"]";

54

55 jsonArray = JSONArray.fromObject(exception);

56 }else{

57 jsonArray = JSONArray.fromObject(buffer.toString());

58 }

59 } catch (Exception e) {

60 System.out.println(e.getMessage());

61 }

62

63 return jsonArray;

64 }

View Code

需要的Jar包:

commons-beanutils-1.9.3.jar

commons-collections-3.2.2.jar

commons-lang-2.6.jar

commons-logging-1.2.jar

ezmorph-1.0.6.jar

json-lib-2.4-jdk15.jar

Sql脚本

alter table urlpathmapper add exceptionInfo varchar(2048) comment 'URL运行错误信息'

alter table urlpathmapper add title varchar(256) comment '爬取标题'

alter table crawltaskmanage add checkFile varchar(8) comment '文件是否校验0是1否'

alter table crawltaskmanage add SimHashValue int(8) comment 'SimHash算法重复度比较值'

希望与广大网友互动??

点此进行留言吧!

java对外发布接口文档_java之接口文档规范相关推荐

  1. java 操作 word 表格和样式_java 处理word文档 (含图片,表格内容)

    因为本人长期从事Oa相关项目的开发,所以处理word文档,Pdf,Excel等是在所难免的. 1.需求      处理Excel 能够用jxl        或者poi 2需求     用户在系统上填 ...

  2. java语言 回文判断_java判断回文字符串的几种方法

    java判断回文字符串几种简单的实现: 1.将字符串倒置后逐一比较,实现如下: public class HuiWenTest { /** * @SERLIN */ public static voi ...

  3. java8接口写静态方法_Java 8接口更改–静态方法,默认方法

    java8接口写静态方法 Java 8 interface changes include static methods and default methods in interfaces. Prio ...

  4. java读取带格式word文档_Java读取word文档解决方案

    java读取word文档时,虽然网上介绍了很多插件poi.java2Word.jacob.itext等等,poi无法读取格式(新的API估计行好像还在处于研发阶段,不太稳定,做项目不太敢用):java ...

  5. java设置标签艺术字体颜色_Java 在Word文档中添加艺术字

    与普通文字相比,艺术字更加美观有趣也更具有辨识度,常见于一些设计精美的杂志或宣传海报中.我们在日常工作中编辑Word文档时,也可以通过添加艺术字体来凸显文章的重点,美化页面排版.这篇文章将介绍如何使用 ...

  6. java 预览word文档_Java实现office文档与pdf文档的在线预览功能

    最近项目有个需求要java实现office文档与pdf文档的在线预览功能,刚刚接到的时候就觉得有点难,以自己的水平难以在三四天做完.压力略大.后面查找百度资料.以及在同事与网友的帮助下,四天多把它做完 ...

  7. java定义接口的方法_java定义接口的方法

    java定义接口的方法 发布时间:2020-06-28 13:50:49 来源:亿速云 阅读:103 作者:Leah 本篇文章为大家展示了java定义接口的方法,代码简明扼要并且容易理解,绝对能使你眼 ...

  8. 前端页面嵌入word文档_Java 处理word文档后在前端展示

    这个是个比较传统的解决思路,搜一搜其实发现很多人都这么干,这批人难道也是对上述方法(jsp直接显示)失望了后找的这种模式?呵呵 比较常用的开源免费的有且只有几种,选择其中几种我尝试了一下. 首先想到的 ...

  9. java类引用接口的注释_java – 在接口类型上使用注释有什么好处?

    在这个 example中,注释类型(@interface)下面: @interface ClassPreamble { String author(); String date(); int curr ...

最新文章

  1. 淘宝服务端高并发分布式架构的十四次演进之路
  2. Web性能优化之图片优化
  3. 关于web.config
  4. Chrome调试模拟iPhone6时body显示980*1742
  5. LeetCode 443. 压缩字符串(双指针)
  6. python实例属性引用-python之对象(实例)
  7. rocketMq 顺序消费
  8. penpyxl basic function demo code
  9. C++:编译实验之LR分析器
  10. 怎样使用 ASP.NET Optimization Bundling压缩样式表和脚本
  11. windows 下 新建 点开头的文件和文件夹
  12. vb.net中如何结束一个线程
  13. slk文件转wma_什么是WMA文件(以及如何打开一个文件)?
  14. 【探究服务】——服务的更多技巧
  15. 万物智能——百度世界2020”大会
  16. 戴尔笔记本计算机图标,戴尔笔记本原装桌面图标不见了怎么处理
  17. Vue表单输入绑定(v-model)
  18. putc与stdin,stdout,stderr
  19. ubuntu14关闭来宾账户
  20. 计算机风扇维修,千米快修电脑维修:电脑风扇散热不好,经常出问题怎么办?...

热门文章

  1. 基于Blink构建亲听项目以及全链路debug项目实时响应能力
  2. 数据脱敏平台-大数据时代的隐私保护利器
  3. 30个免费资源:涵盖机器学习、深度学习、NLP及自动驾驶
  4. 机器学习的未来——深度特征融合
  5. 删除超过10亿用户的数据,Facebook 关闭面部识别系统
  6. 刚刚!6月榜单:JS跌惨,Python又霸榜,C++再无翻身可能!
  7. uni app input添加获取验证码按钮_uni-app跨平台框架对微信小程序的无障碍支持探索...
  8. python queue模块安装_Python -- Queue模块
  9. mysql安装pymyaql_python安装mysql的依赖包mysql-python操作
  10. windows oracle 内存大,如何设计Oracle数据库内存的大小