MinerConfig.java 爬取配置类

package com.iteye.injavawetrust.miner;import java.util.List;/*** 爬取配置类* @author InJavaWeTrust**/
public class MinerConfig {/*** URL包含关键字*/public List<String> keys;/*** 存储方式 */public StoreType storeType;/*** 爬取页面最大深度*/public int maxDepth;/*** 下载页面线程数*/public int minerHtmlThreadNum;/*** 分析页面线程数*/public int miseringThreadNum;/*** 存储线程数*/public int minserStoreThreadNum;public List<String> getKeys() {return keys;}public void setKeys(List<String> keys) {this.keys = keys;}public StoreType getStoreType() {return storeType;}public void setStoreType(StoreType storeType) {this.storeType = storeType;}public int getMaxDepth() {return maxDepth;}public void setMaxDepth(int maxDepth) {this.maxDepth = maxDepth;}public int getMinerHtmlThreadNum() {return minerHtmlThreadNum;}public void setMinerHtmlThreadNum(int minerHtmlThreadNum) {this.minerHtmlThreadNum = minerHtmlThreadNum;}public int getMiseringThreadNum() {return miseringThreadNum;}public void setMiseringThreadNum(int miseringThreadNum) {this.miseringThreadNum = miseringThreadNum;}public int getMinserStoreThreadNum() {return minserStoreThreadNum;}public void setMinserStoreThreadNum(int minserStoreThreadNum) {this.minserStoreThreadNum = minserStoreThreadNum;}}

返回列表

转载于:https://www.cnblogs.com/muyuge/p/6152088.html

MinerConfig.java 爬取配置类相关推荐

  1. java爬取论坛信息_Java爬取校内论坛新帖

    Java爬取校内论坛新帖 为了保持消息灵通,博主没事会上上校内论坛看看新帖,作为爬虫爱好者,博主萌生了写个爬虫自动下载的想法. 嗯,这次就选Java. 第三方库准备 Jsoup Jsoup是一款比较好 ...

  2. JAVA爬取淘宝、京东、天猫以及苏宁商品详细数据(一)

    JAVA爬取某东.某宝以及某宁商品详细数据(一) 写在最前 反爬策略问题解决 请求头配置 无代理模式 代理模式 某东 JDHTML解析 JD商品解析 天猫 TMHTML解析 苏宁 SNHTML解析 写 ...

  3. Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索

    Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索 一.资源 为什么接下来的代码中要使用el.getElementsByTa ...

  4. java爬取网页内容 简单例子(2)——附jsoup的select用法详解

    [背景] 在上一篇博文 java爬取网页内容 简单例子(1)--使用正则表达式 里面,介绍了如何使用正则表达式去解析网页的内容,虽然该正则表达式比较通用,但繁琐,代码量多,现实中想要想出一条简单的正则 ...

  5. Java爬取并下载酷狗音乐

    本文方法及代码仅供学习,仅供学习. 案例: 下载酷狗TOP500歌曲,代码用到的代码库包含:Jsoup.HttpClient.fastJson等. 正文: 1.分析是否可以获取到TOP500歌单 打开 ...

  6. Java 爬取微信公众号文章(文字 + 图片)

    https://blog.csdn.net/sunnyzyq/article/details/103837521 Maven依赖: <!-- 阿里巴巴 JSON --> <depen ...

  7. Java爬取并下载酷狗TOP500歌曲

    下文方法及代码仅供学习使用,不做他用.示例用到了一些库,包括:jsoup.HttpClient.net.sf.json大家可以自行去下载jar包. 1.分析是否能获得TOP500歌单 首先,打开酷狗首 ...

  8. java 爬取评论,Java基于WebMagic爬取某豆瓣电影评论的实现

    目的 搭建爬虫平台,爬取某豆瓣电影的评论信息. 准备 webmagic是一个开源的Java垂直爬虫框架,目标是简化爬虫的开发流程,让开发者专注于逻辑功能的开发.webmagic的核心非常简单,但是覆盖 ...

  9. 利用Java爬取基金网站的基金数据,快速筛选优质热门基金

    爬取数据源为天天基金网的页面基金数据 利用java爬取基金数据并简单筛选后的效果图 创建java maven项目,推荐用spring boot maven需要引入的jar包依赖 <!--lomb ...

最新文章

  1. 为什么我在gpu上训练模型但是gpu利用率为0且运行速度还是很慢?
  2. python打开文件_python如何学习
  3. Spartan-6的MCB模块、GTP模块、PCIe端点模块
  4. java怎么防止表单重复提交_如何防止表单重复提交
  5. NYOJ 664 数字整除
  6. 【转】Python可变长度的函数参数
  7. uni-app微信小程序动态样式设置;微信小程序style行内式无效;微信小程序style行内式编译报错;微信小程序:style设置样式
  8. 偷窥微信原创保护规则,优先体验付费阅读系统功能
  9. 从 Poisson 分布到服务器的访问
  10. 安装centos 6.5
  11. matlab求导程序,「matlab求导」matlab 求导的一个简单程序 - 金橙教程网
  12. 基于最小错误率的贝叶斯决策(matlab实验)
  13. 三种最常用的日志分析软件
  14. 虚拟机Oracle VM VirtualBox 共享文件夹放的文件打不开,找不到指定路径问题
  15. 计算机在学前教育中作用论文,学前教育论文
  16. 深入理解 ZK 中的 “大多数” 机制
  17. EN 12101-8:2011烟雾和热量控制系统防烟挡板—CE认证
  18. VIM 参 考 手 册[转]
  19. Idea自动导包如何设置,教你两步完成!
  20. sendgrid_使用SendGrid处理传入的电子邮件

热门文章

  1. 为Mac OS X添加用Firefox搜索服务
  2. Spring WebFlux 响应式编程学习笔记(一)
  3. 从全栈式解决方案到情感化,揭秘问众智能切入车载语音市场的最佳姿势...
  4. 【TeeChart .NET教程】(七)使用函数
  5. 《结对-贪吃蛇-需求分析》
  6. 《计算机科学概论》—第3章3.3节文本表示法
  7. [C++]宏定义#define A B C
  8. CountDownLacth详解
  9. 老李推荐:第6章6节《MonkeyRunner源码剖析》Monkey原理分析-事件源-事件源概览-命令队列...
  10. MessageQueue Message Looper Handler的解释说明