MinerConfig.java 爬取配置类
MinerConfig.java 爬取配置类
package com.iteye.injavawetrust.miner;import java.util.List;/*** 爬取配置类* @author InJavaWeTrust**/
public class MinerConfig {/*** URL包含关键字*/public List<String> keys;/*** 存储方式 */public StoreType storeType;/*** 爬取页面最大深度*/public int maxDepth;/*** 下载页面线程数*/public int minerHtmlThreadNum;/*** 分析页面线程数*/public int miseringThreadNum;/*** 存储线程数*/public int minserStoreThreadNum;public List<String> getKeys() {return keys;}public void setKeys(List<String> keys) {this.keys = keys;}public StoreType getStoreType() {return storeType;}public void setStoreType(StoreType storeType) {this.storeType = storeType;}public int getMaxDepth() {return maxDepth;}public void setMaxDepth(int maxDepth) {this.maxDepth = maxDepth;}public int getMinerHtmlThreadNum() {return minerHtmlThreadNum;}public void setMinerHtmlThreadNum(int minerHtmlThreadNum) {this.minerHtmlThreadNum = minerHtmlThreadNum;}public int getMiseringThreadNum() {return miseringThreadNum;}public void setMiseringThreadNum(int miseringThreadNum) {this.miseringThreadNum = miseringThreadNum;}public int getMinserStoreThreadNum() {return minserStoreThreadNum;}public void setMinserStoreThreadNum(int minserStoreThreadNum) {this.minserStoreThreadNum = minserStoreThreadNum;}}
返回列表
转载于:https://www.cnblogs.com/muyuge/p/6152088.html
MinerConfig.java 爬取配置类相关推荐
- java爬取论坛信息_Java爬取校内论坛新帖
Java爬取校内论坛新帖 为了保持消息灵通,博主没事会上上校内论坛看看新帖,作为爬虫爱好者,博主萌生了写个爬虫自动下载的想法. 嗯,这次就选Java. 第三方库准备 Jsoup Jsoup是一款比较好 ...
- JAVA爬取淘宝、京东、天猫以及苏宁商品详细数据(一)
JAVA爬取某东.某宝以及某宁商品详细数据(一) 写在最前 反爬策略问题解决 请求头配置 无代理模式 代理模式 某东 JDHTML解析 JD商品解析 天猫 TMHTML解析 苏宁 SNHTML解析 写 ...
- Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索
Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索 一.资源 为什么接下来的代码中要使用el.getElementsByTa ...
- java爬取网页内容 简单例子(2)——附jsoup的select用法详解
[背景] 在上一篇博文 java爬取网页内容 简单例子(1)--使用正则表达式 里面,介绍了如何使用正则表达式去解析网页的内容,虽然该正则表达式比较通用,但繁琐,代码量多,现实中想要想出一条简单的正则 ...
- Java爬取并下载酷狗音乐
本文方法及代码仅供学习,仅供学习. 案例: 下载酷狗TOP500歌曲,代码用到的代码库包含:Jsoup.HttpClient.fastJson等. 正文: 1.分析是否可以获取到TOP500歌单 打开 ...
- Java 爬取微信公众号文章(文字 + 图片)
https://blog.csdn.net/sunnyzyq/article/details/103837521 Maven依赖: <!-- 阿里巴巴 JSON --> <depen ...
- Java爬取并下载酷狗TOP500歌曲
下文方法及代码仅供学习使用,不做他用.示例用到了一些库,包括:jsoup.HttpClient.net.sf.json大家可以自行去下载jar包. 1.分析是否能获得TOP500歌单 首先,打开酷狗首 ...
- java 爬取评论,Java基于WebMagic爬取某豆瓣电影评论的实现
目的 搭建爬虫平台,爬取某豆瓣电影的评论信息. 准备 webmagic是一个开源的Java垂直爬虫框架,目标是简化爬虫的开发流程,让开发者专注于逻辑功能的开发.webmagic的核心非常简单,但是覆盖 ...
- 利用Java爬取基金网站的基金数据,快速筛选优质热门基金
爬取数据源为天天基金网的页面基金数据 利用java爬取基金数据并简单筛选后的效果图 创建java maven项目,推荐用spring boot maven需要引入的jar包依赖 <!--lomb ...
最新文章
- 为什么我在gpu上训练模型但是gpu利用率为0且运行速度还是很慢?
- python打开文件_python如何学习
- Spartan-6的MCB模块、GTP模块、PCIe端点模块
- java怎么防止表单重复提交_如何防止表单重复提交
- NYOJ 664 数字整除
- 【转】Python可变长度的函数参数
- uni-app微信小程序动态样式设置;微信小程序style行内式无效;微信小程序style行内式编译报错;微信小程序:style设置样式
- 偷窥微信原创保护规则,优先体验付费阅读系统功能
- 从 Poisson 分布到服务器的访问
- 安装centos 6.5
- matlab求导程序,「matlab求导」matlab 求导的一个简单程序 - 金橙教程网
- 基于最小错误率的贝叶斯决策(matlab实验)
- 三种最常用的日志分析软件
- 虚拟机Oracle VM VirtualBox 共享文件夹放的文件打不开,找不到指定路径问题
- 计算机在学前教育中作用论文,学前教育论文
- 深入理解 ZK 中的 “大多数” 机制
- EN 12101-8:2011烟雾和热量控制系统防烟挡板—CE认证
- VIM 参 考 手 册[转]
- Idea自动导包如何设置,教你两步完成!
- sendgrid_使用SendGrid处理传入的电子邮件
热门文章
- 为Mac OS X添加用Firefox搜索服务
- Spring WebFlux 响应式编程学习笔记(一)
- 从全栈式解决方案到情感化,揭秘问众智能切入车载语音市场的最佳姿势...
- 【TeeChart .NET教程】(七)使用函数
- 《结对-贪吃蛇-需求分析》
- 《计算机科学概论》—第3章3.3节文本表示法
- [C++]宏定义#define A B C
- CountDownLacth详解
- 老李推荐:第6章6节《MonkeyRunner源码剖析》Monkey原理分析-事件源-事件源概览-命令队列...
- MessageQueue Message Looper Handler的解释说明