HTMLUnit爬虫模拟登录Linkedin
public static void loginLinkedin(String URL) throws IOException,SQLException {
try {
WebClient webClient =new WebClient();//创建WebClient
webClient.getOptions().setJavaScriptEnabled(false);
webClient.getOptions().setCssEnabled(false);
// 获取页面
HtmlPage page = webClient.getPage("https://www.linkedin.com/uas/login");// 打开linkedin
// 获得name为"session_key"的html元素
HtmlElement usernameEle =page.getElementByName("session_key");
// 获得id为"session_password"的html元素
HtmlElement passwordEle = (HtmlElement)page.getElementById
("session_password-login");
usernameEle.focus();// 设置输入焦点
usernameEle.type("z_hao1975@hotmail.com");// 填写值
passwordEle.focus();// 设置输入焦点
passwordEle.type("XXXXX");// 填写值
// 获得name为"submit"的元素
HtmlElement submitEle =page.getElementByName("signin");
// 点击“登陆”
page = submitEle.click();
String result = page.asXml();// 获得click()后的html页面(包括标签)
if (result.contains("Sign Out")){
System.out.println("登陆成功");
HtmlPage page2 =webClient.getPage(URL);
String pageXml =page2.asXml();
Document doc2 = Jsoup.parse(pageXml);
Element background_text =doc2.getElementById("background");
Elements name =doc2.getElementsByClass("full-name");
if (background_text !=null) {
//System.out.println(background_text.toString());
// iMatch method to check if including sensitive content
booleaniMatch = iContentMatch(background_text.toString());
if (iMatch) {
// String res = downloadFromUrl(URL, getDir());
writefile(filePath("linkedin"),name.toString()+"<br>"+background_text.toString(),false);
//writefile(filePath("linkedin"),result, false);
Sub_ID++;
}
// write into database
/*
* str_SQL =
* " INSERT INTO waverly.tsearch(ID,cliuid_2,unedname,Sub_ID,SearchResult) VALUES (88,"
* + Integer.valueOf(cliuid_2) + ","+ "\"" +unedname +
* "\"" + "," + Sub_ID+ "," + "\"" +
*background_text.toString().replace("\"","\\\"") +"\"" +
* ")";
*
* try {Class.forName("com.mysql.jdbc.Driver");
* java.sql.Connectionconn =DriverManager.getConnection(
* "jdbc:mysql://localhost:3306/waverly?user=root&password=197544"
* ); java.sql.Statementstmt =conn.createStatement();
* stmt.executeUpdate(str_SQL); Sub_ID++; }catch
* (SQLException e) { e.printStackTrace(); }catch
* (ClassNotFoundException e) { //TODO Auto-generated catch
* block e.printStackTrace(); }
*/
// 创建目录
// str_m=str_trim.substring(0,
// 4-cliuid_2.length())+cliuid_2;
// writefile("c:/1.txt",background_text.toString(), false);
} else {
System.out.println("登陆失败");
}
}
} catch (FailingHttpStatusCodeExceptione) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (Exceptione) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
HTMLUnit爬虫模拟登录Linkedin相关推荐
- 【Python技能树共建】Python爬虫模拟登录
Python 爬虫模拟登录 Python 爬虫模拟登录是使用脚本实现自动登录,部分站点需要逆向加密逻辑,更多的站点会采用验证码进行鉴权验证. 本文为大家带来最简单的登录,其核心用到的是 request ...
- python爬虫 模拟登录人人网过程解析
这篇文章主要介绍了python爬虫 模拟登录人人网过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 equests 提供了一个叫做sessio ...
- python登录教务系统_强智科技教务系统python爬虫模拟登录分析(湖南)
强智科技教务系统python爬虫模拟登录分析(湖南) 本文章仅用作于学习 前提:最近期末到来,想第一时间看到新出成绩的,于是就有了爬取学校教务系统自己的成绩并通过Qmsg酱推送到自己QQ上的想法,目前 ...
- Github项目分享——爬虫模拟登录各大平台
爬虫模拟登录各大平台 项目地址 https://github.com/Kr1s77/awesome-python-login-model 项目介绍
- python–爬虫–模拟登录全面介绍和简例–以抓取雅卓app为例
转载请注明出处:python–爬虫–模拟登录全面介绍和简例–以抓取雅卓app为例 我们在前面的文章中已经学习了如果使用python进行数据抓取. 但我们常常会遇到一种场景,就是想要获取的页面内容或者接 ...
- 新浪微博爬虫模拟登录(爬手机版)
新浪微博爬虫模拟登录 最近一直在想做新浪微博爬取,开始的时候做了一个PC版的爬取,但是发现提取内容真心难过所以在这里爬了手机版的话不多说,show you my code 这个可以提取固定人微博内容, ...
- python爬虫登陆教程_(python模拟登陆教程)python爬虫模拟登录是什么意思
python爬虫模拟登录是什么意思 网站需要登录后才能所需要的信息,此时可以设计爬虫进拟登录,原理是利用浏cookie. 一.浏览器访问服务器的过程: (1)浏览器(客户端)向Web服务器发出一个HT ...
- Java爬虫模拟登录——不给我毛概二的H某大学
你的账号访问太频繁,请一分钟之后再试! 从大一开始 就用脚本在刷课 在专业课踢的只剩下一门C#的情况下 活活刷到一周的课 大二开始教务系统多了一个非常**的操作 退课池 and 访问频繁缓冲 难道,我 ...
- 枯燥的寒假生活(一) python爬虫模拟登录whu老教务系统获取期末考试成绩(已失效 , 老教务系统增加了新的反爬, 老教务系统已停用)
python模拟登录老教务系统(2021.6.24更新) 一.写在前面 之前用爬虫爬取的都是静态网页html中的内容,但是大多数时候需要动态处理网页爬取数据.因为学校出成绩太慢了,每次都自己打开浏览器 ...
- python淘宝cookies抢购_python实现简单爬虫模拟登录淘宝(cookie简介)
试验了一个晚上,python的小爬虫还是挺可爱的,简单几行就可以抓取网页了.如果你和我一样是新手,你可以先去http://blog.csdn.net/column/details/why-bug.ht ...
最新文章
- 软件测试用python一般用来做什么-Python用来做Web开发的优势有哪些
- BJFU fudq的等式
- 安装工程图形算量离我们还多远
- android 手写签批_Android手写签批功能实现(适配Android6
- 【elasticsearch】FileAlreadyExistsException:/home/elasticsearch-6.8.0/config/elasticsearch.keysto
- 我大意了,刚一放出来就上了牛客网头条了
- 系统架构设计-计算机组成与体系结构
- vue.js视频教程,vue.js视频教程下载
- 如何免费将网页内容转成Word文档
- 华为交换机默认vlan都是通的吗_最全的华为交换机vlan配置教程
- 墨刀实现区域内滚动效果
- 免费个人商城系统源码推荐
- c语言的简单的分数求和
- 科普文章-另一个视角解读计算机编码(修订版)
- 云栖科技评论第25期:德州扑克人机大战落幕 人工智能赢了176万美元
- R语言学习手记 (1)
- 程序员养花几个实用小技巧
- ContentTypes
- 建站必备知识:域名注册和域名解析流程有哪些?
- 微软算法面试题(2021最新)
热门文章
- live2d动态壁纸android,Live2DViewerEX动态壁纸
- 利用PYTHON代码,自动玩王者荣耀,再也不担心女朋友打电话
- 远程控制电脑的实现方法
- Java Web 开发书籍
- 深度补全(一)-论文阅读-翻译(Depth Map Prediction from a Single Image using a Multi-Scale Deep Network)
- 如何使用虚拟串口软件进行串口调试
- 04 Linux软件安装与卸载命令
- ToDesk 远程软件推荐测评
- acc 蓝牙_蓝牙中的三种音频编码:Apt-X、SBC、AAC,请问分别有什么区别?
- 视频教程-Matlab小白入门必备教程-Matlab