jsoup抓取网页报错UnsupportedMimeTypeException
今天在用Jsoup爬虫的时候两次遇到下面错误
Exception in thread "main" org.jsoup.UnsupportedMimeTypeException: Unhandled content type. Must be text/*, application/xml, or application/xhtml+xml. Mimetype=application/json;charset=utf-8, URL=http://qiaoliqiang.cn/Exam/user_login.actionat org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:600)at org.jsoup.helper.HttpConnection$Response.execute(HttpConnection.java:540)at org.jsoup.helper.HttpConnection.execute(HttpConnection.java:227)at cn.qlq.craw.Jsoup.JsoupCookieCraw.login(JsoupCookieCraw.java:51)at cn.qlq.craw.Jsoup.JsoupCookieCraw.main(JsoupCookieCraw.java:24)
第一次:
代码:
Response res = connect.method(Method.POST).execute();// 执行请求
解决办法:
Response res = connect.ignoreContentType(true).method(Method.POST).execute();// 执行请求
第二次:
代码:
String url = "http://qiaoliqiang.cn/Exam/user_login.action";// 直接获取DOM树Document document = Jsoup.connect(url).post();
解决办法:
// 直接获取DOM树Document document = Jsoup.connect(url).ignoreContentType(true).post();
转载于:https://www.cnblogs.com/qlqwjy/p/8878185.html
jsoup抓取网页报错UnsupportedMimeTypeException相关推荐
- 使用WinDbg抓取程序报错的Dump文件
使用WinDbg抓取程序报错的Dump文件,例如抓取IE崩溃的Dump,教程 前几天分享了一个关于如何抓蓝屏Dump的帖子,今天再和大家分享一个使用WinDbg来抓取程序崩溃的Dump.不过还是先来段 ...
- Jsoup抓取网页数据完成一个简易的Android新闻APP
前言:作为一个篮球迷,每天必刷NBA新闻.用了那么多新闻APP,就想自己能不能也做个简易的新闻APP.于是便使用Jsoup抓取了虎扑NBA新闻的数据,完成了一个简易的新闻APP.虽然没什么技术含量,但 ...
- 使用WinDbg抓取程序报错的Dump文件,例如抓取IE崩溃的Dump
前几天分享了一个关于如何抓蓝屏Dump的帖子,今天再和大家分享一个使用WinDbg来抓取程序崩溃的Dump.有了Dump后,我们可以很迅速的解决问题,比如说IE崩溃,QQ崩溃,很多时候我们是一点 ...
- jsoup抓取网页+详细讲解
jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址.HTML 文本内容.它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出 ...
- php正则获取li,用正则表达式抓取网页中的ul 和 li标签中最终的值!
获取你要抓取的页面 const string URL = "http://www.hn3ddf.gov.cn/price/GetList.html?pageno=1"; ...
- 转载自android 开发--抓取网页解析网页内容的若干方法(网络爬虫)(正则表达式)
转载自http://blog.csdn.net/sac761/article/details/48379173 android 开发--抓取网页解析网页内容的若干方法(网络爬虫)(正则表达式) 标签: ...
- php 采集邮箱,采集邮箱的php代码(抓取网页中的邮箱地址)
采集邮箱的php代码(抓取网页中的邮箱地址) 复制代码 代码如下: $url='http://www.jb51.net'; //这个网页里绝对含有邮件地址. $content=file_get_con ...
- 怎么用python抓取网页数据
一个人能力太小,聚沙成塔,抱团取火,分享知识,帮助学习, 有愿意或者有问题一起钻研,新人也好,老手也好,希望在这个寒冬下,尽力生活, 欢迎 一起 qq群,306671879.学习前端 抓取网页需要导入 ...
- 网络爬虫学习1 - 使用 requests.get(url) 抓取网页
网络爬虫MOOC学习打卡 - 第一天 文章目录 网络爬虫MOOC学习打卡 - 第一天 一.使用 requests.get(url) 抓取网页 1.从cmd中打开idle 2.调用requests类 - ...
最新文章
- 3 css 奖品出现弹出动画_【技术】nuxt中引入wow和animate.css 页面随滚动条出现动画...
- 如何把导航条做成sitefactory政府版的样子实现动态读取子栏目显示
- 硬盘分区表知识——详解硬盘MBR(转)
- Python大婶博客汇总
- Java中,一切皆是对象,为何数据类型中还分为:基本类型和对象?
- zigbee 串口不稳定_Zigbee
- 掌握这 25 条小贴士,快速提升数据可视化能力!
- Android点击效果
- 逸管家:别只共享单车,互联网时代还可以共享人才
- 深入理解目标检测与YOLO(从v1到v3)
- android drawable-hdpi 分辨率,android – 设置可用于不同分辨率的drawable文件夹
- 49 html鼠标事件(在线测试)
- 省市县乡村五级行政区域数据2021(国家统计局)
- 抖音自拍特效如何java实现_抖音特效在 Web 端的实现
- java数据结构和算法——前缀表达式(即波兰表达式)、中缀表达式及后缀表达式(即逆波兰表达式)介绍
- 一文了解关于 CryptoPunks 的10个冷知识
- 获取指定日期的月份的第几个星期几是几号
- Excel怎样恢复科学计数法显示的数据
- 使用74LS160设计六进制计数器
- MGN(多粒度网络)模型训练的详细步骤