用httpclient解析https网页,基本代码测试通过。

import javax.net.ssl.SSLContext;  import javax.net.ssl.TrustManager;
import javax.net.ssl.X509TrustManager;import java.io.IOException;
import java.security.NoSuchAlgorithmException;
import java.security.cert.CertificateException;
import java.security.cert.X509Certificate;
import org.apache.http.client.ClientProtocolException;
import org.apache.http.client.HttpClient;
import org.apache.http.client.ResponseHandler;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.conn.ClientConnectionManager;  import org.apache.http.conn.scheme.Scheme;
import org.apache.http.conn.scheme.SchemeRegistry;
import org.apache.http.conn.scheme.SchemeSocketFactory;
import org.apache.http.conn.ssl.SSLSocketFactory;
import org.apache.http.impl.client.BasicResponseHandler;
import org.apache.http.impl.client.ClientParamsStack;
import org.apache.http.impl.client.DefaultHttpClient;
import org.apache.http.params.DefaultedHttpParams;
import org.apache.http.params.HttpParams;  public class HttpClientTest {  public static void main(String args[]) {  try {  HttpClient httpclient = new DefaultHttpClient();  //Secure Protocol implementation.  SSLContext ctx = SSLContext.getInstance("SSL");  //Implementation of a trust manager for X509 certificates  X509TrustManager tm = new X509TrustManager() {  public void checkClientTrusted(X509Certificate[] xcs,  String string) throws CertificateException {  }  public void checkServerTrusted(X509Certificate[] xcs,  String string) throws CertificateException {  }  public X509Certificate[] getAcceptedIssuers() {  return null;  }  };  ctx.init(null, new TrustManager[] { tm }, null);  SSLSocketFactory ssf = new SSLSocketFactory(ctx);  ClientConnectionManager ccm = httpclient.getConnectionManager();  //register https protocol in httpclient's scheme registry  SchemeRegistry sr = ccm.getSchemeRegistry();  sr.register(new Scheme("https", 443, ssf));  HttpGet httpget = new HttpGet("https://www.icbc-axa.com");  HttpParams params = httpclient.getParams();  params.setParameter("param1", "paramValue1");  httpget.setParams(params);  System.out.println("REQUEST:" + httpget.getURI());  ResponseHandler responseHandler = new BasicResponseHandler();  String responseBody;  responseBody = httpclient.execute(httpget, responseHandler);  System.out.println(responseBody);  // Create a response handler  } catch (NoSuchAlgorithmException e) {  // TODO Auto-generated catch block  e.printStackTrace();  } catch (ClientProtocolException e) {  // TODO Auto-generated catch block  e.printStackTrace();  } catch (IOException e) {  // TODO Auto-generated catch block  e.printStackTrace();  } catch (Exception ex) {  ex.printStackTrace();  }  }
}  

httpclient解析https网页相关推荐

  1. 关于Jsoup解析https网页的问题

    针对Jsoup解析https网页,网上的一段源码执行后并不能实现成功访问. import java.net.MalformedURLException; import java.net.URL; im ...

  2. 使用commons httpclient请求https协议的webservice

    使commons httpclient支持https协议类,是commons httpclient import java.io.IOException; import java.net.InetAd ...

  3. Python之HTML的解析(网页抓取一)

    http://blog.csdn.net/my2010sam/article/details/14526223 --------------------- 对html的解析是网页抓取的基础,分析抓取的 ...

  4. python动态页面元素爬取_Python开发爬虫之动态网页抓取篇:爬取博客评论数据——通过浏览器审查元素解析真实网页地址...

    由于主流网站都使用JavaScript展示网页内容,和前面简单抓取静态网页不同的是,在使用JavaScript时,很多内容并不会出现在HTML源代码中,而是在HTML源码位置放上一段JavaScrip ...

  5. Python开发爬虫之动态网页抓取篇:爬取博客评论数据——通过浏览器审查元素解析真实网页地址...

    由于主流网站都使用JavaScript展示网页内容,和前面简单抓取静态网页不同的是,在使用JavaScript时,很多内容并不会出现在HTML源代码中,而是在HTML源码位置放上一段JavaScrip ...

  6. HttpClient解析服务器返回的response出现乱码

    引用处: [问题解决]HttpClient解析服务器返回的response出现乱码 问题场景 最近在用httpClient做网络爬虫的时候,遇到了一个不大不小的问题,当使用HttpGet向指定网址发送 ...

  7. 使用Eclipse+httpClient+Jsoup读取网页数据-初级

    本人最近几天学习使用HttpClient包读取网页上的数据,运行博客http://ducaijun.iteye.com/blog/1335453上的例子: 1.首先打开Eclipse,File-> ...

  8. HtmlUnit解析动态网页并采集网页列表到Excel

    HtmlUnit可以解析动态网页,本文这里选取了一个网址(页面需js/ajax动态加载),模拟浏览器操作页面各元素,包括点击获取列表值,主要是掌握了HtmlUnit解析页面元素的主要用法,同时使用PO ...

  9. Python爬虫项目,获取所有网站上的新闻,并保存到数据库中,解析html网页等(未完待续)

    1.需求说明 需求: 爬取虎嗅网站的所有新闻,并保存到数据库中. http://www.huxiu.com 技术: 1.爬虫 获取服务器的资源(urllib) 解析html网页(BeautifulSo ...

最新文章

  1. es6箭头函数(=)与展开特性运算符(...)的使用
  2. 初学者编写python用什么软件好_初学者编写python用什么软件
  3. CLR 4.0 有哪些新东西? -- 类型等价
  4. 虚幻引擎发布4.8版,支持VR虚拟设备
  5. 怎么查看和获取SQL Server实例名
  6. 计算机录取高考生过程,解密高考录取过程:人机结合 打造“阳光高招”
  7. python设置一个初始为0的计数器_python中统计计数的几种方法
  8. OkHttp3介绍(1)
  9. php短链接api,PHP通过调用新浪API生成t.cn格式短网址链接的方法详解
  10. 网吧服务器常用设置维护工具,某某网吧专用维护工具
  11. java sniffer_用Java来实现的Sniffer
  12. uhttpd php安装u盘,如何使用u盘安装linux系统
  13. 微信小程序css篇----字体(Font)
  14. 微型计算机机安装硬盘教程,装机DIY之硬盘安装方法 不同硬盘安装方法图解教程...
  15. Numa,我的CS学习之路
  16. Bearer ${Token},放置在HTTP头中发送
  17. DAVINCI DM3730开发攻略——开发环境篇
  18. ADAMS三维路面重构
  19. pytorch load state dict_pytorch训练trick
  20. Microsoft SQL Server 如何隐藏客户姓名、手机号或者身份证号中的部分信息

热门文章

  1. Java基础:成员变量的继承与覆盖
  2. mvc html.hidden,MVC Html.HiddenFor在一个循环传递模型回控制器
  3. c语言链表把多少分以上打出来,大神帮我看一下怎么输入输出一个链表,我输入了但是没输出啊...
  4. a1708硬盘转接口_2015年A1502 Macbook Pro更换硬盘
  5. 如何将qmainwidget 客户区坐标_滋补品行业营销感悟之:如何将同行变成客户?
  6. Java虚拟机详解(八)------虚拟机监控和分析工具(2)——可视化
  7. 洛谷P1939 【模板】矩阵加速(数列)
  8. 浏览器与服务器通信技术——Ajax详解
  9. Struts2学习第七课 ActionSupport
  10. git学习小结(未完待续)