前言

很早之前用别的语言写过一次微博登陆,现在改成java版,主要是为了验证jsoup的强大,一款完全可胜任http请求和html解析的工具。抓包,抽取js的方法这里就不在赘述。

工具

  • jsoup-1.11.2(使用最新)
  • 打码账号及官方提供的java类(市面上很多,这里用若快)

开始

  1. 首先是分析登录过程,常登陆的没有验证码,新的会有验证码,保险起见这里都采用有验证码的方式登录。
  2. Base64编码用户名后,get请求获取servertime,nonce,pubkey,pcid,及返回的cookie

    //Base64编码用户名
    su = new BASE64Encoder().encode(usename.getBytes());
    String url = "http://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSOController.preloginCallBack&su=" + su + "&rsakt=mod&checkpin=1&client=ssologin.js(v1.4.18)&_=" +
    getTimestamp();
    Connection.Response execute = Jsoup.connect(url).ignoreContentType(true).execute();
    //获取返回数据
    String body = execute.body();
    //获取返回cookie
    Map<String, String> photocookie = execute.cookies();
    JSONObject jsonObject = JSONObject.parseObject(StringUtils.substringBetween(body, "(", ")"));
    servertime = jsonObject.getString("servertime");
    nonce = jsonObject.getString("nonce");
    pubkey = jsonObject.getString("pubkey");
    pcid = jsonObject.getString("pcid");
  3. 带着返回的cookie及pcid,get请求获取验证码

    url = "http://login.sina.com.cn/cgi/pin.php?r=54474015&s=0&p=" + pcid;
    byte[] bytes = Jsoup.connect(url).ignoreContentType(true).cookies(photocookie).execute().bodyAsBytes();
  4. 调用打码平台的类实现打码,返回结果

    public static String createByPost(String username, String password, String typeid, String timeout, String softid, String softkey,byte[] byteArr) {
    String result = "";
    String param = String
    .format(
    "username=%s&password=%s&typeid=%s&timeout=%s&softid=%s&softkey=%s",
    username, password, typeid, timeout, softid, softkey);
    try {
    result = RuoKuai.httpPostImage("http://api.ruokuai.com/create.xml", param, byteArr);
    // jsoup去解析xml (略坑,加了好多参数进去)
    result = Jsoup.parse(result).select("body > root > result").text();
    } catch(Exception e) {
    result = "未知问题";
    }
    return result;
    }
  5. 调用js,对密码动态加密,返回参数sp

    private boolean encodePwd() {
    ScriptEngineManager sem = new ScriptEngineManager();
    ScriptEngine se = sem.getEngineByName("javascript");
    try {
    // FileReader fr = new FileReader("");
    se.eval(LOGIN_JS);
    Invocable invocableEngine = (Invocable) se;
    sp = (String) invocableEngine.invokeFunction("getPW", password, servertime, nonce, pubkey);
    return true;
    } catch (ScriptException e) {
    } catch (NoSuchMethodException e) {
    }
    return false;
    }
  6. 带着参数pcid,code,sp,su,servertime,nonce,sp及cookie,post请求返回cookies及下一个url,此时可从返回的body中判断登录成功与否

        //retcode=101 账号密码错误//retcode=80 请输入正确的密码//retcode=4049 输入验证码//retcode=2070 验证码错误url = "http://login.sina.com.cn/sso/login.php?client=ssologin.js(v1.4.18)";String post = "entry=weibo&gateway=1&from=&savestate=7&useticket=1&pagerefer=http%3A%2F%2Fpassport.weibo" +".com%2Fvisitor%2Fvisitor%3Fentry%3Dminiblog%26a%3Denter%26url%3Dhttp%253A%252F%252Fweibo.com%252F%26domain%3D.weibo" +".com%26ua%3Dphp-sso_sdk_client-0.6.14%26_rand%3D1441434306.495&pcid=" + pcid + "&door=" + code + "&vsnf=1&su=" + su + "&service=miniblog&servertime=" + servertime + "&nonce=" + nonce+ "&pwencode=rsa2&rsakv=1330428213&sp=" + sp + "&sr=1366*768&encoding=UTF-8&url=http%3A%2F%2Fweibo.com%2Fajaxlogin.php%3Fframelogin%3D1%26callback%3Dparent.sinaSSOController.feedBackUrlCallBack&returntype=META";Connection.Response execute1 = Jsoup.connect(url).method(Connection.Method.POST).requestBody(post).cookies(photocookie).ignoreContentType(true).execute().charset("GBK");String body1 = execute1.body();Map<String, String> cookies = execute1.cookies();System.out.println(body1);System.out.println(body1.indexOf("正在登录") != -1 ? "登录成功" : "登录失败");url = StringUtils.substringBetween(body1, "location.replace('", "'");
    
  7. 带着上次返回的cookie,get请求(禁止重定向)获取最终的cookie

    Connection.Response execute2 = Jsoup.connect(url).cookies(cookies).followRedirects(false).ignoreContentType(true).execute();
    Map<String, String> cookies1 = execute2.cookies();
    //从返回协议头中获取location,重定向地址,一般是固定
    Map<String, String> headers = execute2.headers();

结束

获取到cookie,基本之后的操作都可以,那就简单的发条微博,发微博其实只带post数据和cookie就能提交,协议头完全可以不带,偏偏jsoup默认带个UA,结果要多带个refrere头才可以。
1. 通过步骤7,获取的重定向地址,get请求获取refrere参数uniqueid

                        url = "http://weibo.com/ajaxlogin.php?framelogin=1&callback=parent.sinaSSOController.feedBackUrlCallBack&sudaref=login.sina.com.cn";String body2 = Jsoup.connect(url).cookies(cookies1).ignoreContentType(true).execute().body();String uid = StringUtils.substringBetween(body2, "uniqueid\":\"", "\",\"userid");String referer = "https://weibo.com/u/" + uid + "/home";
  1. 带着cookie,及协议头referer,post请求,发一条微博吧
        url = "https://weibo.com/aj/mblog/add?ajwvr=6&__rnd=" + getTimestamp();post = "location=v6_content_home&appkey=&style_type=1&pic_id=&text=" + text + "&pdetail=&rank=0&rankid=&module=stissue&pub_source=main_&pub_type=dialog&_t=0";Connection.Response execute3 = Jsoup.connect(url).method(Connection.Method.POST).requestBody(post).cookies(cookies1).referrer(referer).ignoreContentType(true).execute().charset("GBK");System.out.println(execute3.body());

jsoup实现微博登陆及发微博(带验证码)相关推荐

  1. php curl发布微博,PHP采用curl模仿用户登陆新浪微博发微博的方法

    本文实例讲述了PHP采用curl模仿用户登陆新浪微博发微博的方法.分享给大家供大家参考.具体实现方法如下: 现在用php做模仿用户登录我们都会使用到PHP curl函数了,因为只有它才可以实现像用户一 ...

  2. 微博Python SDK 发微博

    微博API接口List: https://open.weibo.com/wiki/%E5%BE%AE%E5%8D%9AAPI 发微博所用接口: https://open.weibo.com/wiki/ ...

  3. python微博_Python自动化发微博

    现在很多人都在玩微博,不少资源博主都靠发资源获得大量粉丝.我自己也尝试过几次,但是我还是太懒,不想每天一条一条得去发,于是就寻思着怎么用强大的Python自动发微博.研究了两个下午,总算是做出来了,可 ...

  4. 爬取微博好友所发微博制作词云

    打开一个关注者的微博页面,打开开发者工具,选择图中两个地方 刷新页面,向下滚动,中途会出现正在加载,直到最后会出现下一页, 这时看开发者工具,这时真正请求的URL才出现 然后找到Cookies,复制修 ...

  5. python发微博_Python自动化发微博(使用原生API)

    虽然有第三方的Python库,但也只是对request请求作简单的封装.所以以下将不使用第三方库. 创建应用 要使用微博的API,需先要有个应用.随便哪种应用都行,注册应用的主要目的是要获得App K ...

  6. pythonurllib新浪微博_Python代码登录新浪微博并自动发微博

    前言 对于很少玩微博@張行之_的我来说,微博内容少的可怜.所以本人就想:能不能写个成功程序来帮我发微博.这个程序要满足以下要求: 自动化,自动登录微博,自动发微博. 微博内容要有意义,不能是随机生成的 ...

  7. Python代码登录新浪微博并自动发微博

    前言 对于很少玩微博@張行之_的我来说,微博内容少的可怜.所以本人就想:能不能写个成功程序来帮我发微博.这个程序要满足以下要求: 自动化,自动登录微博,自动发微博. 微博内容要有意义,不能是随机生成的 ...

  8. python怎么登录微博并发微博_Python代码登录新浪微博并自动发微博

    前言 对于很少玩微博@張行之_的我来说,微博内容少的可怜.所以本人就想:能不能写个成功程序来帮我发微博.这个程序要满足以下要求: 自动化,自动登录微博,自动发微博. 微博内容要有意义,不能是随机生成的 ...

  9. 利用新浪API实现数据的抓取\微博数据爬取\微博爬虫 1

    PS:(本人长期出售超大量微博数据.旅游网站评论数据,并提供各种指定数据爬取服务,Message to YuboonaZhang@Yahoo.com.由于微博接口更新后限制增大,这个代码已经不能用来爬 ...

最新文章

  1. 老大,你为什么在代码中要求我们使用LocalDateTime而不是Date?
  2. CMenu类的使用方法
  3. redis cluster 设置密码做集群时gem下client.rb文件修改
  4. 门锁了开不了_智能门锁不会突然没电 门锁突然没电怎么办?
  5. Android截屏方法总结
  6. SQL Server CLR 集成简介
  7. 四种类型转换 cast
  8. python环境配置opencv_Python 3.5.1和Opencv 3.1的环境配置
  9. 释放tcp连接的命令是_最实用的6个网络命令,网络故障不求人
  10. 使用apache的poi生成本地Excel文件(二)
  11. 使用Jsoup 抓取页面的数据
  12. Appium+python自动化(十一)- 元素定位秘籍助你打通任督二脉 - 下卷(超详解)...
  13. VMware Workstation 12 安装小于4GB的GHOST 64位win7系统
  14. 记录-vant-DatetimePicker时间选择器,时间选择滚动区域消失。[class*=van-hairline]
  15. iOS越狱之Mac登录iPhone
  16. Excel--单元格格式设置
  17. Mysql主从同步报错解决:Fatal error: The slave I/O thread stops because master and slave have equal..
  18. 【数据字典】第三篇 利用PowDesigner自动生成数据字典
  19. 储存器的区别之——RAM、ROM、FLASH
  20. 分治算法求n个元素的最大值和最小值

热门文章

  1. mac 上的 redis 安装与使用
  2. Unity基础笔记(5)—— Unity渲染基础与动画系统
  3. 腾讯云:企业版实名认证步骤
  4. 对Python中文分词模块结巴分词算法过程的理解和分析
  5. 即使再小的船也能远航
  6. SQL中常用的字符串CHARINDEX函数和PATINDEX函数详解!
  7. vue中使用embed标签PDF预览
  8. HTTP Keep-Alive是什么?如何工作?
  9. 基于JSP的网络硬盘
  10. excel批量删除空白行(excel下面无限多的空行如何删除)