jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

说明

本文提供的代码仅供参考。

可能有些地方在最新版本的Auto.js上面需要做修改,才能运行。

Auto.js简介

Auto.js是利用安卓系统的“辅助功能”实现类似于按键精灵一样,可以通过代码模拟一系列界面动作的辅助工作。

与“按键精灵”不同的是,它的模拟动作并不是简单的使用在界面定坐标点来实现,而是类似与win一般,找窗口句柄来实现的。

Auto.js使用JavaScript作为脚本语言,目前使用Rhino 1.7.7.2作为脚本引擎,支持ES5与部分ES6特性。

开发文档

Auto.js Pro开发文档优化版

文档尚在完善中,可能有文档描述和代码实际行为有出入的情况。

模板、样式、generator来自Node.js。

为什么要使用Auto.js Pro开发脚本,有什么特点?

吸引我使用Auto.js Pro的原因有很多。最主要的几个原因是:

Auto.js Pro能开发免ROOT的安卓脚本

Auto.js Pro基于节点操作,能开发全分辨率的脚本,自动适配各种安卓机型

Auto.js Pro丰富的UI组件,能自定义各种样式的安卓界面

Auto.js Pro使用的javascript的语法比较优雅,代码可读性强

Auto.js Pro的命令库非常的丰富,接口比较多

Auto.js Pro脚本文件体积比较小。1000行的代码,打包后的apk文件只有3-5M,还没有广告

相关教程

示例代码

// 时间 2019 1 8

// 脚本作用: autojs使用jsoup的demo

// 脚本内容: 爬取科学网 博客的 指定id的好友名字

// 需要导入jsoup.

// jsoupDemo.js

console.show()

runtime.loadJar('/sdcard/jsoup.jar')

importClass("org.jsoup.Jsoup")

importClass("java.io.IOException")

importClass("java.util.HashMap")

importClass("org.jsoup.Jsoup")

importClass("org.jsoup.nodes.Document")

importClass("org.jsoup.nodes.Element")

importClass("org.jsoup.select.Elements")

function Spider(url) {

this.CrawlName = function (url) {

var tmp = new HashMap();

try {

var doc = Jsoup.connect(url)

.header("User-Agent",

"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36")

.get();

var links = doc.select("dt a");

links = links.toArray()

for (let i = 0; i < links.length; i++) {

var link = links[i]

if (link.hasAttr("style")) {

tmp.put(parseInt(link.attr("href").substring(link.attr("href").indexOf("uid=") + 4)), link.attr("title"));

}

}

log(tmp)

return (tmp);

} catch (e) {

log(e)

}

return (null);

}

var data = this.CrawlName(url);

this.getName = function (id) {

if (data != null) {

log('id: %d - name: %s', id, data.get(id));

}

}

}

s = new Spider("http://blog.sciencenet.cn/home.php?mod=space&uid=215715&do=friend&view=me&from=space");

s.getName(71079);

java脚本引擎parseint方法_autojs脚本引擎调用java的jsoup爬取科学网博客的指定id的好友名字...相关推荐

  1. java 多线程爬取网页,利用jsoup爬取百度网盘资源分享连接(多线程)

    突然有一天就想说能不能用某种方法把百度网盘上分享的资源连接抓取下来,于是就动手了.知乎上有人说过最好的方法就是http://pan.baidu.com/wap抓取,一看果然链接后面的uk值是一串数字, ...

  2. java爬虫案例——SpringBoot使用HttpClient、Jsoup爬取京东手机数据

    文章目录 前言 一.准备工作 二.项目文件 1.项目依赖 2.项目配置文件 3.pojo 4.dao接口 5.service接口及其实现类 6.HttpClient封装工具类 7.爬取任务实现 8.启 ...

  3. 【Android NDK 开发】JNI 方法解析 ( C/C++ 调用 Java 方法 | 函数签名 | 调用对象方法 | 调用静态方法 )

    文章目录 I . 调用 Java 方法流程 II . 获取 jclass 对象 ( GetObjectClass ) III . 获取 jclass 对象 ( FindClass ) IV . JNI ...

  4. 本地方法(JNI)——调用 java 方法

    [0]README 1) 本文部分文字描述 转自 core java volume 2 , 旨在理解 本地方法(JNI)--调用 java 方法 的基础知识 : 2) C语言调用java 方法,包括: ...

  5. 爬取彼岸网所有4K美图壁纸--Python脚本

    在360壁纸中发现很多图片需要会员才能使用,emmmmm我这种白嫖怪哪买的起会员,所以自己写了一个Python脚本爬取彼岸网的壁纸. 废话不多说直接上代码: #-*- coding = utf-8 - ...

  6. java+selenium爬取知网数据

    使用selenium工具爬取知网相关数据,思路:根据几个关键词搜索出相关的内容,然后爬取列表中所有论文的访问链接. 注意:直接爬取的链接是不能用的,需要自己拼接一下.具体看代码.新手,代码写的有点乱. ...

  7. 几十行代码实现Java爬虫,结合jsoup爬取网名昵称

    原文链接:点击打开链接 crawler4j是一个开源爬虫框架(https://github.com/yasserg/crawler4j), 我们可以使用它进行爬虫.以爬取 http://www.nib ...

  8. Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索

    Jsoup:用Java也可以爬虫,怎么使用Java进行爬虫,用Java爬取网页数据,使用Jsoup爬取数据,爬虫举例:京东搜索 一.资源 为什么接下来的代码中要使用el.getElementsByTa ...

  9. java爬虫问题二: 使用jsoup爬取数据class选择器中空格多选择怎么解决

    问题描述: 在使用jsoup爬取其他网站数据的时候,发现class是带空格的多选择,如果直接使用doc.getElementsByClass("class的值"),这种方法获取不到 ...

  10. java jsoup爬取动态网页_java通过Jsoup爬取网页(入门教程)

    一,导入依赖 org.jsoup jsoup 1.10.3 org.apache.httpcomponents httpclient 二,编写demo类 注意不要导错包了,是org.jsoup.nod ...

最新文章

  1. 强者愈强!疫情拉大“数据资产”贫富差距,顶级公司数据建设靠什么
  2. 分享周鸿祎的《如何建立一个“铁打的营盘”》
  3. random.next_Java Random next()方法与示例
  4. 简单理解极大似然估计MLE
  5. 也谈C#之Json,从Json字符串到类代码
  6. 使用CSS3改变文本选中的默认颜色
  7. php include的路径问题,php7中include有相对路径无法打开
  8. 哪个服务器比较稳定,云服务器哪个比较稳定
  9. DataTable 去重合并
  10. 升腾威讯怎么恢复集群_Redis系列(四):天天用着Redis集群,主从同步该知道吧?集群工作原理是否需要了解下?...
  11. Ubuntu1804安装ROS(melodic版本)
  12. docker装LibreELEC_瞎弄 篇一:J3455NUC虚拟机安装LibreELEC核显直通HDMI输出
  13. 数据清洗之 数据整理
  14. epoch训练时间不同_epoch、batch size和iterations
  15. sox处理mp3_sox :音频文件转换命令
  16. Catagory添加属性、扩展方法
  17. ACL2020-最新录用论文列表分享
  18. 输出字符矩形--实心、空心
  19. 斯坦福cs224n教程--- 学习笔记1
  20. POJ 2431 Expedition(贪心+优先队列)

热门文章

  1. GitHub和75亿美金
  2. pwnable tw Starbound writeup
  3. [Dubbox异常] Unable to locate Spring NamespaceHandler for XML schema namespace [http://dubbo.apache[
  4. 转基因,请你走出这片净土。!!!食用转基因的人,你们伤不起~有木有,有木有啊~!!!!!!!!!!!!!!!
  5. 软件工程实践 第四周第二次会议讨论
  6. XP突然弹出“automation 服务器不能创建对象”的有效解决方法--win10专业版
  7. 聚沙成塔--爬虫系列(二)(python3基础语法)
  8. Spring中的用到的设计模式
  9. 微信小程序头像怎么改变形状_微信小程序 上传头像的实例详解
  10. laravel Migration与Seeder的用法