从数据库中读出文档地址,并把地址中的文件装入数据库

这段时间还在研究这个JSOUP,对于一个缺乏网络基础的我来说,确实还得从头学起。

要掌握JSOUP,首先要对HTML和网页知识有清晰的了解,特别是DOM和网页的标签、元素、属性等概念以及应用。

JSOUP有两个功能,一个是装入document,一个是对document进行select,过滤。装载有几种不同形式,比如url、文本;select可以对不同对象进行。

select就是过滤各种对象,并捕捉,比如捕捉标签、属性等等,并且可以连用。

其实,jsoup的主要功能就是这三个:

  1. 从一个URL,文件或字符串中解析HTML;
  2. 使用DOM或CSS选择器来查找、取出数据;
  3. 可操作HTML元素、属性、文本;

学习就从这三方面来学习,不过,很多细节需要去掌握。比如attr(abs : href),能够带出绝对地址,很牛的东西。慢慢嚼嚼,味道会很好。

学习Jsoup(三)相关推荐

  1. 强化学习(三) - Gym库介绍和使用,Markov决策程序实例,动态规划决策实例

    强化学习(三) - Gym库介绍和使用,Markov决策程序实例,动态规划决策实例 1. 引言 在这个部分补充之前马尔科夫决策和动态规划部分的代码.在以后的内容我会把相关代码都附到相关内容的后面.本部 ...

  2. Java IO流学习总结三:缓冲流-BufferedInputStream、BufferedOutputStream

    Java IO流学习总结三:缓冲流-BufferedInputStream.BufferedOutputStream 转载请标明出处:http://blog.csdn.net/zhaoyanjun6/ ...

  3. 学习java三个技巧要知道!

    java一直是IT行业发展前景非常不错的一门编程语言,学起来是相对有点困难的,尤其是零基础学员,要想学好java技术,一定要知道这三个技巧,来看看下面的详细介绍就知道了. 学习java三个技巧要知道! ...

  4. J2EE学习笔记三:EJB基础概念和知识 收藏

    J2EE学习笔记三:EJB基础概念和知识 收藏 EJB正是J2EE的旗舰技术,因此俺直接跳到这一章来了,前面的几章都是讲Servlet和JSP以及JDBC的,俺都懂一些.那么EJB和通常我们所说的Ja ...

  5. 统计学习的三个招式:模型、策略和算法

    统计学习的三个招式:模型.策略和算法 https://mp.weixin.qq.com/s/12yhAZ79i_ENAdtyOX63lQ 李航老师在统计学习方法中讲到:方法=模型+策略+算法 可以说模 ...

  6. 数据库MYSQL学习系列三

    数据库MYSQL学习系列三 三.MYSQL事务与存储引擎 3.1-数据库事务 什么是事务 一系列有序的数据库操作: o要么全部成功 o要么全部回退到操作前的状态 o中间状态对其他连接不可见 事务的 ...

  7. 【转载】Wireshark基本介绍和学习TCP三次握手

    Wireshark基本介绍和学习TCP三次握手 转载自:http://www.cnblogs.com/TankXiao/archive/2012/10/10/2711777.html 之前写过一篇博客 ...

  8. tensorflow学习笔记(三十二):conv2d_transpose (解卷积)

    tensorflow学习笔记(三十二):conv2d_transpose ("解卷积") deconv解卷积,实际是叫做conv_transpose, conv_transpose ...

  9. ROS与Arduino学习(三)订阅与发布

    ROS与Arduino学习(三)订阅与发布 Tutorial Level:HelloWorld Next Tutorial:用ROS的Cmake编译程序 本节介绍如何在arduino中发布与订阅消息. ...

  10. 【机器学习】SVM学习(三):线性分类器的求解

    [机器学习]SVM学习(三):线性分类器的求解 2016-10-10 19:56 239人阅读 评论(0) 收藏 举报 本文章已收录于:  机器学习知识库  分类: 机器学习(37)  目录(?)[+ ...

最新文章

  1. SQL查询语句 select 详解
  2. oracle 11查询sid,oracle 11g 更改sid和dbname
  3. WordCount代码详解
  4. ansible相关说明
  5. maven 打包jar lib
  6. 系统架构设计师视频教程免费下载
  7. InstallShield For .Net制作.Net项目安装包之完整代码
  8. java 控制jsp_JSP学习之Java Web中的安全控制实例详解
  9. Flutter的滚动以及sliver约束
  10. 洛谷P1321题题解(Java语言描述)
  11. 数据可视化组件Grafana详细解读--Debian/Ubuntu上的安装
  12. FPGA _Verilog HDL_十六进制7段码显示译码器设计实验
  13. Android ListView
  14. html代码表白_作为一个程序员,表白都要玩出花样
  15. 一分钟理解python里面的functools.partial
  16. 张俊芳电机学18章计算题以及答案
  17. numpy中的array函数
  18. 通过Bottledwater同步PostgreSQL中的数据变化到Kafka消息队列
  19. org.apache.felix.http.jetty %bundles.pluginTitle: Cannot start (org.osgi.framework.BundleException:
  20. 一个人一个微博、一个App一个故事:通过微博草根账号做英语学习App的“爱卡微口语”获晨脉创投天使投资

热门文章

  1. angular2 学习二 directives - 使用组件
  2. 获取文件绝对路径最后的文件夹名称
  3. Android开源库--Gson谷歌官方json解析库
  4. GridView 控件编程的事件
  5. Python基础函数学习笔记(二)
  6. 美赛整理之Matlab读取全球海洋温度数据并显示干货
  7. 配置Typescript+Node环境
  8. 永恒python怎么用_毫无基础的人如何入门 Python ?Python入门教程拿走不谢啦!
  9. linux7.4 root密码,[RHEL 7.4] 忘记root密码,普通用户又没有sudo权限,怎么办?
  10. Hue中Sqoop导数报错Could not load db driver class: com.mysql.jdbc.Driver