实习快两星期了,上的第一堂课就是学会观察,观察应该不仅仅局限于外面的事物,还应该有身边同学的起起伏伏。总结下这周收获更多的是态度:

  1.态度上需要的是为什么而不是得到什么,如果你是为了完成什么和做什么,你会觉得遇到的所有困难是拦路虎,于是热情退却,而如果你觉得你遇到的所有困难都是走向成功的阶梯,恭喜你,你正在进步。

  2.团队的力量往往比个人强大,一个人也能完成目标,但你始终走在自己的思维里,而一名不断进步的程序员需要不断的吸收他人的思维,接受新知识。

  3.总结归纳更重要,这两天翻写了以前写过了代码,会发现自己以前的代码不堪入目,自己都觉得难以借鉴,所以复杂的事情简单做,简单的事情重复做,重复的事情认真做。

闲话就扯到这里,讲讲今天的重点,实习小实践:博客园博客统计。需求:不限语言,不限平台,根据姓名,博客地址,统计如下信息

谈谈思路:

  第一步:第一反应当然是根据http://www.cnblogs.com/Sir-Lin/去寻找网页中的文本,这时你会发现很多网页上显示的内容,在源代码里并不能找到,这是因为这些调皮的元素来自于JavaScipt返回的数据,但别以为这样就能逃出我们的火眼金睛,借助工具HttpAnalyzerStdV7就能轻松找到这些JS请求的网址.例如我们要去寻找每篇文章的推荐数反对数。打开网页http://www.cnblogs.com/Sir-Lin/p/FirstStep.html,并运行HttpAnalyzerStdV7.

这里就获取到了所以该网页的数据包括JavaScript请求的数据

然后得到js访问的url也就是我们需要的url

再根据Jsoup来获取网页的源代码和我们需要的数据。简单介绍几个常用的方法

 1 //从一个URL加载一个Document
 2 Document doc = Jsoup.connect("http://example.com/").get();
 3 //这个时候就类似javascript获取element
 4 Element content = doc.getElementById("content");
 5
 6 Elements links = content.getElementsByTag("a");
 7
 8 for (Element link : links) {
 9   String linkHref = link.attr("href");
10   String linkText = link.text();
11 }
12
13 Elements links = doc.select("a[href]"); //带有href属性的a元素
14
15 Element masthead = doc.select("div.masthead").first();
16   //class等于masthead的div标签
17
18 Elements resultLinks = doc.select("h3.r > a"); //在h3元素之后的a元素

具体关于Jsoup的介绍和学习可以参考下面的内容http://www.open-open.com/jsoup/。

转载于:https://www.cnblogs.com/Sir-Lin/p/4671576.html

成长笔记之博客统计第一篇相关推荐

  1. 博客专栏第一篇文章——我眼里的DBA

    在专职DBA工作一年过一个月以后,开通了CSDN的博客专栏,在第一篇文章中,我谈谈一年DBA生涯的感想,虽然我是SQL Server的DBA,但是我觉得本文适合所有DBA,顺便把这篇文章作为个人真正D ...

  2. 开通博客的第一篇随笔~

    呀呀呀,第一次拥有了自己的博客啦,至于博客的名字嘛也是很有寓意滴,因为我的专业是学习计算机编程的,打的第一段代码就是就是"Hello World!"啦.今天已经是开始学习java的 ...

  3. 开通CSDN博客的第一篇文章以及博客名的由来

    从今天开启我的学习之旅,希望能在CSDN的大家庭里多多学习,多多成长,开通此博客的目的是为了能更好的记录自己学习的所得,方便自己,希望也能稍微服务下他人. 博客名的由来: <迷雾战场>讲述 ...

  4. 2020年博客日报第二篇|总有些人影响着你,反思+工作总结

    博客日报篇章二 触发心灵的东西才能不断激励自我提升 (想起了领导对于日报的强调,一定要对于今天的感悟,不是"流水账") 一.开篇前言 昨天晚上规划了今天的工作任务,目标狠明确,狠明 ...

  5. 第一篇博客——自我介绍篇

    首先介绍下自己.我来自山东理工大学,专业为矿业工程,是一名非科班专业应届毕业生. 这是我的第一篇博客.之前从来没接触过博客,一直都是在笔记本记录,沾边一点的也就是发发朋友圈.今天是我写博客的第一天,从 ...

  6. WordPress添加侧栏小工具-博客统计(网站统计)

    WordPress侧边栏"博客统计"小工具的制作方法.首先要下载cztcms.zip文件,解压得到一个PHP文件.蓝奏云地址:▶ cztcms.zip 1.将这个PHP文件放到主题 ...

  7. 基于Hexo和Github的炫酷个人博客(进阶篇)

    基于Hexo和Github的炫酷个人博客(基础篇) 基于Hexo和Github的炫酷个人博客(进阶篇) 网页底部加上浏览量 打开/themes/next/layout/_partials/footer ...

  8. 基于Hexo和Github的炫酷个人博客(基础篇)

    什么是hexo Hexo 是一个快速.简洁且高效的博客框架.Hexo 使用 Markdown(或其他渲染引擎)解析文章,在几秒内,即可利用靓丽的主题生成静态网页.       本文采用最新的Hexo版 ...

  9. 博客统计:腾讯分析这些数据哪儿来的?

    站长统计是很多网站最常用功能,很多站长需要跟踪自己网站的访问和转化情况,于是站长统计就是一个非常直观和方便的工具,统计工具之前在做实验室的网站中用过百度统计和CNZZ,后来做论坛的时候发现Discuz ...

  10. 基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(二)

    基于 abp vNext 和 .NET Core 开发博客项目 - 博客接口实战篇(二) 转载于:https://github.com/Meowv/Blog 上篇文章完成了两个接口:文章列表页.文章详 ...

最新文章

  1. 紘康单片机_紘康HY11P14 - SOC芯片 - 产品展示 - SOC芯片_IC芯片pcba开发_深圳市联泰威电子有限公司...
  2. 使用python hashlib模块给明文字符串加密,以及如何撞库破解密码
  3. 昆仑通态9针通讯口定义_MCGS昆仑通态触摸屏常见问题(4)
  4. 【数据竞赛】五大100%奏效的特征筛选策略
  5. MySQL索引机制:索引分类、索引的实现原理、索引的优化 - 公开课笔记
  6. 深入理解张正友相机标定法:数学理论详细推导
  7. 作者:胡卫生(1964-),男,博士,上海交通大学教授、博士生导师,主要研究方向为下一代光接入网、光交换、光网络等。...
  8. android画面传输到电视,如何将手机内容投屏到电视上?
  9. 新手小白之学习python一飞冲天日志之—基本数据类型,条件控制语句
  10. UML基础(八)--构件图
  11. C语言的5种简单排序算法
  12. 菜狗收到了图后很开心,玩起了pdf 提交格式为flag{xxx},解密字符需小写
  13. Kotlin泛型上界与扩展函数
  14. Java 8计算两个日期之间的月份
  15. python 字符串转ASCII码
  16. 中国软件测试有多少人,测试全国有多少人重名,查重名(无需安装软件)
  17. 给人脸戴上口罩,Python实战项目来了
  18. java移位运算符详解
  19. java kryo register_kryo处理unmodifiedList报错问题
  20. va_start用法

热门文章

  1. spss26没有典型相关性分析_SPSS进行典型相关分析结果总结
  2. clojure-jack-in : error in process filter: open-network-stream: make client process failed: Connecti
  3. 路漫漫其修远兮,吾将上下而求索
  4. 什么是交换机?它有哪些作用?
  5. jpg图片怎么压缩大小?简单快捷的方法教给你
  6. Python爬取并分析IMDB电影
  7. 爱立信宣布收购FYI电视
  8. jQuery easyUI设置表格中的背景色
  9. 图论中的0x3f和memset使用注意事项(较详细)
  10. 基因编辑最新进展2021年5月