经过了好久终于又开始续学Python,每天工作压力很大就算有时间感觉也没有多余精力学习。

这两天在网易云课堂买了一份Excel Power Pivot的教程给竞价岗位学,顺便看见了Python爬虫的教程就看了看,感觉之前的书是没有白看的。

学程序实操视频带来的教学比较适合我,除了能学到实际的教程外,可以看到高手们的编程思路,输写过程,很舒服。

这个是针对新浪的页面写的,原来BeautifulSoup能识别css和html标签,和之前玩的火车头及织梦采集相比,高明太多,怪不得是神器。

import requests

from bs4 import BeautifulSoup

def getNewsDetail(newsurl):

result = {}

res = requests.get(newsurl)

res.encoding = 'utf-8'

soup = BeautifulSoup(res.text, 'html.parser')

result['title'] = soup.select('#artibodyTitle')[0].text

result['newssource'] = soup.select('.time-source span a')[0].text

timesource = soup.select('.time-source')[0].contents[0].strip()

result['dt'] = datetime.strptime(timesource, '%Y年%m月%d日%H:%M')

result['article'] = ' '.join([p.text.strip() for p in soup.select('#artibody p')[:-1]])

result['editor'] = soup.select('.article-editor')[0].text.strip('责任编辑:')

result['comments'] = getCommentCounts(newsurl)

return result

一支python教学_第一只python爬虫相关推荐

  1. 嵩天python笔记_第一篇python笔记

    缩进: 它属于语法的一部分 体现代码之间的层次和所属关系,也是唯一的表示形式 一般用四个空格 注释: 单行注释:以 # 开头,其后内容为注释 多行注释:以=='''== (三个单引号),开头和结尾 中 ...

  2. 趣味python教学_《趣味python》学习笔记,好玩,的,记录,贴

    <好玩的python>学习记录贴1 安装好python pip install ipython pip install pillow 安装三方库 加载图片 from PIL import ...

  3. 第一只python小爬虫

    前言: 互联网就像一张无形的蜘蛛网,网站就相当于在这张网的交叉结点.而网络爬虫就是这张网上的蜘蛛,它是一种程序,能够利用url链接在各网站之间自动穿梭并抓取所需数据. 学了python的正则表达式之后 ...

  4. geany搭建python环境_第一章:搭建Python的开发环境

    第一步: 我们在Python的官网上下载Python的安装包,此安装包内含有Python解释器.Python运行的基础库,以及交互式运行工具--Python Shell 第二步: 安装时弹出下面对话框 ...

  5. python中文编程教学_中谷python中文视频教程(全38集)

    python在线教学视频教程共40节,中谷教育录制,主要介绍了python编程方面的知识. python在线教学-01-走进python python在线教学-02-开始编程吧 python在线教学- ...

  6. python 教学_「Python基础」一次就装好Python手把手装到好

    一.前言: 安装Python有两个主要的方法,视情况而定我两个都会用: (1)安装 Anaconda Anaconda像一个懒人包,安装它等于把Python安装好连同把Python大部分的套件也下载好 ...

  7. 2018年python薪资_最好的Python:2017和2018年至今我最喜欢的文章集

    2018年python薪资 我打算发布此收藏集 (My intention with publishing this collection) Last year I only used Medium ...

  8. python 切片_全面解读Python高级特性切片

    大家好,欢迎来到Crossin的编程教室! 众所周知,我们可以通过索引值(或称下标)来查找序列类型(如字符串.列表.元组-)中的单个元素,那么,如果要获取一个索引区间的元素该怎么办呢? 切片(slic ...

  9. 学习python课程_想学习Python吗? 这是我们的免费4小时互动课程

    学习python课程 Python is a popular, versatile and easy-to-learn language. It's the go-to language for AI ...

最新文章

  1. 蠕虫mysql_警惕!MySQL蠕虫再度对Windows发动攻击
  2. 实验测试2SK241的g-s击穿电压
  3. JSPatch近期新特性解析
  4. c++读取txt文件中的数字_SpringBoot 多种读取配置文件中参数的方式
  5. 基于机器视觉的马达孔直径中心距、齿数线序测量
  6. python执行方式及变量
  7. 从备用类型总盗用steal page
  8. 【EVE模拟器是干什么的】
  9. su室外渲染参数设置_vray3.4 for sketchup渲染器渲染出图参数怎么设置?
  10. 罗斯蒙特8712ESR1A1N0M4流量变送器
  11. 根据官方数据制作中国省市区数据库
  12. 揭秘JavaScript中“神秘”的this关键字
  13. Latex 的中文操作
  14. 请领取你的免费云电脑:微软Windows实验虚拟机,每天可以免费使用两个小时,上Google搜资料很方便
  15. catia螺纹孔在二维图上不显示_catia里面螺纹怎么显示不出来呢??哪儿能设置...
  16. 性能优化:一个 Flink 参数节省了 50% 的 CPU 消耗
  17. 网络偷窥者很多,如何消除上网的浏览痕迹?
  18. 西雅图成为了美国办公租赁最大市场!
  19. 计算机图形学在现实中的应用,计算机图形学在实际中的应用
  20. Flask学习笔记:错误处理

热门文章

  1. 站在BERT肩膀上的NLP新秀们(PART III)
  2. BERT模型实战之多文本分类(附源码)
  3. python函数递归求和详解_Python 递归函数详解及实例
  4. 机器学习框架_一文了解机器学习框架-TensorFlow的原理和用途
  5. 跨境电商erp有哪些功能?跨境erp是跨境电商卖家必备么?
  6. java经纬度凸包graham_计算几何-凸包-Graham算法
  7. 深度学习-吴恩达-笔记-7-超参数调试、Batch正则化和程序框架
  8. 开启python之旅
  9. 技术支持和研发哪个好_考拉海购技术支持的前世今生,聊聊家常“黑历史”
  10. 山东省大学计算机科学与技术,我校计算机科学与技术专业获山东省大学最佳专业排行榜第一名...