本文将使用Python爬取百度新闻搜索指数排名前50的新闻,并通过服务器运行,每天定时发送到指定邮箱。

先上代码:

# -*- coding:utf-8 -*-
import requests,os,re,email,smtplib
EMAIL_ADDRESS='****@hotmail.com'
EMAIL_PASSWORD='***'
s=smtplib.SMTP(host='smtp.office365.com',port=587)
s.starttls()
s.login(EMAIL_ADDRESS,EMAIL_PASSWORD)
print('Connected~')
url='http://top.baidu.com/buzz?b=341&c=513&fr=topbuzz_b1'
r=requests.get(url)
txt=r.content.decode('GBK')
pt=re.compile('href_top=".*?">(.*?)<')
title=re.findall(pt,txt)
pt1=re.compile('href="(.*?)" href_top')
urls=re.findall(pt1,txt)
#print(len(urls))
pt2=re.compile('icon-....">(.*?)</span')
rise=re.findall(pt2,txt)
#print(title,rise,urls)
i=50
mss=''
for x in range(i):ma=(str(x+1),title[x],rise[x],urls[x])ms=',  '.join(ma)mss+=(ms+'\n')
msgs=mss
msg=email.message_from_string(msgs)
msg['From']=EMAIL_ADDRESS
msg['To']=EMAIL_ADDRESS # add who need receive the eamil
s.sendmail(EMAIL_ADDRESS,EMAIL_PASSWORD,msg.as_string())
s.quit()
print('Your data sent to %s',EMAIL_ADDRESS)

主要使用了requests,smtplib, re,email模块,只需要30几行代码就可以实现。

接下来我说下怎么在服务器上设置:

crontab -e这个命令可以搜索了解下怎么使用的,

在我们服务器下面输入这个命令 crontab -e

* * * * * program

进入编辑模式按 i 键

30 07 * * * /usr/local/bin/python3 /usr/temp/baidu.py 每天早上7:30分运行一次

然后:wq 保存,就可以执行了。另外需要注意的是一定要写成绝对路径,这样保证程序能运行。

最后上一张截图

Python 爬取百度 搜索风云榜 新闻并 自动推送 到邮箱相关推荐

  1. Python爬取百度搜索风云榜实时热点.

    Python爬虫实战源码合集(持续更新) 百度搜索风云榜:http://top.baidu.com/ 源码: import os import json from datetime import da ...

  2. python爬取百度搜索_使用Python + requests爬取百度搜索页面

    想学一下怎样用python爬取百度搜索页面,因为是第一次接触爬虫,遇到一些问题,把解决过程与大家分享一下 1.使用requests爬取网页 首先爬取百度主页www.baidu.com import r ...

  3. Python爬取百度搜索的标题和真实URL的代码和详细解析

    网页爬取主要的是对网页内容进行分析,这是进行数据爬取的先决条件,因此博客主要对爬取思路进行下解析,自学的小伙伴们可以一起来学习,有什么不足也可以指出,都是在自学Ing,回归正题今天我们要来爬取百度搜索 ...

  4. python爬取百度搜索_Python-Scrapy抓取百度数据并分析

    抓取智联招聘和百度搜索的数据并进行分析,使用visual studio编写代码mongodb和SQLServer存储数据.使用scrapy框架结合 selenium爬取百度搜索数据,并进行简要的数据的 ...

  5. python 爬取百度搜索结果url

    简单的爬取百度搜索结果url 先用了requests库来访问百度,再通过xpath来提取搜索后的结果 import requests from lxml import etreefor i in ra ...

  6. 实战技巧:Python爬取OEM 12C上的告警信息并推送至微信企业号

    关注我们获得更多精彩 作者 | 徐美兰 ,邮政软件开发工程师,广东.湖南邮政金融数据中心任职多年,擅长Oracle数据库性能诊断与调优,对基于Python的数据分析与挖掘开发具有浓厚兴趣. 编者说明: ...

  7. python爬取百度搜索答案题目和摘要

    url就自行构造吧 # coding:utf-8 import urllib2 import re from bs4 import BeautifulSoup url = 'http://www.ba ...

  8. python 广告牌_Python从百度搜索广告牌抓取新闻并自动推送到电子邮件中,爬取,风云榜,邮箱...

    本文将使用Python爬取百度新闻搜索指数排名前50的新闻,并通过服务器运行,每天定时发送到指定邮箱. 先上代码: # -*- coding:utf-8 -*- import requests,os, ...

  9. python爬虫代码实例-Python爬虫爬取百度搜索内容代码实例

    这篇文章主要介绍了Python爬虫爬取百度搜索内容代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 搜索引擎用的很频繁,现在利用Python爬 ...

最新文章

  1. hive lock命令的使用
  2. Kafka-0.10.0.0 集群高可靠实验
  3. python3 读取文本文件_python3文件的读写操作
  4. mysql ——MHA
  5. 视频会议未来趋势不完全预测
  6. TCP和Web Socket混合使用的一个例子
  7. 2019最新 Java商城秒杀系统的设计与实战视频教程(SpringBoot版)
  8. jdk8 接口抽象类区别_JDK 8时代的抽象类与接口
  9. NOIP模拟测试11「string·matrix·big」
  10. 实际操作之路考的这些事
  11. [links]CS以及一些水源朋友的BLog链接
  12. Python3 高级用法
  13. java编码什么时候需要增加空格_Java编码规范之声明和空白,空格
  14. Verilog基本语法之wire和reg
  15. table制作课程表案例
  16. 从帝王之术中窥探天机
  17. python substr_Python字符串的方法
  18. 游学孔府,乐学礼仪——申子晋
  19. php如何把文字加粗,HTML中如何将字体加粗
  20. python真的有用吗-Python真的没有用吗?

热门文章

  1. 湾区潮涌·香港向前 | 香港科大副校长汪扬:用好一国两制制度优势,香港要成数字经济接轨世界桥梁...
  2. centos7重新安装polket
  3. 西门子1200,et200sp和西门子触摸屏做的金银精炼控制系统
  4. 免费分享Spring Cloud开发的优秀图书
  5. 猪肉干烘干工艺,猪肉干的工艺步骤如下
  6. 华为实现中:STP运行机制实例分析一
  7. 最新抖音无水印解析PHP源码
  8. fluent动网格profile文件的编写
  9. 俄罗斯方块之三——Block类
  10. 多功能关机助手(定时/倒计时/计划关机/锁屏/注销/挂机等)