作者 | A字头

来源 | 数据札记倌

很多人都是在朋友圈装死,微博上蹦迪。
微信朋友圈已经不是一个可以随意发表心情的地方了,微博才是!

所以你不要傻傻盯着女神的朋友圈发呆啦!

本文教你如何用Python自动通知女神微博情绪变化,从今天开始做一个贴心小棉袄。

为了及时获取这些消息,三步可以实现:

1、定时自动爬取微博内容

2、微博内容的情绪分析

3、邮件自动提醒

1

微 博 内 容 获 取

首先是一些常规操作:

你需要注册一个微博账户,找到你微博账户的cookie

然后找到你需要关注的微博用户的id,下面以李荣浩为例:

或者直接去用户主页查看,进入指定用户主页,如李荣浩的主页 :

https://m.weibo.cn/u/1739046981?uid=1739046981&luicode=10000011&lfid=231093_-_selffollowed

其中1739046981就是uid。

先根据这些信息设置好自己的账号,由于最新的微博内容肯定在第一页,设置好首页微博内容的url

# 改成自己的user_id和cookie
user_id = YOUR_ID
cookie = {"Cookie": "YOUR_COOKIE"}
# url
url = 'http://weibo.cn/%d/profile?page=1'%user_id
# 获取初始url页面html内容,获取user_id和cookie(在返回的response header中)
html = requests.get(url, cookies = cookie).content
print ('user_id和cookie读入成功')

有了这些信息以后,我们就可以爬取微博内容啦,这里需要注意的是我们需要加一个第一条微博的判断。

#根据用户uid获取该用户第一页的微博消息
page_num = 1
nickname = None
weibo = None
try:json = r.get(('https://m.weibo.cn/api/container/getIndex?''is_search[]=0&''visible[]=0&''is_all[]=1&''is_tag[]=0&''profile_ftype[]=1&''page={0}&''jumpfrom=weibocom&''sudaref=weibo.com&''type=uid&''value={1}&''containerid=107603{1}').format(page_num, uid),verify=False,).json()
except:return None, None
if json['ok'] == 0:print('sth wrong')return None, None
else:for card in json['cards']:if card['card_type'] == 9:weibo = [card['mblog']['created_at'],BeautifulSoup(card['mblog']['text'], 'lxml').text.replace(' \u200b\u200b\u200b', ''),*get_comments_from_one_weibo(card['mblog']['id']),]

这样的话我们就可以获取到女神的最新微博啦~下面要做的就是根据获取到的微博数据来分析情感内容。

2

微 博 内 容 情 感

这部分仅对文本内容有效,如果是图片内容就直接通知你内容不做情感分析。

如果需要计算中文文本内容的情绪分,主要是三步:

1、情感字典及对应的分数

2、数据的分词处理

3、构建情绪分计算逻辑

这里主要介绍一下情绪分的计算逻辑,情感词典和完整的实现逻辑后台回复「 微博通知 」获取,下次再专门写一篇针对文本情绪评分的内容。

简化的情感分数计算逻辑:所有情感词语组的分数之和

定义一个情感词语组:

两情感词之间的所有否定词和程度副词与这两情感词中的后一情感词构成一个情感词组,即notWords + degreeWords + sentiWords

例如不是很开心,其中不是为否定词,很为程度副词,开心为情感词,那么这个情感词语组的分数为:

finalSentiScore = (-1) ^ 1 * 1.25 * 3.546

其中1指的是一个否定词,1.25是程度副词的数值,3.546是开心的情感分数。

伪代码如下:

finalSentiScore = (-1) ^ (num of notWords) * degreeNum * sentiScore
finalScore = sum(finalSentiScore)

具体实现逻辑如下:

def scoreSent(senWord, notWord, degreeWord, segResult):W = 1score = 0# 存所有情感词的位置的列表senLoc = senWord.keys()notLoc = notWord.keys()degreeLoc = degreeWord.keys()senloc = -1# notloc = -1# degreeloc = -1# 遍历句中所有单词segResult,i为单词绝对位置for i in range(0, len(segResult)):# 如果该词为情感词if i in senLoc:# loc为情感词位置列表的序号senloc += 1# 直接添加该情感词分数score += W * float(senWord[i])# print "score = %f" % scoreif senloc < len(senLoc) - 1:# 判断该情感词与下一情感词之间是否有否定词或程度副词# j为绝对位置for j in range(senLoc[senloc], senLoc[senloc + 1]):# 如果有否定词if j in notLoc:W *= -1# 如果有程度副词elif j in degreeLoc:W *= float(degreeWord[j])# i定位至下一个情感词if senloc < len(senLoc) - 1:i = senLoc[senloc + 1]return score

通过这个计算逻辑最终输出整条微博的情绪评分,在做这个最重要的是要有好用的语料库,定义好正向情感词和负向情感词。

基础情感词典已经有整理好了的情感词典。使用的是大连理工大学的情感词汇本体库,停用词表使用哈工大的停用词表。

有关文本情感分析的参考:

https://blog.csdn.net/qq_22765745/article/details/70947728

3

邮 件 自 动 提 醒

当我们获取到新的微博内容时,就需要将消息推送到我们的邮箱,这时候,我们需要添加判定条件,判断是否执行邮件提醒。这个判断条件与爬取最新微博的判断设置成一致。

python发邮件需要掌握两个模块的用法,smtplib和email,这俩模块是python自带的,只需import即可使用。smtplib模块主要负责发送邮件,email模块主要负责构造邮件。

smtplib模块主要负责发送邮件:是一个发送邮件的动作,连接邮箱服务器,登录邮箱,发送邮件(有发件人,收信人,邮件内容)。

email模块主要负责构造邮件:指的是邮箱页面显示的一些构造,如发件人,收件人,主题,正文,附件等。

导入我们需要用到的包

from email.mime.text import MIMEText
from email.mime.multipart import MIMEMultipart
from email.mime.image import MIMEImage
import smtplibmsg = MIMEMultipart()

在邮件中插入微博正文,同时将情绪分值添加到邮件正文里:

##在邮件中插入文本信息
df_text="Hi!\n你的女神新发了一条微博,情绪分值只有 %s  \n快去看看吧!"% score
msgtext = MIMEText(df_text, 'plain', 'utf-8')
msg.attach(msgtext)

剩下的就是设置一些邮件参数来发送邮件:

#设置邮件信息常量
email_host= ''  # 服务器地址
sender = '' # 发件人
password ='' # 密码,如果是授权码就填授权码
receiver = '' # 收件人

发送邮件:

try:smtp = smtplib.SMTP(host=email_host)smtp.connect(email_host,port)smtp.starttls()smtp.login(sender, password)smtp.sendmail(sender, receiver.split(',') , msg.as_string())smtp.quit()print('发送成功')
except Exception: print('发送失败')

具体邮件发送参数说明如下:

smtplib.SMTP():实例化SMTP()
connect(host,port):
email_host:指定连接的邮箱服务器。常用邮箱的smtp服务器地址如下:
新浪邮箱:smtp.sina.com
163网易邮箱:smtp.163.com。
port:指定连接服务器的端口号,默认为25
login(user,password):
sender:登录邮箱的用户名。
password:登录邮箱的密码(网易邮箱一般是网页版,需要用到客户端密码,需要在网页版的网易邮箱中设置授权码,该授权码即为客户端密码)
sendmail(from_addr,to_addrs,msg,…):
sender:邮件发送者地址
receiver:邮件接收者地址
msg:邮件内容
quit():用于结束SMTP会话

4

效 果 展 示

运行程序结果如下:

扫码查看作者更多文章

▼▼▼

精彩公开课

推荐阅读

  • Github开源趋势榜Top 1:英伟达升级发布二代StyleGAN,效果更完美

  • 讯飞轮值总裁胡郁:大数据是人工智能产业落地的必要保障| BDTC 2019

  • Google提出移动端新SOTA模型MixNets:用混合深度卷积核提升精度

  • 20行代码发一篇NeurIPS:梯度共享已经不安全了

  • 图灵奖得主Bengio:深度学习不会被取代,我想让AI会推理、计划和想象

  • VS Code 成主宰、Vue 备受热捧!2019 前端开发趋势必读

  • 阿里云上万个 Kubernetes 集群大规模管理实践

  • 公司倒闭,39 岁重新找工作,薪资不到 8000,太残酷

  • 底层公链行业报告:国产公链未来应积极协助政企开发联盟链;跨链和分层等技术取得较大进展,链链互通将成为现实

  • 你点的每个“在看”,我都认真当成了AI

朋友圈装死,微博蹦迪,Python教你如何掌握女神情绪变化 | CSDN博文精选相关推荐

  1. 朋友圈装死,微博蹦迪|Python教你如何掌握女神情绪变化

    很多人都是在朋友圈装死,微博上蹦迪. 微信朋友圈已经不是一个可以随意发表心情的地方了,微博才是! 所以你不要傻傻盯着女神的朋友圈发呆啦! 本文教你如何用Python自动通知女神微博情绪变化,从今天开始 ...

  2. Python识别文字,实现看图说话 | CSDN博文精选

    作者 | 张小腿 来源 | CSDN博客 现在写文件很多网站都不让复制了,所以每次都是截图然后发到QQ上然后用手机QQ的文字识别再发回电脑.感觉有点小麻烦了,所以想自己写一个小软件方便方便自己,就有了 ...

  3. 春招妥了!资深技术面试官教你这样准备 Java 面试! | CSDN 博文精选

    作者 | hsm_computer 责编 | 伍杏玲 出品 | CSDN博客 Java能力和面试能力,这是两个方面的技能,可以这样说,如果不准备,一些大神或许也能通过面试,但能力和工资有可能被低估.再 ...

  4. 思维导图使用技巧:手把手教你怎么画思维导图 #CSDN博文精选# #系统化学习# #IT技术# #知识图谱#

    大家好~我是小C,又见面啦!"文章过滤器"精选大咖干货.助力学习之路. <5天20篇CSDN精选博文带你掌握系统化学习方法>专栏将挑选有关"系统化学习方法&q ...

  5. python图片识别论文_Python识别文字,实现看图说话 | CSDN博文精选

    原标题:Python识别文字,实现看图说话 | CSDN博文精选 作者 | 张小腿 来源 | CSDN博客 现在写文件很多网站都不让复制了,所以每次都是截图然后发到QQ上然后用手机QQ的文字识别再发回 ...

  6. 朋友圈装逼高考证图片怎么在线生成制作,高考证怎么写上自己的名字?

    2019独角兽企业重金招聘Python工程师标准>>> 最近发现一个好玩的朋友圈装逼神器 - 高考准考证生成器 ####只需要输入自己的名字和学习,就可以生成自己的准考证 那么这个高 ...

  7. 微信朋友圈装x代码_朋友圈生成器有哪些_微信朋友圈生成器大全_微信朋友圈装逼生成器下载_飞翔软件专题...

    微信朋友圈生成器是小伙伴日常朋友圈装逼的必备工具.本次小编为大家带来多款朋友圈装b生成器,支持各种豪车,驾驶证,房产证等装逼图片的生成.微信朋友圈装b生成器可以帮助用户好好的装逼,装出全新的高度.相信 ...

  8. 万字长文详解如何用Python玩转OpenGL | CSDN 博文精选

    作者 | 天元浪子 来源 | CSDN博文精选 [编者按]OpenGL(开放式图形库),用于渲染 2D.3D 矢量图形的跨语言.跨平台的应用程序编程接口,C.C++.Python.Java等语言都能支 ...

  9. Python编程:朋友圈看起来太low?教你用python实现高逼格朋友圈

    小编今天要给大家介绍一个Python库: PIL(Python Image Library) 下面我们用一个实际的例子 看看50行python代码可以做什么神奇的事情 这是小编发的一个朋友圈 切图前是 ...

最新文章

  1. Oracle10g 回收站及彻底删除table : drop table xx purge
  2. 创建的二叉树后续非递归遍历结果为_一入递归深似海,从此offer是路人
  3. jackson反序列化时忽略不需要的字段
  4. POJ - 2186 Popular Cows(强连通缩点)
  5. Linux 设备驱动开发 —— Tasklets 机制浅析
  6. (七)linux函数接口的使用
  7. 【Python】类的基本写法与注释风格
  8. 《深入理解Android:卷III A》一一第3章 深入理解AudioService
  9. 【ElasticSearch】Es 源码之 NodeService 源码解读
  10. 《C++ Primer Plus》读书笔记之十—类和动态内存分配
  11. 未找到依赖项 ‘org.apache.spark:spark-hive_2.11:2.4.5‘
  12. 洛谷P1238 走迷宫
  13. 数学建模1---基本方法和步骤
  14. Mandriva本地安装
  15. HbuilderX开发App调用手机支付宝支付
  16. IIS发生意外错误0x8ffe2740 IIS不…
  17. 三线压力传感器原理_三线机油压力传感器作用是什么?工作原理是什么?
  18. 消防管件做的机器人图片_消防管道配件制成机器人
  19. JZOJ3481. 【NOIP2013模拟10.23】君と彼女の恋(2017.10B组)
  20. 7大子论坛回顾 | PGConf.Asia亚洲技术大会DAY2精彩继续

热门文章

  1. 营销自动化的4大预测分析错误
  2. MQTT的学习研究(五) MQTT moquette 的 Blocking API 发布消息服务端使用
  3. Android入门——电话拨号器和4种点击事件
  4. mvc 下的 signalR使用小结
  5. android中PreferencesActivity的使用(一)
  6. Windows Phone 7 不温不火学习之《创建用户控件》
  7. 怎样在javascript函数中将变量传递给服务端脚本程序?
  8. mysql 主从同步不一致_MySQL 主从同步延迟的原因及解决办法
  9. Spring Boot thymeleaf模版支持,css,js等静态文件添加
  10. Windows netstat 查看端口、进程占用