经典台词:

1、我不知道离别的滋味是这样凄凉,我不知道说声再见要这么坚强。

2、人永远不知道,谁哪次不经意的跟你说了再见之后,就真的不会再见了。

3、曾经发生过的事情不可能忘记,只不过是想不起而已。

4、因为遇见你,我才知道我也能拥有美丽的记忆。所以,无论你怎么对待我,我都会用心去宽恕你的恨,用心去铭记你的好。

5、不要吃太胖哟,会被杀掉的!

6、我只能送你到这里了,剩下的路你要自己走,不要回头。

7、不管前方的路有多苦,只要走的方向正确,不管多么崎岖不平,都比站在原地更接近幸福。

8、放心吧,你一定可以做得到的。

9、人生就是一列开往坟墓的列车,路途上会有很多站,很难有人可以自始至终陪着走完。当陪你的人要下车时,即使不舍也该心存感激,然后挥手道别。

10、我不知道将去何方,但我已经在路上。

11、人们常常会欺骗你,是为了让你明白,有时候,你唯一应该相信的人就是你自己。

12、千万不可以丢失自我。

13、已经走到尽头的东西,重生也不过是再一次的消亡。就像所有的开始,其实都只是一个写好了的结局。

14、用善意的心情去理解别人的话,会让世界单纯美好容易。世界如此之大,我却能幸运地遇见一些人。

15、这世上有一条路无论如何也不能走,那就是歧途,只要走错一步结果都会是粉身碎骨。

16、一条路不能回头,就是一生要走许多路,有成长之路。很多事情不能自己掌控,即使再孤单再寂寞,仍要继续走下去,不许停、也不能回头。

17、名字一旦被夺走,就再也找不到回家的路了,

18、龙是温柔的,既温柔又愚蠢。

19、这个世界真的很现实,每个人都在为同一个目的,不惜一切代价努力着,心甘情愿的成为金钱的奴隶,死心塌地的付出。

20、生活坏到一定程度就会好起来,因为它无法更坏,努力过后,才知道许多事情,坚持坚持,就过来了。

21、我只是相信,这个世界上,一定有另一个自己,在做着我不敢做的事,在过着我想过的生活。

22、人们总是不断犯错,虽然前途迷茫,但他们的双手仍然寻找光明。

23、她从父母变成猪的那一刻起,就深深地记住:别人 的东西不可以拿,虽然自己的朋友千方百计才把它偷到手,但是千寻相信,做人应该帮朋友弥补错误,而不是把朋友往错误的深渊里推,朋友 是要走正路的。

24、再漫长的故事,也有完结的时候,行驶的再慢的列车,也有一个又一个的站台;在亲密无间的旅伴,也有分开的时候,旅途上经历的事情,可能会被我们遗忘;旅途上学到的东西,我们却会将它记在心间。

词云:






源码:

import requests
from stylecloud import gen_stylecloud
import jieba
import refrom bs4 import BeautifulSoup
from wordcloud import STOPWORDSheaders = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:64.0) Gecko/20100101 Firefox/64.0'
}def jieba_cloud(file_name, icon):with open(file_name, 'r', encoding='utf8') as f:word_list = jieba.cut(f.read())result = " ".join(word_list)    # 分词用  隔开# 设置停用词stopwords_file = open('stopwords.txt', 'r', encoding='utf-8')stopwords = [words.strip() for words in stopwords_file.readlines()]# 制作中文词云icon_name = " "if icon == "1":icon_name = "fas fa-thumbs-up"elif icon == "2":icon_name = "fas fa-heartbeat"elif icon == "3":icon_name = "fas fa-dog"elif icon == "4":icon_name = "fas fa-cat"elif icon == "5":icon_name = "fas fa-bug"elif icon == "6":icon_name = "fab fa-qq"pic = str(icon) + '.png'if icon_name is not None and len(icon_name) > 0:gen_stylecloud(text=result,size=1024,  # stylecloud 的大小(长度和宽度)icon_name=icon_name,font_path='simsun.ttc',max_font_size=200,  # stylecloud 中的最大字号max_words=2000,  # stylecloud 可包含的最大单词数# stopwords=TRUE,  # 布尔值,用于筛除常见禁用词custom_stopwords=stopwords,  #定制停用词列表output_name=pic)else:gen_stylecloud(text=result, font_path='simsun.ttc', output_name=pic)return pic# 爬取短评
def spider_comment(movie_id, page):comment_list = []with open("douban.txt", "a+", encoding='utf-8') as f:for i in range(1,page+1):url = 'https://movie.douban.com/subject/%s/comments?start=%s&limit=20&sort=new_score&status=P' \% (movie_id, (i - 1) * 20)req = requests.get(url, headers=headers)req.encoding = 'utf-8'comments = re.findall('<span class="short">(.*)</span>', req.text)f.writelines('\n'.join(comments))print(comments)# 主函数
if __name__ == '__main__':movie_id = '1291561'page = 10spider_comment(movie_id, page)jieba_cloud("douban.txt", "1")jieba_cloud("douban.txt", "2")jieba_cloud("douban.txt", "3")jieba_cloud("douban.txt", "4")jieba_cloud("douban.txt", "5")jieba_cloud("douban.txt", "6")

Python之千与千寻豆瓣短评词云秀相关推荐

  1. python爬取豆瓣电影评论_python 爬取豆瓣电影评论,并进行词云展示及出现的问题解决办法...

    def getHtml(url): """获取url页面""" headers = {'User-Agent':'Mozilla/5.0 ( ...

  2. 使用Python爬虫获取豆瓣影评,并用词云显示

    使用Python爬虫获取豆瓣影评,并用词云显示 Python语言流行到现在,目前最受开发者喜爱的功能莫过于它的爬虫功能,以至于很多人以为Python的英语发音也是"爬虫",其实它是 ...

  3. 详解使用Python爬取豆瓣短评并绘制词云

    使用Python爬取豆瓣短评并绘制词云 成果如下(比较丑,凑合看) 1.分析网页 打开想要爬取的电影,比如<找到你>,其短评如下: 查看源代码 发现短评存放在<span>标签里 ...

  4. python调用qq发送短信_使用腾讯云发送短信

    使用腾讯云发送短信 第一次注册使用白送你200条,美滋滋 在腾讯云平台申请 点点点操作就完事了,要想发送短信,必须要申请签名和模板.签名类型可以使用网站,公众号,小程序,app 填好信息,上传指定的截 ...

  5. echarts 词云_python Flask+爬虫制作股票查询、历史数据、股评词云网页

    自学python的数据分析,爬虫后,花了几天时间看视频学习Flask做了一个简单的股票查询网页.本来还想着加入一些其他功能,比如财务指标分析,舆情分析,最完美的想法是做成一个股票评分系统,输入股票代码 ...

  6. 2019网红带货电商新趋势,与传统电商说再见-云秀传媒

    2019年6月9日,由云秀传媒主办的"6.9安若溪电商盛典"在北京浓重开幕,重量级梯队网红阵容走上红毯,百辆千万级豪车拉风亮相,吸引粉丝眼球.明星大咖和奥运冠军现场助阵,快手千万级 ...

  7. 爬虫项目十四:Python爬下豆瓣《我的姐姐》两千条影评,看看大家对其评价如何

    文章目录 前言 一.分析URL 二.获取影评 三.代码实现 四.词云 前言 爬取豆瓣影评,爬虫代码已经封装好,修改请求头 和url即可采集你想要采集的电影影评 提示:以下是本篇文章正文内容,下面案例可 ...

  8. Python爬取豆瓣网影评展示

    Python爬取豆瓣网影评展示 需要的库文件 requests beautifulsoup wordcloud jieba matplotlib 本文思想 1.访问指定的网页 #获取指定url的内容 ...

  9. python神经网络编程 豆瓣,用python构建神经网络

    python深度学习框架学哪个 Python深度学习生态系统在这几年中的演变实属惊艳.pylearn2,已经不再被积极地开发或者维护,大量的深度学习库开始接替它的位置.这些库每一个都各有千秋. 我们已 ...

最新文章

  1. zabbix数据库表结构简单解析
  2. 在大厂干了几年开发后,太真实了。
  3. Android小结(1)
  4. linux下升级 OpenSSH
  5. maven常用插件功能
  6. 局域网中另外一台服务器的内存_局域网共享打印机,但另外一台电脑却看不到,可能是这3个原因...
  7. android之uniapp自定义基座
  8. 解决ubuntu12.04下安装gitlabError Compiling CSS asset的错误以及401资源错误
  9. Atitit.编译原理与概论
  10. controlleradvice 参数_Spring mvc中@ModelAttribute和@ControllerAdvice使用
  11. CSDN下载码怎么使用
  12. 三、python解释器下载及安装手册
  13. 怎么删除html下面多余的空白页,word怎么删除空白页|word删掉多余空白页方法
  14. Vue3+elementplus搭建通用管理系统实例五:后台主页搭建上
  15. android手机管理器在哪里打开,小米手机任务管理器在哪?怎么打开?
  16. JEECG3.8 全套实战视频全部开放,免费下载!
  17. 云计算基础-基本概念(一)
  18. 互联网(internet)、因特网(Internet)、万维网(World Wide Web)三者区别
  19. STM32开发实例 基于STM32单片机的炼钢厂环境检测
  20. 标准SPI,Dual SPI和Qual SPI

热门文章

  1. SPOJ 104 Highways(最小生成树计数)
  2. 在 CentOS 7 上搭建 Jenkins + Maven + Git 持续集成环境
  3. Elasticsearch 参考指南(引导检查)
  4. Easy Recovery帮你解决数据丢失的苦恼
  5. 新建一个express工程,node app无反应
  6. Hammer.js分析(四)——recognizer.js
  7. 开博啦——半路出家做运维以来的一些杂感
  8. 规则引擎--规则引擎构成重点
  9. PHRefreshTriggerView
  10. Web 2.0下一个版本是什么 3.0就要到来了吗?