本文主要向大家介绍了【云计算】爬取淘宝手机品牌词云分析(python),通过具体的内容向大家展现,希望对大家学习云计算有所帮助。

淘宝手机信息的爬取,请看这边博客(点击这里),然后我们利用其中保存的文本来进行绘制词云。

首先直接贴上代码(有写的不明白的可以直接留言,一起学习)

import matplotlib.pyplot as plt

from wordcloud import WordCloud

from scipy.misc import imread

import jieba

text = open(r"tb.txt","rb").read()

wordlist = jieba.cut(text)

wl = ' '.join(wordlist) #将分词后的文本存入到一个列表中

#设置停用词

stopwords_list = []

with open('stopwords.txt', 'r') as f:

for line in f.readlines():

stopwords_list.append(line.strip()

) #停用词设置

wc = WordCloud(background_color = "white", #设置背景颜色

mask = imread('shen.png'), #设置背景图片

max_words = 2000, #设置最大显示的字数

stopwords = stopwords_list, #["的", "这种", "这样", "还是", "就是", "这个", "没有","但是", "可以","真的","我们","导演", "看到","一个",'可能','一部'], #设置停用词

font_path = r"C:\Windows\Fonts\simkai.ttf", # 设置为楷体 常规

#设置中文字体,使得词云可以显示(词云默认字体是“DroidSansMono.ttf字体库”,不支持中文)

max_font_size = 60, #设置字体最大值

random_state = 30, #设置有多少种随机生成状态,即有多少种配色方案

)

myword = wc.generate(wl)#生成词云

wc.to_file('result.jpg')

#展示词云图

plt.imshow(myword)

plt.axis("off")

plt.show()

接下是结果展示

本文由职坐标整理并发布,希望对同学们有所帮助。了解更多详情请关注职坐标大数据云计算大数据安全频道!

python词云代码手机_【云计算】爬取淘宝手机品牌词云分析(python)相关推荐

  1. 爬取淘宝手机数据,并进行清洗,并可视化展示

    爬取所需环境 selnium安装 Win+R输入cmd敲回车进入到cmd窗口: 输入"pip3 install selenium -i https://pypi.tuna.tsinghua. ...

  2. python电商数据挖掘_利用Python爬取淘宝商品并数据挖掘与分析实战!此乃大型项目!...

    项目内容 本案例选择>> 商品类目:沙发: 数量:共100页 4400个商品: 筛选条件:天猫.销量从高到低.价格500元以上. 项目目的 1. 对商品标题进行文本分析 词云可视化 2. ...

  3. Python爬虫:Selenium模拟Chrome浏览器爬取淘宝商品信息

    对于采用异步加载技术的网页,有时候想通过逆向工程的方式来设计爬虫进行爬取会比较困难,因此,要想通过python获取异步加载数据往往可以使用Selenium模拟浏览器的方式来获取. Selenium是一 ...

  4. python爬取淘宝手机信息并下载到excel文件中

    #coding=GBK import requests import re from xlwt import Workbook import xlrd import time def key_name ...

  5. 七步爬取淘宝天猫bra销售数据,分析中国女性胸部大小分布比例

    这是一个有趣的项目,关于bra销售数据分析的.是网络爬虫和数据分析的综合应用项目.从淘宝抓取bra销售数据,并将这些数据保存到SQLite数据库中,然后对数据进行清洗,最后通过SQL语句.Pandas ...

  6. python 爬虫实例-python爬虫实例,一小时上手爬取淘宝评论(附代码)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 1 明确目的 通过访问天猫的网站,先搜索对应的商品,然后爬取它的评论数据. ...

  7. Python爬虫实例,一小时上手爬取淘宝评论(附代码)!

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 1 明确目的 通过访问天猫的网站,先搜索对应的商品,然后爬取它的评论数据. ...

  8. python爬虫实例,一小时上手爬取淘宝评论(附代码)

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 1 明确目的 通过访问天猫的网站,先搜索对应的商品,然后爬取它的评论数据. ...

  9. python爬虫数据分析项目 双十一_Python爬取淘宝商品数据,价值千元的爬虫外包项目!...

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 完整代码可以点击下方链 ...

最新文章

  1. 基础搭建Hadoop大数据处理-编程
  2. (转载)连连看游戏外挂详细制作过程
  3. HttpClient使用方法(包括POST文件)
  4. LUA ipairs遍历的问题
  5. 每天一道LeetCode-----KMP算法查找子串,重新实现strStr()函数
  6. Linux SD卡驱动开发(二) —— SD 卡驱动分析HOST篇
  7. yii验证系统学习记录,基于yiicms(一)写的太长了,再写一篇(二)
  8. Java中快速处理集合_简洁又快速地处理集合——Java8 Stream(上)
  9. oracle cronb,利用Crontab实现对Oracle数据库的定时备份
  10. python定时执行脚本实例
  11. 微信又添新表情,“我裂开了”!
  12. 腾讯开源智能运维项目,用机器学习减少人为失误
  13. php登入模块代码,thinkphp LoginAction.class.php 登录模块
  14. Mysql指定编码导入导出数据
  15. linux内核源码多大,需要多久才能看完linux内核源码?
  16. Android仿微信朋友圈查看全文/收起功能(雷惊风)
  17. 关闭苹果无线服务器,苹果iOS11 WiFi、蓝牙无法关闭怎么回事?附彻底关闭方法...
  18. C++版《天空之城》
  19. Kafka+Storm+HBase项目Demo(5)--topology,spout,bolt使用
  20. 使用ffmpeg将视频转为hls格式并播放

热门文章

  1. 【能效管理】电力监控系统在某商业数据中心的应用分析
  2. hibernate HQL 使用from (select ……)子查询的方法
  3. 2019 面试实战 - 第二回合
  4. 业务员应熟记的应酬劝酒词大全
  5. 模拟手柄控制器点击没有反应的问题
  6. 2005-11-11
  7. 报错Cannot mix different versions of joi schemas解决方法
  8. 李宏毅2023春季机器学习笔记 - 01生成AI(ChatGPT)
  9. javascript学习之路1
  10. 关于差分放大器双电源改单电源问题的讨论(AD628)