爬朋友圈好友的个性签名,生成云图(下)
思路
- 爬微信好友的资料
- 将资料中的个性签名去除干扰信息
- 将信息进行分词,以空格连接得到合适的字符串
- 将字符串以云图形式展示出来。
步骤3-分词
- 下载jieba结巴
- 使用jieba.cut()将信息进行分词,它有三种模式,精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
具体查看
http://blog.csdn.net/luoyexuge/article/details/49104179 - 我们这里使用jieba.cut(text,cut_all=True)全模式
代码
#3.结巴进行分词
import jieba
jieba_list = jieba.cut(text,cut_all=True)
jieba_list_split = " ".join(jieba_list)
print(jieba_list_split)
步骤4-云图
代码
#4.进行词云
import matplotlib.pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator
import numpy as np
import PIL.Image as Image
#读入背景图片
color = np.array(Image.open("121.jpg"))
#生成词云
world_cloud = WordCloud(background_color="white" , max_words= 100,mask=color ,max_font_size=60 ,random_state=42,scale =1.5,font_path="simhei.ttf").generate(jieba_list_split)
image_color = ImageColorGenerator(color)
#显示词云图片
plt.imshow(world_cloud.recolor(color_func=image_color))
plt.imshow(world_cloud)
plt.axis("off")
plt.show()
注意
- 这个步骤需要很多包,操作时候,发现PIL和wordcloud出现安装出错,其实PIL可以直接下载pillow,而wordcloud显示
error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools
后面百度发现,在线安装,又加上微软服务器在国外的软件安装,可能耗时长久
解决方案:
1. 找已经编译好的安装包,即
http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud
- 去该网站下载与您电脑Python版本对应的*.whl文件。
在cmd.exe下
>python
>>> import pip
>>> print(pip.pep425tags.get_supported())
[('cp36', 'cp36m', 'win_amd64'), ('cp36', 'none', 'win_amd64'), ('py3', 'none', 'win_amd64'), ('cp36', 'none', 'any'), ('cp3', 'none', 'any'), ('py36', 'none', 'any'), ('py3', 'none', 'any'), ('py35', 'none', 'any'), ('py34', 'none', 'any'), ('py33', 'none', 'any'), ('py32', 'none', 'any'), ('py31', 'none', 'any'), ('py30', 'none', 'any')]
>>>
根据上面的可支持字段,选择
wordcloud-1.3.3-cp36-cp36m-win_amd64.whl
3. 然后切换到文件下载目录,并使用pip安装本地包。
pip install .\wordcloud-1.3.2-cp36-cp36m-win32.whl
- 进行生成云图时,有个参数是font_path字体,需要将ttf文件放在项目里面去,比如,我这里的字体是黑体,simhei.ttf
- 选择的图片尽量旁边是白的,需要显示的非白即可,这样子有明显的轮廓。
- 项目下载:http://download.csdn.net/download/xiongxu3381/10226174
爬朋友圈好友的个性签名,生成云图(下)相关推荐
- 爬朋友圈好友的个性签名,生成云图(上)
看了大神的http://mp.weixin.qq.com/s?__biz=MzIxNjA2ODUzNg==&mid=2651436390&idx=1&sn=0ec8030efc ...
- python3微信好友个性签名生成云图
1. 安装 pip3 install wordcloud 如果报错 下载对应的whl文件https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud 进入 ...
- Py:数据挖掘之对微信朋友圈好友的性别、区域、昵称、签名信息进行情感分析
Py:数据挖掘之对微信朋友圈好友的性别.区域.昵称.签名信息进行情感分析 目录 输出结果 部分代码 输出结果 部分代码 #Py:数据挖掘之对微信朋友圈好友的性别.区域.昵称.签名信息进行情感分析--J ...
- 利用python深度分析微信朋友圈好友
最近看了wxpy这个包,感觉还不错,分析一下微信的好友. 分析的目的: 1.看看好友的性别占比.地域分布 2.分析好友的个性签名 3.对好友的签名进行情感分析 环境:python 3.6 需要的包wx ...
- itchat分析微信好友的个性签名
itchat分析微信好友的个性签名 itchat是一个开源的微信个人号python接口(公众号.企业号接口为itchatmp).使用它可以非常优雅地操纵个人微信号.文档链接 七夕到了,博主也要自娱自乐 ...
- 用 Python分析朋友圈好友的签名
需要用到的第三方库: numpy:本例结合wordcloud使用 jieba:对中文惊进行分词 PIL: 对图像进行处理(本例与wordcloud结合使用) snowlp:对文本信息进行情感判断 wo ...
- Airtest爬朋友圈并生成中文词云图
使用Airtest来爬取朋友圈的内容.参考链接,参考链接中的手机滑动的功能在我的实际操作过程不可使用,故对其进行改动. 该部分整体代码如下: # -*- encoding=utf8 -*- __aut ...
- uni H5微信内自定义分享朋友圈/好友带图片 标题
先来看一下对比效果图 一:绑定域名 先登录微信公众平台进入"公众号设置"的"功能设置"里填写"JS接口安全域名". 备注:登录后可在&quo ...
- Python玩转微信 个性签名生成词云图
本博客代码参照http://www.cnblogs.com/jiaoyu121/p/6944398.html. 运行如下代码之前,将下图的wechat.jpg放入F盘下,需安装itchat.jieba ...
最新文章
- 一个 SpringBoot 项目该包含哪些?
- stm32篇--系统初始化
- 使用Eclipse创建Web工程后未生成web.xml文件
- php工具箱mysql停止进程_PHP进程卡死和MySQL超时时间的设置方法
- 数字孪生技术如何实现复制世界?关键的关键是…
- 高清晰桌面壁纸,视觉控不用到处找尽在高图网
- 摘抄:java查询数据导出excel并返回给浏览器下载
- 基于JAVA的ICQ系统的设计于实现
- IBM发展过程中给我们带来什么启示?
- JOB SERVER 负载均衡
- 注册表知识:HKEY_LOCAL_MACHINE根键详解
- java ca认证_java编程方式生成CA证书
- 单目标应用:足球联赛竞争算法(Soccer league competition algorithm,SLC)求解多仓库多旅行商问题MD-MTSP(可更改旅行商个数及起点)
- 中国机器视觉市场研究报告
- 某网站X-Signature签名破解
- Python3中打开文件的方式(With open)
- P2p流媒体直播与视频会议有什么不同?
- VMware安装的虚拟机窗口如何自适应屏幕大小
- 编译原理课后题答案 龙书 机械工业出版社
- 郑清2461 我是签到题