思路

  • 爬微信好友的资料
  • 将资料中的个性签名去除干扰信息
  • 将信息进行分词,以空格连接得到合适的字符串
  • 将字符串以云图形式展示出来。

步骤3-分词

  • 下载jieba结巴
  • 使用jieba.cut()将信息进行分词,它有三种模式,精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义;搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
    具体查看
    http://blog.csdn.net/luoyexuge/article/details/49104179
  • 我们这里使用jieba.cut(text,cut_all=True)全模式

代码

#3.结巴进行分词
import jieba
jieba_list = jieba.cut(text,cut_all=True)
jieba_list_split = " ".join(jieba_list)
print(jieba_list_split)

步骤4-云图

代码

#4.进行词云
import matplotlib.pyplot as plt
from wordcloud import WordCloud,ImageColorGenerator
import  numpy as np
import  PIL.Image as Image
#读入背景图片
color = np.array(Image.open("121.jpg"))
#生成词云
world_cloud = WordCloud(background_color="white" , max_words= 100,mask=color ,max_font_size=60 ,random_state=42,scale =1.5,font_path="simhei.ttf").generate(jieba_list_split)
image_color = ImageColorGenerator(color)
#显示词云图片
plt.imshow(world_cloud.recolor(color_func=image_color))
plt.imshow(world_cloud)
plt.axis("off")
plt.show()

注意

  • 这个步骤需要很多包,操作时候,发现PIL和wordcloud出现安装出错,其实PIL可以直接下载pillow,而wordcloud显示
error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

后面百度发现,在线安装,又加上微软服务器在国外的软件安装,可能耗时长久
解决方案:
1. 找已经编译好的安装包,即
http://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud

  1. 去该网站下载与您电脑Python版本对应的*.whl文件。
在cmd.exe下
>python
>>> import pip
>>> print(pip.pep425tags.get_supported())
[('cp36', 'cp36m', 'win_amd64'), ('cp36', 'none', 'win_amd64'), ('py3', 'none', 'win_amd64'), ('cp36', 'none', 'any'), ('cp3', 'none', 'any'), ('py36', 'none', 'any'), ('py3', 'none', 'any'), ('py35', 'none', 'any'), ('py34', 'none', 'any'), ('py33', 'none', 'any'), ('py32', 'none', 'any'), ('py31', 'none', 'any'), ('py30', 'none', 'any')]
>>>

根据上面的可支持字段,选择
wordcloud-1.3.3-cp36-cp36m-win_amd64.whl
3. 然后切换到文件下载目录,并使用pip安装本地包。

pip install .\wordcloud-1.3.2-cp36-cp36m-win32.whl
  • 进行生成云图时,有个参数是font_path字体,需要将ttf文件放在项目里面去,比如,我这里的字体是黑体,simhei.ttf
  • 选择的图片尽量旁边是白的,需要显示的非白即可,这样子有明显的轮廓。
  • 项目下载:http://download.csdn.net/download/xiongxu3381/10226174

爬朋友圈好友的个性签名,生成云图(下)相关推荐

  1. 爬朋友圈好友的个性签名,生成云图(上)

    看了大神的http://mp.weixin.qq.com/s?__biz=MzIxNjA2ODUzNg==&mid=2651436390&idx=1&sn=0ec8030efc ...

  2. python3微信好友个性签名生成云图

    1. 安装 pip3 install wordcloud 如果报错 下载对应的whl文件https://www.lfd.uci.edu/~gohlke/pythonlibs/#wordcloud 进入 ...

  3. Py:数据挖掘之对微信朋友圈好友的性别、区域、昵称、签名信息进行情感分析

    Py:数据挖掘之对微信朋友圈好友的性别.区域.昵称.签名信息进行情感分析 目录 输出结果 部分代码 输出结果 部分代码 #Py:数据挖掘之对微信朋友圈好友的性别.区域.昵称.签名信息进行情感分析--J ...

  4. 利用python深度分析微信朋友圈好友

    最近看了wxpy这个包,感觉还不错,分析一下微信的好友. 分析的目的: 1.看看好友的性别占比.地域分布 2.分析好友的个性签名 3.对好友的签名进行情感分析 环境:python 3.6 需要的包wx ...

  5. itchat分析微信好友的个性签名

    itchat分析微信好友的个性签名 itchat是一个开源的微信个人号python接口(公众号.企业号接口为itchatmp).使用它可以非常优雅地操纵个人微信号.文档链接 七夕到了,博主也要自娱自乐 ...

  6. 用 Python分析朋友圈好友的签名

    需要用到的第三方库: numpy:本例结合wordcloud使用 jieba:对中文惊进行分词 PIL: 对图像进行处理(本例与wordcloud结合使用) snowlp:对文本信息进行情感判断 wo ...

  7. Airtest爬朋友圈并生成中文词云图

    使用Airtest来爬取朋友圈的内容.参考链接,参考链接中的手机滑动的功能在我的实际操作过程不可使用,故对其进行改动. 该部分整体代码如下: # -*- encoding=utf8 -*- __aut ...

  8. uni H5微信内自定义分享朋友圈/好友带图片 标题

    先来看一下对比效果图 一:绑定域名 先登录微信公众平台进入"公众号设置"的"功能设置"里填写"JS接口安全域名". 备注:登录后可在&quo ...

  9. Python玩转微信 个性签名生成词云图

    本博客代码参照http://www.cnblogs.com/jiaoyu121/p/6944398.html. 运行如下代码之前,将下图的wechat.jpg放入F盘下,需安装itchat.jieba ...

最新文章

  1. 一个 SpringBoot 项目该包含哪些?
  2. stm32篇--系统初始化
  3. 使用Eclipse创建Web工程后未生成web.xml文件
  4. php工具箱mysql停止进程_PHP进程卡死和MySQL超时时间的设置方法
  5. 数字孪生技术如何实现复制世界?关键的关键是…
  6. 高清晰桌面壁纸,视觉控不用到处找尽在高图网
  7. 摘抄:java查询数据导出excel并返回给浏览器下载
  8. 基于JAVA的ICQ系统的设计于实现
  9. IBM发展过程中给我们带来什么启示?
  10. JOB SERVER 负载均衡
  11. 注册表知识:HKEY_LOCAL_MACHINE根键详解
  12. java ca认证_java编程方式生成CA证书
  13. 单目标应用:足球联赛竞争算法(Soccer league competition algorithm,SLC)求解多仓库多旅行商问题MD-MTSP(可更改旅行商个数及起点)
  14. 中国机器视觉市场研究报告
  15. 某网站X-Signature签名破解
  16. Python3中打开文件的方式(With open)
  17. P2p流媒体直播与视频会议有什么不同?
  18. VMware安装的虚拟机窗口如何自适应屏幕大小
  19. 编译原理课后题答案 龙书 机械工业出版社
  20. 郑清2461 我是签到题

热门文章

  1. 解决谷歌浏览器(chrome)不能登录,不能同步的最简单方法!
  2. docker概述(2)
  3. Dr. Dre卖耳机,荣登嘻哈歌手收入榜首
  4. Vscode——jupyter安装
  5. 关于海外的应用商店优化
  6. 20、路由器的组成及分组交换过程
  7. 什么是装箱(boxing)和拆箱(unboxing)?
  8. C++ perimer plus 第三章!
  9. prctl()为线程指定名字
  10. java中密码修改核心代码_彻底告别加解密模块代码拷贝-JCE核心Cpiher详解