Jieba库与wordcloud库的学习汇总
学习了python之后想把python的一些知识再汇总一遍
jieba库的常用函数:
函数 | 描述 |
---|---|
jieba.lcut() | 精确模式,返回一个列表类型的分词结果;jieba.lcut(“中国是一个伟大的国家” ) -> [‘中国’,‘是’,‘一个’,‘伟大’,‘的’,‘国家’] |
jieba.lcut(s,cut_all=True) | 全模式,返回一个列表类型的分词结果,存在冗余;jieba.lcut(“中国是一个伟大的国家” ,cut_all=True) -> [‘中国’,’'国事‘,‘一个’,‘伟大’,‘的’,‘国家’] |
jieba.lcut_for_search(s) | 搜索引擎模式,返回一个列表类型的分词结果,存在冗余;jieba.lcut_for_search(“中华人民共和国是一个伟大的国家”) -> [‘中华’,’'华人‘,‘人民’,‘共和’,‘共和国’,‘中华人民共和国’,‘是’,‘伟大’,‘的’] |
jieba.add_word(w) | 向分词词典增加新词w ; jieba.add_word(“蟒蛇语言”) |
Wordcloud库的常规方法:
w = wordcloud.WordCloud()
方法 | 描述 |
---|---|
w.generate(txt) | 向WordCloud对象w中加载文本txt;w.generate(“Python and WordCloud”) |
w.to_file(filename()) | 将词云输出为图像文件,.png或.jpg格式;w.tp_file(“outfile,png”) |
w = wordcloud.WordCloud(<参数>)
参数 | 描述 |
---|---|
width | 指定词云对象生成图片的宽度,默认400像素;w = wordcloud.WordCloud(width=600) |
feight | 指定词云对象生成图片的高度,默认200像素;w = wordcloud.WordCloud(height=600) |
min_font_size | 指定词云中的最小字号,默认4号;w=wordcloud.WordCloud(min_font_size=10) |
max_font_size | 指定词云中的最大字号,根据高度自动调节;w=wordcloud.WordCloud(max_font_size=20) |
font_step | 指定词云中的字体字号的步进间隔,默认为1;w=wordcloud.WordCloud(font_step=2) |
font_path | 指定文件的路径,默认None;w=wordcloud.WordCloud(font_path=“msyh.ttc”) |
max_words | 指定词云现实的最大单词数量,默认200;w=wordcloud.WordCloud(max_words=20) |
stop_words | 指定词云的排除词列表,即不显示的单词列表;w=wordcloud.WordCloud(stop_words={“Python”}) |
mask | 指定词云形状,默认为长方形,需要用imread()函数;from scipy.misc import imread /nmk = imread(“pic.png”) /n w=wordcloud.WordCloud(mask=mk) |
background_color | 指定词云图片的背景颜色,默认为黑色;w=wordcloud.WordCloud(background_color=“white”) |
Jieba库与wordcloud库的学习汇总相关推荐
- 利用jieba库和wordcloud库,进行中文词频统计并利用词云图进行数据可视化
目录 利用jieba库和wordcloud库,进行中文词频统计并利用词云图进行数据可视化 安装jieba库 安装wordcloud 打开pycharm 编写代码 利用jieba库和wordcloud库 ...
- jieba库、wordcloud库
一.jieba库 jieba.lcut(str):精准模式,返回一个列表类型,将字符串分割成等量的中文词组 jieba.lcut(str, cut_all = True):全模式,将字符串可能的所有分 ...
- Python库:wordcloud库介绍、政府工作报告词云、自定义背景词云
一.wordcloud库 二.使用wordcloud库 注:库名wordcloud全部是小写,而WordCloud对象W和C大写 简单说,绘制一个词云有三步: 第一.生成词云对象WordCloud,并 ...
- jieba分词库、WordCloud词云库、requests库
python学习 jieba--分词库 安装jieba库 支持三种分词模式 WordCloud--生成词云库 安装WordCloud库 使用 requests 库 安装 requests 的 get ...
- 第三方库实现中文词频分析和词语可视化(jieba,wordcloud库)
jieba,wordcloud库实现中文词频分析和词语可视化 文章目录 前言: 一.实验题目: 二.实验准备: 三.实验内容 1.全部代码: 2.实验结果: 3.难点分析: 结语: 前言: 这篇文章是 ...
- 17 wordcloud库的使用
一.wordcloud库基本介绍 1.wordcloud库概述 wordcloud是优秀的词云展示第三方库 2.wordcloud库的安装 (cmd命令行)pip install wordcloud ...
- java ltp4j_博客 | 收藏 | 100多个DL框架、AI库、ML库、NLP库、CV库汇总,建议收藏!...
原标题:博客 | 收藏 | 100多个DL框架.AI库.ML库.NLP库.CV库汇总,建议收藏! 本文原载于微信公众号:AI部落联盟(AI_Tribe),AI研习社经授权转载.欢迎关注 AI部落联盟 ...
- python官网如何下载wordcloud_分享一种下载python第三方库wordcloud库的一种方法
这周我在学习python过程中,我接触到了wordcloud库,因为它是python的第三方库,需要通过下载才能够继续使用.因为上周在学习下载第三方库jieba库后,我已经知道了下载python的第三 ...
- Python_note7 文件和数据格式化+wordcloud库
文件使用 文件 文本文件 - - -二进制文件 本质上多有的文件都是二进制形式存储,形式上文件采用两种方式展示 文本文件由单一特定编码组成的文件,如UTF-8编码,被看成存储着的长字符串(.txt,. ...
- python如何安装wordcloud_基于python的wordcloud库的安装方法
基于python的wordcloud是最近十分流行的一项技术,而在学习这门技术之前,一定要学会安装.下面给大家介绍一下wordcloud的安装步骤. Tip: python第三方组件有很多都是whl文 ...
最新文章
- proxy实现 mysql 读写分离
- Strategy_Requirement1
- 未指定发送trap的源接口_组播之RPF接口检测
- java 导出excel教程_Java导出Excel表格
- linux 网卡 巨帧,Linux Kernel e1000e驱动巨型帧处理绕过安全检查漏洞
- 华为正准备发布属于自己的手机操作系统;腾讯已经交出了首张产业互联网成绩单……...
- 无法将文件“ “复制到“bin\*.*”。对路径“bin\*.*”的访问被拒绝。 解决方法
- UITableView分段加载数据
- [资源]世界国家中英文名称以及地区区号json格式
- python模拟ios点击_使用Xcode + Python进行IOS运动轨迹模拟
- [学习笔记]Windows CMD/bat
- 探索C++0x: 1. 静态断言(static_assert)
- Houdini 导出.ass文件
- dcloud进行android离线打包 需要继承io.dcloud.application.DCloudApplication的问题
- OpenMeetings安装
- sass、scss、css、less
- 生动理解关联规则——Apriori算法
- 关于毕业设计的一些小总结
- C++中inet_pton、inet_ntop函数
- poscms基础问题汇总