NLP之WordCloud:基于jieba+matplotlib库对一段文本生成词云图~~情人节最好的礼物(给你一张过去的词云图,看看那时我们的爱情)
NLP之WordCloud:基于jieba+matplotlib库对一段文本生成词云图~~情人节最好的礼物(给你一张过去的词云图,看看那时我们的爱情)
目录
输出词云图结果
输出文本统计
设计思路
实现代码
Python词云图:情人节最好的礼物——给你一张过去的词云图,看看那时我们的爱情
输出词云图结果
输出文本统计
segment 计数
64 热水 14
32 喜欢 8
1 一只 3
21 几个 3
17 你好 3
49 打电话 2
31 啄木鸟 2
7 不爱 2
80 请问 2
18 兔子 2
59 模仿 2
60 洗个 1
63 漂亮 1
62 游戏规则 1
61 游戏吧 1
58 样子 1
66 猜猜看 1
57 松松 1
56 本来 1
55 最帅 1
54 昨天 1
53 无聊 1
52 放在眼里 1
51 放在心里 1
50 撤回 1
65 爱不爱 1
0 一位 1
67 玩个 1
78 脑子里 1
87 问个 1
.. ... ..
11 两分钟 1
10 东西 1
9 不行 1
8 不累 1
6 不到 1
5 下半年 1
4 上半年 1
3 七月 1
2 一整天 1
23 又触 1
24 反正 1
25 变个 1
37 姑娘 1
45 想见 1
43 快给我 1
42 忘记 1
41 当成 1
40 度过 1
39 干什么 1
38 师傅 1
36 好不好 1
26 只能 1
35 女人 1
34 天桥 1
33 嘴巴 1
30 哈哈哈 1
29 命里 1
28 名花 1
27 右手 1
88 魔术 1
设计思路
实现代码
#输出词云图代码bimg=imread('data_input/NLP_images/heart.jpeg')
wordcloud = WordCloud(background_color="white", #背景颜色mask=bimg,font_path=r"C:\Windows\Fonts\STXINGKA.TTF") #使用指定的字体库
wordcloud.generate(str(words_df))bimgColors=ImageColorGenerator(bimg)
plt.axis("off")
plt.imshow(wordcloud.recolor(color_func=bimgColors))
plt.title("给你一张过去的词云图,看看那时我们的爱情")
plt.show()
NLP之WordCloud:基于jieba+matplotlib库对一段文本生成词云图~~情人节最好的礼物(给你一张过去的词云图,看看那时我们的爱情)相关推荐
- 基于 transformers 的 generate() 方法实现多样化文本生成:参数含义和算法原理解读
一.前言 最近在做文本生成,用到huggingface transformers库的文本生成 generate() 函数,是 GenerationMixin 类的实现(class transforme ...
- Python安装Matplotlib,wordcloud,jieba第三方库
以下安装都在cmd窗口下操作 1.安装Matplotlib python -m pip install -U pip setuptools python -m pip install matplot ...
- 基于结构化数据的文本生成:非严格对齐生成任务及动态轻量的GCN生成模型
作者|邴立东.程丽颖.付子豪.张琰等 单位|阿里巴巴达摩院.香港中文大学等 摘要 基于结构化数据生成文本(data-to-text)的任务旨在生成人类可读的文本来直观地描述给定的结构化数据.然而,目前 ...
- 妙笔生花:一个易用、高效的文本生成开源库
文本生成作为近年来自然语言处理中的热门领域,受到了学界和工业界的广泛关注.随着研究的不断深入,文本生成领域下的子任务和相应的模型越来越丰富,一些优秀的开源框架也纷纷涌现. 现有的开源文本生成库大致可分 ...
- 文本生成与自动摘要:基于生成式预训练Transformer的实现与优化
作者:禅与计算机程序设计艺术 1.简介 文本生成是自然语言处理领域中非常重要的问题之一.在不断地探索学习新知识和技能的同时,越来越多的人也需要通过自己创造或整合的手段,将自己的想法.观点和信息转化成语 ...
- python jieba库分词_Python基于jieba库进行简单分词及词云功能实现方法
本文实例讲述了Python基于jieba库进行简单分词及词云功能实现方法.分享给大家供大家参考,具体如下: 目标: 1.导入一个文本文件 2.使用jieba对文本进行分词 3.使用wordcloud包 ...
- python使用matplotlib库构建动态图表 --基于animation模块
前言 熟悉python数据分析的朋友一定对matplotlib库不陌生,这是做数据可视化最常用的包之一.虽然我们经常使用mattplotlib做一些静态的图表,比如折线图,柱状图,饼图等等,但是某些时 ...
- 可视化之瀑布图的绘制--基于matplotlib库
可视化之瀑布图的绘制--基于matplotlib库 第一步:前期准备-导入数据 第二步:打好基础1-画出堆叠柱形图的样子 第三步:打好基础2-并排柱形图 第四步:瀑布图成形 第五步:瀑布图优化1-柱体 ...
- NLP算法-基于 Jieba 的词频统计
基于 Jieba 的词频统计 什么是词频统计 基于Jieba的词频统计 1.分词器 2.分词后的统计 测试说明 demo 什么是词频统计 在一份给定的文件里,词频(term frequency,TF) ...
最新文章
- 51单片机可以做什么实用的产品?
- (转载)linux如何设置为低内核启动(降核)
- web服务器的文档根目录,web服务器根目录中
- C# 以管理员身份运行程序
- [折半搜索][has] Jzoj P4250 路径
- 三极管驱动(讲的比较好)
- YYT 0659 - 2008全自动凝血分析仪
- java 计算随机数_JAVA获取随机数
- MyBatis 原理
- java 与c des_Java和C/C++进行DES/AES密文传输
- gitlab 删除分支_idea gitlab 分支 pull、push 实践笔记
- .net core 图片合并,图片水印,等比例缩小,SixLabors.ImageSharp
- linux之终端的灵活使用。SCREEN
- 定位相关MATLAB仿真代码与在线MATLAB仿真平台
- bin文件无法生成,Error: Q0147E: Failed to create Directory ./Flora_GD32.bin\ER$$.ARM.__AT_0x000000C0: File
- javascript模块化编程思想(转载网上专家)Javascript模块化编程(一)
- 马斯克的底层思维方式
- 【bsauce读论文】 Playing for K(H)eaps: Understanding and Improving Linux Kernel Exploit Reliability
- Linux 的父进程和子进程的执行情况(附有案例代码)
- Gate用户手册(二)怎样运行Gate以及可视化