Pyhton精讲day11--综合案例三国人物出场频次分析
综合案例三国人物出场频次分析
# 读取文本数据
import jieba
with open('./data/threekingdom.txt', mode='r', encoding='UTF-8') as f:data = f.read()# print(data)print(type(data))print(len(data))# 进行中文分词word_ls = jieba.lcut(data)# print(word_ls)print(len(word_ls))counts = {}# 过滤短数据for word in word_ls:if len(word) < 2:continuecounts[word] = counts.get(word, 0) + 1# print(counts)# 删除 非人名的高频词counts['孔明'] = counts['孔明'] + counts['孔明曰']counts['刘备'] = counts['玄德'] + counts['玄德曰'] + counts['刘备']counts['关公'] = counts['关公'] + counts['云长']# 停词表stop_words = {'将军', '却说', '丞相', '二人', '不可', '荆州', '不能', '商议', '如何', '孔明曰', '玄德曰', '如此', '主公', '军士', '军马', '左右','次日', '引兵', '大喜', '天下', '东吴', '于是', '玄德', '云长', '今日', '不敢', '魏兵', '陛下', '都督'}for word in stop_words:del counts[word]# 排序ls = list(counts.items())ls = sorted(ls, key=lambda x: x[1], reverse=True)# 存储到本空间with open('./data/result.txt', mode='w', encoding='utf-8') as f:f.write('人物名\t出场频次\n')for role, nums in ls[:10]:print(role, nums)f.write(f'{role}\t{nums}\n')
使用词云对数据进行展示
# 读取文本数据
import jieba
import imageiomask = imageio.imread('./data/china.png')
from wordcloud import WordCloud
with open('./data/threekingdom.txt', mode='r', encoding='UTF-8') as f:data = f.read()# print(data)print(type(data))print(len(data))# 进行中文分词word_ls = jieba.lcut(data)text = " ".join(word_ls)wc = WordCloud(background_color='white',width=600,height=600,font_path='./data/MSYH.TTC',mask = mask)wc.generate(text)wc.to_file('三国词云.png')
Pyhton精讲day11--综合案例三国人物出场频次分析相关推荐
- 深度学习核心技术精讲100篇(四十六)-情感分析算法在阿里小蜜的应用实践
前言 人机对话一直是自然语言处理领域内的重要研究方向之一,近年来随着人机交互技术的进步,对话系统正逐渐走向实际应用.其中,智能客服系统受到了很多企业尤其是中大型企业的广泛关注.智能客服系统旨在解决传统 ...
- 深度学习核心技术精讲100篇(一)-数据分析中有哪些分析指标?
前言 许多刚入门数据分析的小伙伴对一些数据指标或者数据本身的概念很模糊,尤其是当跟运营.数据分析师扯需求的时候,会被这些密密麻麻的指标给弄糊涂. 作为互联网从业人员,目前看来对数据指标.指标的运用还是 ...
- 图解大数据 | 综合案例-使用Spark分析挖掘零售交易数据
作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/84 本文地址:http://www.showmeai.tech/article-det ...
- acm新手小白必看系列之(9)——栈精讲及例题
acm新手小白必看系列之(9)--栈精讲及例题 先进栈后出栈 可以把栈想象成一个上端开口的杯子.... 栈只能定义为在一端进行插入和删除操作 1.程序员问题 程序员输入程序出现差错时,可以采取以下的补 ...
- PyTorch深度学习入门与实战(案例视频精讲)
作者:孙玉林,余本国 著 出版社:中国水利水电出版社 品牌:智博尚书 出版时间:2020-07-01 PyTorch深度学习入门与实战(案例视频精讲)
- oracle数据库sql培训,Oracle数据库SQL语言实战培训教程(全面、详细、案例、精讲)套餐...
风哥oracle数据库SQL语言实战培训教程(案例.精讲)套餐,DBA必备技能. 套餐介绍: 风哥Oracle数据库SQL语言实战培训教程(案例.精讲)套餐,DBA必备技能. 内容: SQL语言基础入 ...
- linux定时任务Crond生产规范案例精讲09
linux定时任务Crond生产规范案例精讲09说明:本文来自老男孩linux运维实战培训-就业课程视频内容,本文内容为系列内容,更多分享信息见:http://oldboy.blog.51cto.co ...
- 视频教程-2019年人工智能热门案例精讲之P图美化照片-深度学习
2019年人工智能热门案例精讲之P图美化照片 香港大学硕士.任职经历包括微软中国(Microsoft),今日头条研发中心,联想香港人工智能中心以及联合国亚太分部.现主要工作是利用深度学习实现基于知识图 ...
- 墨客网java_墨客网-知识拆解+经典定时任务案例 精讲Java定时任务框架Elastic-Job和Quartz...
课程介绍 精讲Elastic-job + Quartz实现企业级定时任务 掌握分布式集群方式的定时任务框架,可以弥补企业中常用的单点任务的缺点,以更高的性能更好的稳定性处理分布式定时任务服务:本课程带 ...
最新文章
- 宏的使用 extern
- EMQ服务器问题处理及分析
- Some Essential JavaScript Questions And Answers(1)
- 地平线机器人_地平线机器人CEO余凯:基于深度学习的自动驾驶之路
- LeetCode MySQL 550. 游戏玩法分析 IV
- Windows 2003 上使用 Windows Live Writer
- linux中mac地址路径,MAC地址
- 2021年中国蛋鸡养殖设备市场趋势报告、技术动态创新及2027年市场预测
- c语言让参数等于空字符串,C语言模拟实现字符串操作函数
- AsyncTask更新UI线程的基本原理
- Docker 镜像、容器 常用命令,容器与宿主服务器文件复制
- springmvc实现多图片上传
- C#事件和委托的区别
- variable selection
- 中国互联网用户各阶级的分析
- 3ds Max 布尔(Boolean)运算——象棋的制作
- python猜字游戏
- Codingame平台“CHUCK NORRIS”的Python实现
- 荧光平均值计算matlab,科学网—使用Image J进行自动荧光定量分析 - 陆绮的博文...
- Java虚拟机知识点快速复习手册(上)
热门文章
- transferto方法的应用_FileChannel中transferTo方法的使用
- 国内首座空腹式钢混组合连续桥梁建成通车
- mysql 加密 tde_数据加密 - TDE透明数据加密原理
- android通知栏自定义view,android WindowManager addView 仿悬浮式通知栏
- Android 音乐播放器制作(带有通知栏、Widget小挂件)
- 28份R语言文档沟通推文汇总
- EtherCAT igh主站控制松下伺服(csp模式)
- 原装HID读卡器,我们的价格只是别人的七折、八折或九折!
- php post翻页,php的POST值 如何连续跨页传递(不用表单)?
- Mysql主从异常 表被回滚_Mysql主从同步 异常Slave_SQL_Running: No