《人民的名义》的小说原文下载地址

https://github.com/jxq0816/algorithm-model/blob/master/word2vec-gensim/in_the_name_of_people.txt

我们首先使用结巴进行分词,分词的结果放到另一个文件中,加入下面的一串人名是为了结巴分词能更准确的把人名分出来。

# encoding = utf-8
import jieba
import jieba.analysejieba.suggest_freq('沙瑞金', True)
jieba.suggest_freq('田国富', True)
jieba.suggest_freq('高育良', True)
jieba.suggest_freq('侯亮平', True)
jieba.suggest_freq('钟小艾', True)
jieba.suggest_freq('陈岩石', True)
jieba.suggest_freq('欧阳菁', True)
jieba.suggest_freq('易学习', True)
jieba.suggest_fre

NLP实战 | 使用《人民的名义》的小说原文训练一个word2vec模型相关推荐

  1. 小虎对《人民的名义》小说人物人名研究V0.1

    小虎对<人民的名义>小说人物人名研究V0.1      每篇小说的作者都会小说里的人物的名字,下过功夫,做过研究的,深思熟虑,才给对应的人物取个名字,有寓意,有所指,跟人物的性格,命运紧紧 ...

  2. 人民的名义》小说文本分析

    你只要不干坏事,就没人能坏你的事. --<人民的名义>经典语录 <人民的名义>,听说很好看.一向不喜欢看电视的我还是想了解一下这部剧,可是又不想花时间去看剧,怎么办呢?我就考虑 ...

  3. 《人民的名义》小说文本分析

    又是一年毕业季,什么工作好找.工资高.哪些地域有优势等就是很多人关注的话题了.这里用一份2017年初,含有32万条数据(行).19个详细招聘信息(列)的数据进行招聘信息的知识发现.挖掘. 数据部分截图 ...

  4. 基于 jieba 和 word_cloud 生成《人民的名义》小说词云

    基于 jieba 和 word_cloud 生成<人民的名义>小说词云 由于词云在反映文本关键信息上的显著优势,在本文中,我选择结合实例为大家介绍一下 Python 中专门用来生成词云的一 ...

  5. 何洋开讲丨深度分析!《人民的名义》样片泄露内幕

    <人民的名义>这部长达50多集.引爆全民追剧风潮的"神剧"终于迎来收尾.我很少看电视剧,但这部剧编剧走心.制作精良.戏骨云集,让包括我在内的观众们欲罢不能.但就在剧情进 ...

  6. 《人民的名义》---简单的文本分析

    我们都知道进行自然语言处理的第一步就是分词,下面使用jieba模块对最近比较热的电视剧<人民的名义>进行分词,并对它进行一些简单的文本分析. 一.jieba模块中常用的方法说明(githu ...

  7. 《人民的名义》达康书记的同款火了,另一爆款“天网工程”你也有

    <人民的起义>,不,是<人民的名义>火了,达康书记的表情包成了新一代网红,连同款水杯都成为淘宝爆款.作为一个安防小编,也是被剧中各种安防设备亮瞎眼,满大街的视频监控,场景中的车 ...

  8. NLP实战:利用Python理解、分析和生成文本 | 赠书

    导读:本文内容参考自<自然语言处理实战:利用Python理解.分析和生成文本>一书,由Hobson Lane等人所著. 本书是介绍自然语言处理(NLP)和深度学习的实战书.NLP已成为深度 ...

  9. 提升 NLP 实战技能的一点建议

    作为最典型的 AI 领域之一,NLP  (自然语言处理,Natural Language Processing) 被誉为"人工智能皇冠上的明珠",这些年也是越来越热门,基本上是各大 ...

最新文章

  1. 照相机模型与增强现实(相机标定)
  2. python密码测试代码_python使用正则表达式检测密码强度源码分享
  3. 2016最新cocoapods版本更新,以及多个版本的问题
  4. 编程链接[2009-8-26更新]
  5. python tushare获取股票数据并可视化_荐Python获取股票数据及其可视化--基于tushare库...
  6. nginx 带宽_Nginx日志如何分析 GoAccess
  7. C#基础12.1:Object类
  8. python基础之字典、集合
  9. 河南省学业水平测试计算机题目,2015级河南学业水平考试试题及答案
  10. web 在线word编辑器
  11. 三轴加速度传感器的类型、原理、特点和应用
  12. 图像分类以及经典的分类模型
  13. 春日街拍夯货 原来你离时尚只有一道水波纹的距离
  14. 二进制炸弹实验binarybomb 拆弹
  15. 英语,程序员永远的痛???//“不要倒在起跑线上”课程介绍
  16. 餐饮行业的营销策略是什么?
  17. iOS应用开发入门(1)——第一个iOS应用
  18. 广电网络电视怎么服务器连接中断,怎么解决广电网络看电视卡
  19. u8文件服务器错误,u8提示文件服务器未配置
  20. 稀疏表示理论问题优化模型

热门文章

  1. 计算机网络的核心技术,计算机网络技术的核心技术领域应用分析
  2. html如何通过路径查找图片,css添加图片怎样找图片路径?
  3. 简历零经验的小白怎么写好简历?
  4. message:Error: 系统错误,错误码:80051,source size 3962KB exceed max limit 2MB [20220819 14:42:38][wx21e41af1
  5. 音频基础学习二——声音的波形
  6. 根据菜鸟教程自学html的目录
  7. php格式视频苹果手机,苹果手机可以播放的视频格式有哪些?
  8. arcgis for js叠加栅格图层(Raster Layer)
  9. python下载量化策略_掘金量化Python经典策略.pdf
  10. SkyEye助力飞控软件Debug