自然语言处理-nltk学习(二)
nltk里面重要的函数
一、similar
用来识别文章中和搜索词相似的词语,可以用在搜索引擎中的相关度识别功能中。
text1.similar("monstrous")
查询出了text1中与monstrous相关的所有词语:
二、common_contexts
用来识别2个关键词相似的词语。
text2.common_contexts(["monstrous","very"])
三、generate
用来自动生成文章。
text3.generate()
四、len
可以用于判断重复词密度
from __future__ import divisionlen(text3) / len(set(text3))
图中显示 正文字数/不重复词语字数 = 16,说明有15/16是无效字符。
五、count
可以用于判断关键词密度。
text3.count('smote') / len(text3)
自然语言处理-nltk学习(二)相关推荐
- 自然语言处理-nltk学习(一)
NLTK库安装 pip install nltk 执行python并下载书籍: [root@centos #] python Python 2.7.11 (default, Jan 22 2016, ...
- NLTK学习笔记(一)
NLTK学习笔记(一) 文章目录 NLTK学习笔记(一) 一.概述 二.NLTK语料库 2.1 语料库处理API 三.分词和分句 四.词频统计 五.单词分布 六.词性标注 七.去除停用词 八.NLTK ...
- python自然语言处理案例-Python自然语言处理 NLTK 库用法入门教程【经典】
本文实例讲述了Python自然语言处理 NLTK 库用法.分享给大家供大家参考,具体如下: 在这篇文章中,我们将基于 Python 讨论自然语言处理(NLP).本教程将会使用 Python NLTK ...
- python学到哪知道baseline_Python NLTK学习6(创建词性标注器)
Python NLTK学习6(创建词性标注器) 发表于: 2017年1月5日 阅读: 6487 除特别注明外,本站所有文章均为小杰Code原创 本系列博客为学习<用Python进行自然语言处理 ...
- 机器学习之深度学习 二分类、多分类、多标签分类、多任务分类
多任务学习可以运用到许多的场景. 首先,多任务学习可以学到多个任务的共享表示,这个共享表示具有较强的抽象能力,能够适应多个不同但相关的目标,通常可以使主任务获取更好的泛化能力. 此外,由于使用了共享表 ...
- 【自然语言处理】【多模态】CLIP:从自然语言监督中学习可迁移视觉模型
从自然语言监督中学习可迁移视觉模型 <Learning Transferable Visual Models From Natural Language Supervision> 论文地址 ...
- 知识图谱论文阅读(八)【转】推荐系统遇上深度学习(二十六)--知识图谱与推荐系统结合之DKN模型原理及实现
学习的博客: 推荐系统遇上深度学习(二十六)–知识图谱与推荐系统结合之DKN模型原理及实现 知识图谱特征学习的模型分类汇总 知识图谱嵌入(KGE):方法和应用的综述 论文: Knowledge Gra ...
- Python自然语言处理 NLTK 库用法入门教程【经典】
@本文来源于公众号:csdn2299,喜欢可以关注公众号 程序员学府 本文实例讲述了Python自然语言处理 NLTK 库用法.分享给大家供大家参考,具体如下: 在这篇文章中,我们将基于 Python ...
- python 命名实体识别_Python NLTK学习11(命名实体识别和关系抽取)
Python NLTK学习11(命名实体识别和关系抽取) 发表于: 2017年7月27日 阅读: 18262 除特别注明外,本站所有文章均为小杰Code原创 本系列博客为学习<用Python进 ...
最新文章
- 推荐模型是怎样由窄变宽、越变越深的?
- 富文本编辑器 CKeditor
- Myeclipse8.6中安装SVN插件
- DB2 SQL Error: SQLCODE=-668, SQLSTATE=57016错误解决方法
- python八大排序算法 间书_Python 八大排序算法速度比较
- 任务21 :了解ASP.NET Core 依赖注入,看这篇就够了
- 十六进制高低位转换,返回十进制数
- Microsoft Office 2019 正式版 安装记录
- 数字锁相环:二阶环的FPGA实现(基于quartus+matlab)
- win10计算机控制面板在哪里,教您win10控制面板在哪
- 计算机研究生要发论文,电子科大毕业计算机研究生需要发表论文吗
- 鸿蒙系统翻车了,华为鸿蒙系统“翻车了”?被质疑抄袭安卓11系统,事实并非如此...
- JS拉起支付宝,并加好友
- java map扩容机制_Java HashMap的原理、扩容机制、以及性能思考
- (转)云计算的三种模式:IaaS、PaaS和SaaS 通俗理解
- LVM管理详解手册(LVM创建、LVM扩容、LV减容)
- Linaro ubuntu for arndale octa烧写步骤
- Undefined control sequence. \begin{document}
- 二、大话HTTP协议-HTTP报文结构整体窥探
- 谜语大全及答案api调用实现
热门文章
- 简洁易懂:c:out标签详解
- 为什么B+树比B树更适合做数据库索引
- C++编程练习:设计一个银行账户类,包含户名、帐号以及当前余额属性,并且能完成开户、存款、取款和查询余额等行为。
- notepad json格式化插件_Prettier + ESLint VSCode 插件配置指南
- android wifi信号通道,Android获取当前连接wifi的信道
- oracle+中子分类账,【勇猛精进】Oracle EBS R12 总帐和子分类账关系详解
- linux最简单的查杀病毒,linux查杀病毒的几个思路
- 30可以刷什么系统_刷脸支付系统可以对接原来的收银系统吗?
- 字符串操作 c语言,C语言字符串操作(示例代码)
- 在线ocr文字识别_PandaOCR:最佳免费 OCR 文字识别工具