nltk里面重要的函数

一、similar

用来识别文章中和搜索词相似的词语,可以用在搜索引擎中的相关度识别功能中。

text1.similar("monstrous")

查询出了text1中与monstrous相关的所有词语:

二、common_contexts

用来识别2个关键词相似的词语。

text2.common_contexts(["monstrous","very"])

三、generate

用来自动生成文章。

text3.generate()

四、len

可以用于判断重复词密度

from __future__ import divisionlen(text3) / len(set(text3))

图中显示 正文字数/不重复词语字数 = 16,说明有15/16是无效字符。

五、count

可以用于判断关键词密度。

text3.count('smote') / len(text3)

自然语言处理-nltk学习(二)相关推荐

  1. 自然语言处理-nltk学习(一)

    NLTK库安装 pip install nltk 执行python并下载书籍: [root@centos #] python Python 2.7.11 (default, Jan 22 2016, ...

  2. NLTK学习笔记(一)

    NLTK学习笔记(一) 文章目录 NLTK学习笔记(一) 一.概述 二.NLTK语料库 2.1 语料库处理API 三.分词和分句 四.词频统计 五.单词分布 六.词性标注 七.去除停用词 八.NLTK ...

  3. python自然语言处理案例-Python自然语言处理 NLTK 库用法入门教程【经典】

    本文实例讲述了Python自然语言处理 NLTK 库用法.分享给大家供大家参考,具体如下: 在这篇文章中,我们将基于 Python 讨论自然语言处理(NLP).本教程将会使用 Python NLTK ...

  4. python学到哪知道baseline_Python NLTK学习6(创建词性标注器)

    Python NLTK学习6(创建词性标注器) 发表于: 2017年1月5日  阅读: 6487 除特别注明外,本站所有文章均为小杰Code原创 本系列博客为学习<用Python进行自然语言处理 ...

  5. 机器学习之深度学习 二分类、多分类、多标签分类、多任务分类

    多任务学习可以运用到许多的场景. 首先,多任务学习可以学到多个任务的共享表示,这个共享表示具有较强的抽象能力,能够适应多个不同但相关的目标,通常可以使主任务获取更好的泛化能力. 此外,由于使用了共享表 ...

  6. 【自然语言处理】【多模态】CLIP:从自然语言监督中学习可迁移视觉模型

    从自然语言监督中学习可迁移视觉模型 <Learning Transferable Visual Models From Natural Language Supervision> 论文地址 ...

  7. 知识图谱论文阅读(八)【转】推荐系统遇上深度学习(二十六)--知识图谱与推荐系统结合之DKN模型原理及实现

    学习的博客: 推荐系统遇上深度学习(二十六)–知识图谱与推荐系统结合之DKN模型原理及实现 知识图谱特征学习的模型分类汇总 知识图谱嵌入(KGE):方法和应用的综述 论文: Knowledge Gra ...

  8. Python自然语言处理 NLTK 库用法入门教程【经典】

    @本文来源于公众号:csdn2299,喜欢可以关注公众号 程序员学府 本文实例讲述了Python自然语言处理 NLTK 库用法.分享给大家供大家参考,具体如下: 在这篇文章中,我们将基于 Python ...

  9. python 命名实体识别_Python NLTK学习11(命名实体识别和关系抽取)

    Python NLTK学习11(命名实体识别和关系抽取) 发表于: 2017年7月27日  阅读: 18262 除特别注明外,本站所有文章均为小杰Code原创 本系列博客为学习<用Python进 ...

最新文章

  1. 推荐模型是怎样由窄变宽、越变越深的?
  2. 富文本编辑器 CKeditor
  3. Myeclipse8.6中安装SVN插件
  4. DB2 SQL Error: SQLCODE=-668, SQLSTATE=57016错误解决方法
  5. python八大排序算法 间书_Python 八大排序算法速度比较
  6. 任务21 :了解ASP.NET Core 依赖注入,看这篇就够了
  7. 十六进制高低位转换,返回十进制数
  8. Microsoft Office 2019 正式版 安装记录
  9. 数字锁相环:二阶环的FPGA实现(基于quartus+matlab)
  10. win10计算机控制面板在哪里,教您win10控制面板在哪
  11. 计算机研究生要发论文,电子科大毕业计算机研究生需要发表论文吗
  12. 鸿蒙系统翻车了,华为鸿蒙系统“翻车了”?被质疑抄袭安卓11系统,事实并非如此...
  13. JS拉起支付宝,并加好友
  14. java map扩容机制_Java HashMap的原理、扩容机制、以及性能思考
  15. (转)云计算的三种模式:IaaS、PaaS和SaaS 通俗理解
  16. LVM管理详解手册(LVM创建、LVM扩容、LV减容)
  17. Linaro ubuntu for arndale octa烧写步骤
  18. Undefined control sequence. \begin{document}
  19. 二、大话HTTP协议-HTTP报文结构整体窥探
  20. 谜语大全及答案api调用实现

热门文章

  1. 简洁易懂:c:out标签详解
  2. 为什么B+树比B树更适合做数据库索引
  3. C++编程练习:设计一个银行账户类,包含户名、帐号以及当前余额属性,并且能完成开户、存款、取款和查询余额等行为。
  4. notepad json格式化插件_Prettier + ESLint VSCode 插件配置指南
  5. android wifi信号通道,Android获取当前连接wifi的信道
  6. oracle+中子分类账,【勇猛精进】Oracle EBS R12 总帐和子分类账关系详解
  7. linux最简单的查杀病毒,linux查杀病毒的几个思路
  8. 30可以刷什么系统_刷脸支付系统可以对接原来的收银系统吗?
  9. 字符串操作 c语言,C语言字符串操作(示例代码)
  10. 在线ocr文字识别_PandaOCR:最佳免费 OCR 文字识别工具