书中-就职演说语料库这个小程序统计词汇america和citizen随时间推移的使用情况这个小程序有点bug,我电脑python版本(Python 3.6.1)

原书中代码是

>>> cfd=nltk.ConditionalFreqDist(
...    (target,file[:4])
...     for fileid in inaugural.fileids()
...     for w in inaugural.words(fileid)
...     for target in ['america','citizen']
...     if w.lower().startswith(target))
>>>
>>> cfd.plot()

这里改成下面的就可以运行了file[:4] -> fileid[:4]:

>>> cfd=nltk.ConditionalFreqDist(
...    (target,fileid[:4])
...     for fileid in inaugural.fileids()
...     for w in inaugural.words(fileid)
...     for target in ['america','citizen']
...     if w.lower().startswith(target))
>>>
>>> cfd.plot()

运行后的结果:

python自然语言处理-就职演说语料库相关推荐

  1. 基于python的语料库数据处理电子版_基于 Python 自然语言处理工具包在语料库研究中的运用...

    基于 Python 自然语言处理工具包在语料库研究中的运用 刘 旭 [摘 要] 摘要:国内当前以语料库为基础的研究,在研究工具方面,多以 AntConc . PowerGREP 为主,使用 Pytho ...

  2. Python自然语言处理中文版-学习笔记

    第 1 章 语言处理与 Python 频率分布是项目连同它们的频率计数的集合(例如:一个文本中的词与它们出现的频率). 自然语言处理研究的一个重要目标一直是使用浅显但强大的技术代替无边无际的知识和推理 ...

  3. 《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第02章 获得文本语料和词汇资源

    第02章 获得文本语料和词汇资源 2.1 获取文本语料库 古腾堡语料库 网络和聊天文本 布朗语料库 路透社语料库 就职演说语料库 标注文本语料库 在其他语言的语料库 文本语料库的结构 载入你自己的语料 ...

  4. Python自然语言处理 | 获得文本语料与词汇资源

    本章解决问题- 什么是有用的文本语料和词汇资源,我们如何使用Python获取它们? 哪些Python结构最适合这项工作? 编写Python代码时我们如何避免重复的工作? 这里写目录标题 1获取文本语料 ...

  5. 【Python 自然语言处理 第二版】读书笔记2:获得文本语料和词汇资源

    文章目录 一.获取文本语料库 1.古腾堡语料库 (1)输出语料库中的文件标识符 (2)词的统计与索引 (3)文本统计 2.网络和聊天文本 3.布朗语料库 (1)初识 (2)比较不同文体中的情态动词的用 ...

  6. Python自然语言处理-学习笔记(2)——获得文本语料和词汇资源

    语料库基本语法 载入自己的语料库 PlaintextCorpusReadera 从文件系统载入 BracketParseCorpusReader 从本地硬盘载入 写一段简短的程序,通过遍历前面所列出的 ...

  7. 自然语言处理——实现美国总统就职演说词汇分布图

    今天学编程学到厌倦的时候,突然看到书桌旁边的"Python自然语言处理"这本书.买回来两个月了,还没有认真地去看一看,于是打开琢磨琢磨,顺便实现一个小小的项目. 首先我们需要安装P ...

  8. 《Python自然语言处理-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:02 语料库和数据集

    什么是语料库? 为什么我们需要语料库? 理解语料库分析? 数据属性的类型 语料库的不同文件格式 免费语料库的资源 为NLP应用准备数据集 网页爬取 什么是语料库? 在语料库中,大数据集合可以采用以下格 ...

  9. 《Python自然语言处理(第二版)-Steven Bird等》学习笔记:第01章 语言处理与Python

    第01章 语言处理与Python 1.1 语言计算:文本和单词 Python入门 NLTK 入门 搜索文本 计数词汇 1.2 近观Python:将文本当做词链表 链表(list,也叫列表) 索引列表 ...

最新文章

  1. Android系统--TouchEvent的处理流程
  2. Linux下的格式化字符串漏洞利用姿势
  3. 原生JS实现跨浏览器的事件处理程序
  4. Linux开发 python引用自定义的模块
  5. MongoDB数据库索引基础知识与实战技巧
  6. Spring Ioc源码分析 之 Bean的加载(5):循环依赖处理(populateBean())
  7. Codeforces Round #632 (Div. 2) E. Road to 1600 构造好题
  8. c#重写了窗体的OnKeyDown事件,但是不执行
  9. Objects as Points 论文总结
  10. MySql is marked as crashed and should be repaired问题
  11. 心路历程5:雨天 --by Tsui
  12. wpf listbox绑定不跟新_苦逼的程序员,Python又有新版本3.9,跟还是不跟?
  13. 如何封装一个自己的win7系统并安装到电脑做成双系统
  14. C语言小项目——动手打造属于自己的C语言IDE
  15. vue + element插件 首次运行白屏原因分析
  16. 关于PC下安装MAC苹果系统!
  17. 如何破解私域留存?四大核心环节拆解锁客关键能力
  18. 叶俊:把特质用对地方就是优势
  19. 笔记本蓝牙模块转USB接口方法
  20. 万花筒写轮眼画法_万花筒写轮眼画法教程

热门文章

  1. CedarX中代码技术的应用借鉴 (二)多态的方式创建格式解析器
  2. 第一个TensorFlow模型:摄氏度转换为华氏度
  3. 单片机复试面试(一)
  4. 计算机视觉——计算视差图
  5. 轻量级渲染管线_轻量级渲染管道:优化实时性能
  6. 常见的数据分析师的面试问题 完整文件放在GitHub链接上了!!!擅用crtl + F
  7. matplotlib绘制极坐标图 最全面总结
  8. Qt修改exe文件图标
  9. c如何将数组初始化为0?
  10. CVPR 2019 论文解读 | 基于多级神经纹理迁移的图像超分辨方法 (Adobe Research)