匿名用户

1级

2016-04-18 回答

中文里没有分词的说法,只有英文、法语、德语等有分词的说法。

分词是动词的三种非限定形式之一,分为两种:现在分词和过去分词。现在分词一般有四种形式,基本形式为“动词原形+-ing”,完成式为having加过去分词,一般被动式为being加过去分词,完成被动式为having

been加过去分词,而过去分词只有一种形式,规则动词的过去分词由动词原形加-ed构成,不规则动词需要单独记忆。

现在分词一般式的构成如下:

动词的现在分词,一般在词尾加-ing,但以-e结尾的字则去-e加-ing:laugh—laughing、live--living。但是,-e前为元音,-e要保留。Hoe—hoeing、agree—agreeing,toe—toeing、dye—dyeing、shoe—shoeing、singe—singeing。

以重读闭音节结尾的动词,末尾只有一个辅音字母(x除外),双写末尾的辅音字母加-ing:plan—planning、occur—occurring。非重读闭音节结尾的动词,则不要双写,如:travel—traveling。

以辅音字母c结尾的动词,c后加k再加-ing:traffic—trafficking、picnic—picnicking。

不规则动词的现在分词要逐个记忆:lie—lying、die—dying、tie—tying、vie—vying。

规则动词的过去分词,一般在词尾加-ed,但以-e结尾的字则只加-d:laugh—laughed、live—lived、age—aged、curse—cursed、learn—learned、crook—crooked、bless—blessed。

以辅音字母加y结尾的动词,变y为I加-ed。如:hurry—hurried、try—tried。

以重读闭音节结尾的动词,末尾只有一个辅音字母(x除外),双写末尾的辅音字母加-ed:plan—planned、occur—occurred、dog—dogged 。但:humbug—humbugged、zigzag—zigzagged。非重读闭音节结尾的动词,则不要双写,如:travel—traveled。

以辅音字母c结尾的动词,c后加k再加-ed:traffic—trafficked、picnic—picnicked。

不规则动词的过去分词须单独记忆:get—got—gotten、sink—sank—sunk、strike—struck—struck、bear—bore—borne、rot—rotted—rotten、hang—hung—hung。

nltk中文分句_如何使用nltk进行中文分词?相关推荐

  1. nltk中文分句_如何改进NLTK的分句技术?

    Kiss和Strunk(2006)Punkt算法的可怕之处在于它是无监督的.所以给一个新的文本,你应该重新训练这个模型并将它应用到你的文本中,例如>>> from nltk.toke ...

  2. nltk中文分句_利用NLTK进行分句分词

    1.输入一个段落,分成句子(Punkt句子分割器) import nltk import nltk.data def splitSentence(paragraph): tokenizer = nlt ...

  3. python自动生成中文句子_如何使用NLTK从归纳语法生成句子?

    在NLTK 2.0中,可以使用nltk.parse.generate生成all可能的sentences for a given grammar. 这段代码定义了一个函数,它应该基于(p)CFG中的产生 ...

  4. python 折线图中文乱码_彻底解决 Python画图中文乱码问题--Pyplotz组件

    1 源起 自从开始学习Python,就非常喜欢用来画图.一直没有需求画要中文显示信息的图,所以没有配置Python中文的环境.由于昨天就需要画几十个形式相同,只是数据不同的图,并且需要显示中文信息.如 ...

  5. python中文分句_中文文本分句

    关于文本分句这点,说简单也简单,说复杂也复杂.一般的自然语言处理任务中对这点要求并不严格,一般按照句末标点切分即可.也有一些专门从事文本相关项目的行业,可能就会有较高的要求,想100%分句正确是要考虑 ...

  6. kodi没有中文设置_最完整的设置中文教程,不同平台

    网友使用xbmc最多碰到的是关于xbmc 中文显示的问题,网上有一大堆的xbmc教程,我就做一下总结吧.) H" m$ r- B. V. E' K' _% V ' B: J: H/ m* C ...

  7. ios请求头解决参数中文乱码_解决请求参数的中文乱码问题(get、post)

    2018-11-28 在web请求与响应中,会遇到乱码问题,比如填写表单数据时,难免会输入中文,姓名.公司名称等.由于HTML设置了浏览器在传递请求参数时,采用的编码方式是UTF-8,但在解码时采用的 ...

  8. python随机生成中文字符串_利用python3随机生成中文字符的实现方法

    前言 运行环境在Python3.6下,Python2的解决方案网上有很多.,想学习python2实现的朋友们可以参考这篇文章://www.jb51.net/article/34884.htm,下面来一 ...

  9. pb mysql 中文乱码_解决springmvc+mybatis+mysql中文乱码问题

    近日使用ajax请求springmvc后台查询mysql数据库,页面显示中文出现乱码 最初在mybatis配置如下 select text from News where id=#{o} 其中表New ...

最新文章

  1. Anaconda安装,jupyter notebook 使用说明
  2. 操作系统第三章-内存管理
  3. 拿下了一个美女图片网站!
  4. 深度学习pytorch--softmax回归(三)
  5. java biginteger log_java – BigInteger:计算可伸缩方法中的小数位数
  6. 服务器压力测试怎么做_做手游怎么选服务器?
  7. [Python] L1-003. 个位数统计-PAT团体程序设计天梯赛GPLT
  8. django学习笔记:AdminSite界面配置
  9. 记一次MySQL中Waiting for table metadata lock的解决方法
  10. 第13章 集成学习和随机森林 学习笔记下 随机森林和集成学习
  11. 微信公众号开发(个人订阅号)
  12. 【校园卡】2020移动联通电信校园卡对比
  13. nova与neutron交互
  14. ClickHouse入门基础教程
  15. mstsc远程桌面连接失败,提示CredSSP加密Oracel修正
  16. 如何读取PLC的寄存器地址和点表?
  17. vue全局配置_silent
  18. 学点历史-欧洲君主命名
  19. RHCSA之基本命令_统计文件内容篇(wc)
  20. esp8266设置sta失败_ESP8266 – ESP8266WiFiSTA库 – disconnect

热门文章

  1. yolo实现交通信号灯视频流识别代码搬运及调试
  2. 《漫画算法》终于出电子书了!
  3. C++——TCP和UDP头部结构(下)
  4. Python监控服务器显卡使用情况程序
  5. 西电微机系统课程设计——步进电机开环控制系统设计
  6. Transformer 综合讲解15-20章
  7. 《C程序设计》读后感
  8. 三次握手与四次挥手的爱恨情仇
  9. valgrind安装及使用
  10. STM32粗略延时,大致精确