Morpheme (词素),人类语言中表达语义的最小单元。

举个例子:

  • Eat 表示“吃”,不能再分了,ea 或 at 在这里都没有任何意义。所以eat是一个word,也是一个Morpheme。
  • Tomcats 表示 “雄猫”的复数, (包含三个 morphemes: tom = male, cat=animal, -s = plural)

Morpheme词素,可以分为两类, Free Morpheme和 Bound Morpheme。

Free Morpheme,比如前面的eat,可以独立作为一个word,可以单独使用。

Bound Morpheme,比如前面的-s,必须附加到其它的Morpheme词素,和它们一起使用。

根据各个词素在word中的不同作用和位置,可以把它们进行成分式的分类/划分。下面的图描述了对kickers一词进行成分划分。

至于Stem。一般而言,给Root加一个derivational morpheme派生词素,它就变成了Stem 比如,kickers中kick就是这个词的Root,加上派生词素-er后,则kicker变成了Stem,派生词素-er负责将kick从一个动词派生(转化)为一个名词,含义相关,但已变化。

与派生词素容易混淆的是屈折词素Inflectional Morphemes,比如我们在kicker后加词素-s,

kicker的语义没有任何变化,但是在语法中人称格数发生了变化,这样的词素就被称为屈折词素Inflectional Morphemes。与派生词素-er相比,屈折词素-s可以改变时态或人称格数,不能改变含义。

既然Base是Bound Morpheme可以附着的主体部分。那么我们再来看看可以附着在Base上的那部分Bound Morpheme,即Affixes。

Affixes词缀分为前缀Prefixes和后缀Suffixes两类。

举个例子:

给你一个word,把这个word分析出Base Root Stem和Affixes等词素成分的过程叫做词分析Word Analysis。

比如:

  • hospitalize - complex word, free base hospital (root) + -ize derivational suffix
  • hospitalizes = stem [hospital (root) + -ize affix] + -s

这种分析表明,单词不是一下子形成的。需要遵循顺序来构成。为了捕捉描述单词形成的过程,语言学家开发了两种表示方法。一种方法是标记包围;另一种方法是树结构。

标记包围:表示如下

再来一个更复杂的标记包围的例子

树结构表示是什么样子的呢?

Trees can be drawn from the top-down or from the bottom-up.

Using the top down method: start with the base word label, in this case A for adjective, then split off each major division. In this case there is just one affix, Af, and an adjective, A. Once the parts are labeled, the word parts can be filled in underneath.

把rehospitalizes用树结构表示,则会是下面这个样子:

NLP之语言词素Morpheme(形态学)相关推荐

  1. 甘超波:NLP检定语言模式

    哈喽,大家好我是甘超波,一名NLP爱好者,每天一篇文章,分享我的NLP实战经验和案例,希望给你些启发和帮助,这是第120篇原创文章 今天我们主要分享NLP检定语言模式,在进入主题之前,先来做1个体验 ...

  2. 知物由学 | 再造巴别塔,我们如何进行NLP跨语言知识迁移?

    知物由学 | 再造巴别塔,我们如何进行NLP跨语言知识迁移? 自以 BERT 为代表的预训练语言模型诞生起,关于其跨语言版本的探索研究就从未停止过.2020 年 4 月,Google 发布了 XTRE ...

  3. NLP判断语言情绪_机器学习中的NLP简介

    在1970年代,许多程序员开始编写"概念本体",将现实世界的信息结构化为计算机可理解的数据.例子有MARGIE(Schank,1975),SAM(Cullingford,1978) ...

  4. NLP判断语言情绪_网易严选nlp预训练语言模型的应用

    随着2018年底bert的发布,预训练(pre-train)成为nlp领域最为热门的方向之一,大规模的无监督语料加上少量有标注的语料成为了nlp模型的标配.本文将介绍几种常见的语言模型的基本原理和使用 ...

  5. (1)语言是什么——NLP的语言基础

    本系列是<语言引论>的阅读笔记,旨在学习NLP中常见的语言学相关的知识,对其有一个最基本的,整体的,感性的了解.一下是OneNote笔记的复制粘贴: 第一章 语言是什么 1 语言知识 1. ...

  6. NLP判断语言情绪_Python的8大牛叉的自然语言处理库概览

    Python系技术生态中有很多的NLP资源,该如何选择呢?本文将介绍用于分析文本的最佳Python库以及如何使用它们. 0.导引 自然语言处理,或简称为NLP,最好描述为"用于处理语音和文本 ...

  7. NLP判断语言情绪_最新中文NLP开源工具箱来了!支持6大任务,面向工业应用 | 资源...

    铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI 对于开发者来说,又有一个新的NLP工具箱可以使用了,代号PaddleNLP,目前已开源. 在这个基于百度深度学习平台飞桨(PaddlePad ...

  8. NLP判断语言情绪_挽回怎么用NLP神经语言程序学(一)

    NLP属于一个学派.建立于艾瑞克森催眠的基础上.嗯.说穿了.如果要用NLP的方式来挽回.那就等同于清醒催眠挽回的方式了.总得来说.就我个人观点而言.我比较赞成心理学界的看法.NLP根本就是一套伪心理学 ...

  9. NLP 神经--语言程序

    有人把Neuro-Linguistic Programming翻译为神经语言学,神经--语言程式. 神经语言学多是Neurolinguistics的译名, Neurolinguisitics主要研究语 ...

最新文章

  1. 计算机多媒体理论知识,计算机多媒体技术07311.doc
  2. 快速找到Word 2007长文档的某一页
  3. DataGridView新特色、常用操作
  4. C++和服务器交互的几个文件代码
  5. C++工程中初步使用QML
  6. Codeforces Round #462 (Div. 2)
  7. selenium并行_如何在不同的浏览器中设置Selenium网格以并行执行
  8. 数据库基础知识——存储过程和函数
  9. Shodan新手入坑指南
  10. 记一次SVN误删除操作和Tomcat版本与操作系统不兼容 问题分析及解决的过程
  11. pom.xml 如果使用 mvn exec:exec 命令运行项目
  12. 小米台灯底座接口很松_小米新品,米家充电台灯,续航40小时,不足百元,米粉:买买买...
  13. photoshop插画插件_照片快速转矢量插画PS动作插件 Vector Art Photoshop Action
  14. 玩游戏计算机缺失msvcp140,绝地求生计算机丢失MSVCP140.dll解决办法
  15. 激光SLAM:Livox激光雷达硬件时间同步
  16. 彻底掌握 Javascript(九)数组【讲师辅导】-曾亮-专题视频课程
  17. 云服务器1和1g装什么系统好,1核1g的云服务器装什么系统好
  18. 关于 ping-pong buff
  19. epoll_create详解
  20. 18_位运算符(了解)

热门文章

  1. 纯干货分享!Python视频教程分享,python学习路线图(含大纲+视频+源码)
  2. 下载网页所有图片的最简单的方法
  3. 非奇异矩阵的多种判断方式
  4. 自定义域名:为自己的CSDN博客添加自定义域名吧!
  5. Twitter推特爬虫工具开发
  6. 5、kubernetes Scale Up/Down在线增加或减少 Pod 的副本数、Failover故障转移、用 label(标签)控制 Pod 的位置
  7. VOT 2015 Benchmark 使用教程
  8. Coin-row problem
  9. 100% 解决 VMware Workstation 与 Hyper-V 不兼容。请先从系统中移除 Hyper-V 角色
  10. NanoHTTPD----SimpleWebServer处理请求过程