文章大纲

  • 1 汉语与汉字的起源
  • 2 汉字的统一与演变
  • 3 印欧语系与汉藏语系
  • 4 语言区别对于NLP 的影响
  • 参考文献

汉语语言学
语言学是以语言为研究对象的科学。它研究的对象是人类语言,它的任务是通过研究、描写语言的结构、功能及其历史发展,揭示语言的本质,探索语言的共同规律。


1 汉语与汉字的起源

汉语,即汉族的语言,是中国通用语言,也是国际通用语言之一。汉语属汉藏语系,历史悠久,并且是世界上使用人数最多的语言,据统计有超过世界总人口的20%,至少15亿人使用汉语。汉字最早起源于商朝的甲骨文,距今已经有3000-4000年的历史了。 文字的目的是为了记录,古汉语以独字为核心。即使隋唐以后汉语书面语逐渐向口语化发展,汉语中仍然有很多单位是字的词语。造字的方法有六书:

象形,指事,会意,转注,假借,形声

汉语中每个字都有非常丰富的含义。比如图片中的会意字,顺字,就在字本身上表达出了,柔顺通顺的含义。

图 3-1汉字:顺

《自然语言处理实战入门》:汉语语言学简介相关推荐

  1. 《自然语言处理实战入门》 ---- 第4课 :中文分词原理及相关组件简介 之 语言学与分词技术简介...

    <自然语言处理实战入门> ---- 第4课 :中文分词原理及相关组件简介 之 语言学与分词技术简介 https://edu.csdn.net/course/play/20769/25954 ...

  2. 《自然语言处理实战入门》 第三章 :中文分词原理及相关组件简介 ---- 语言学与分词技术简介

    文章大纲 0.内容梗概 1. 汉语语言学简介 1.1 汉语与汉字的起源 1.2 汉字的统一与演变 1.3 印欧语系与汉藏语系 1.4 语言区别对于NLP 的影响 2. 词汇与分词技术简介 2.1 汉语 ...

  3. 《自然语言处理实战入门》 ---- 第4课 :中文分词原理及相关组件简介 之 汉语分词领域主要分词算法、组件、服务(上)...

    目录 0.内容梗概 1. 基于传统统计算法的分词组件 1.1 hanlp : Han Language Processing 1.2 语言技术平台(Language Technology Platfo ...

  4. 《自然语言处理实战入门》 ---- 总目录

    文章大纲 前言 综论 第 一 部分 :NLP 前置知识 开发环境 基础技术 网络爬虫 机器学习必知必会开源库 深度学习基础 常用资源 第 二 部分:NLP 基础理论 序列标注与分词算法 词嵌入(分布式 ...

  5. 《自然语言处理实战入门》第三章 :中文分词原理及相关组件简介---- 汉语分词领域主要分词算法、组件、服务(下)

    文章大纲 0.内容梗概 3. NLP 云厂商 3.1 百度语言处理基础技术 简介 特点 .服务范围 调用样例 3.2 PaddleNLP 3.3 腾讯NLP 简介 特点.服务范围 调用样例 3.4 阿 ...

  6. 《自然语言处理实战入门》第三章 :中文分词原理及相关组件简介 ---- 汉语分词领域主要分词算法、组件、服务(上)

    文章大纲 0.内容梗概 1. 基于传统统计算法的分词组件 1.1 hanlp : Han Language Processing 1.1.1 pyhanlp 安装 1.1.2 功能及分词样例 1.1. ...

  7. 《自然语言处理实战入门》第三章 :中文分词原理及相关组件简介 ---- 工业级词法分析组件百度LAC2.0

    文章大纲 简介 工具介绍 安装与使用 安装说明 功能与使用 分词 词性标注与实体识别 定制化功能 增量训练 1. 分词训练 2. 词法分析训练 文件结构 效果 原理 参考文献 简介 LAC全称Lexi ...

  8. 《自然语言处理实战入门》---- 神经网络与推荐系统初步简介

    作者:一人 1.深度神经网络对于任何领域都是适用的 深度神经网络(Deep Neural Networks, DNN)在过去的数年已经在图像分类.语音识别.自然语言处理中取得了突破性的进展.在实践中的 ...

  9. 《自然语言处理实战入门》第二章: NLP前置技术----网络爬虫简介

    我们平时做自然语言处理,机器学习,都是希望能够有丰富的训练数据集,这样才能获取质量上乘的模型.在大数据时代,处理数据已经不再是是问题了,spark,hadoop ,Elastic search提供了海 ...

最新文章

  1. 「杂谈」如何系统性地学习生成对抗网络GAN
  2. 关于数据取舍问题的一个实例
  3. rpc框架都有哪些_这六种微服务RPC框架,你知道几个?
  4. Nginx开启/关闭Core文件及调试
  5. Windows: 在系统启动时运行程序、定时计划任务、定时关机
  6. Cookie和Session 登录
  7. vs 2012打包程序
  8. 微型计算机接口与技术答案,微型计算机接口技术与应用习题答案(刘乐善).doc
  9. TCP/IP之封装,分用,server模型
  10. JVM性能优化, Part 5:Java的伸缩性
  11. 固定td 样式 随 内容 溢出
  12. Flutter高级第7篇:点击穿透问题、页面禁止左右滑动
  13. (day 38 - 双指针) 剑指 Offer 52. 两个链表的第一个公共节点
  14. jdbc批量执行SQL insert 操作
  15. Quartus手动生成波形图(以38译码器为例)VHDL
  16. 炼石:栉风沐雨七载路,不负韶华再出发
  17. java bmp透明底色_C++ 设置透明背景图片
  18. 力学知识点提要(上)
  19. 00_51入门知识积累__常用工具(二)
  20. 平板为何无法用无线网连接媒体服务器,我家装了无线路由器后,台式机老是断网但是平板电脑却能连接无线网络上网...

热门文章

  1. VLOOKUP 函数使用手册: 要注意查找的格式与 lookup_value 的格式要一致
  2. 【c++】跑酷10.1
  3. 瘦客户端那些事 - 开篇,互联网营销
  4. 【Vue】数组添加元素的三种方式
  5. ssm+java计算机毕业设计特大城市地铁站卫生防疫系统5i80c(程序+lw+源码+远程部署)
  6. GLEE第一季第二季歌曲大全
  7. React Hooks常用的Hooks钩子函数
  8. Python爬虫解决验证码
  9. 前端小练习JS实现网页开灯和关灯
  10. c 语言获取网页源码,CHttpFile抓取网页源代码 | C/C++程序员之家