1、 人类语言的语法知识。

不同的人类语言有不同的语言表达形式,包括语言符号,语言符号的组合和应用规则。阿拉伯文字、斯拉夫文字、罗马文字、拉丁文字、象形文字等代表着不同语言背景、语言文化。

2、 机器可用的词典知识库有哪些?

1) 类别词库。特定实体词、功能词、非功能词。
2) 组合词库。组合词库包括搭配词库,共现词库。
a) 搭配词库:
i. 位置共现:窗口共现、互信息、卡方
ii. 句法共现:成份共现(VP/NP)、依存共现(SBV,VOB,ATT,POB等)
iii. 语义共现:语义角色共现(工具,结果,趋向)
iv. 概念共现:同义词标准化、上位词、反义词等替换标准化
3) 替换词库。同义词库,兄弟节点词库,父亲节点词库,儿子节点词库

3、 语言模板的自我习得?

借助句子非主要成分移除,成份位置规则。
1) 手工枚举下的语言模板
2) 基于事实实例自举方式的语言模板生成
3) 基于类型符号替换的语言模板生成

4、 推理规则的自我习得?

1) 基于关系事实的推理规则反推
2) 基于类概念的推理规则生成
3) 基于类属性或描述的推理规则生成

5、 语料的自我扩充?

语料的自我扩充分成两个,一个是从无到有,另一个是从少到多。
1) 基于回标的方式。确定标准句,对回标候选句进行置信度评分。
2) 基于回译的方式。翻译成中间语言,再反向翻译回来,形成另一种表述形式。
3) 基于句式迁移的方式。陈述句,否定句,祈使句、被字句、把字句。定语后置、状语前置等变换句法。
4) 基于同义词替换的方式。扩展问的常用方式。
5) 基于概念体系替换的方式。
6) 基于非功能词插入和删除的方式。
7) 基于搭配与语言模型的生成方式。基于给定词,结合搭配信息和语言成立性模型进行语言实例生成。
8) 基于生成对抗网络的语言实例生成。

6、 人类的语言能力体现在能够在不同句式上来回变通

1) 缩句:把结构比较复杂的句子中的修饰、限制和补充说明的成分去掉保留主要成分的意思。简单地说:缩句就像把一棵树的树枝、枝叶都去掉,只留下树的主干一样。
纵横交错的河道里穿行着行动轻快灵活的小艇(缩句)河道里穿行着小艇。
运动健儿的脸上露出了胜利的喜悦。 (缩句)脸上露出了喜悦。
我们要把时间当成生命一样爱惜。(缩句)我们要把时间爱惜。
六岁的弟弟津津有味地吃着又香又甜的苹果。(缩句)弟弟吃着苹果。
一只从树上掉下来的小麻雀无可奈何的拍打着小翅膀。麻雀拍打着翅膀。
2)去“枝”留“干”法;凡是用来进行修饰或限制的词都尽量去掉,包括 :形容词、数量词、表示程度、时间、地点的词。

7、 如何更好地将语言学家的工作计算机化,句子转写器。

1)底层的语言实例是千变万化的,往上走,词性组合模式回少一些,再往上走,句法组合模式会少一些,再往上走,语义模式会更少一些。语言是遵从一定的模式和组合规则形成的。语言的生成是一种抽象语言模式的实例化过程。

8、语言规则与分布式表示的对抗,规则的形式化、数值化。

随笔-机器如何学习我们的知识?相关推荐

  1. 机器不学习:浅析深度学习在实体识别和关系抽取中的应用

    机器不学习 jqbxx.com -机器学习好网站 命名实体识别(Named Entity Recognition,NER)就是从一段自然语言文本中找出相关实体,并标注出其位置以及类型,如下图.命名实体 ...

  2. 2021 年了,机器/深度学习还有哪些坑比较好挖?

    作者丨张趔趄.微调.金雪锋 来源丨知乎问答 编辑丨极市平台 导读 深度学习以及机器学习发展至今,涌入了大量的人才和资源,有很多方向已经达到了一个瓶颈,短时间内有非常大的突破有些难以实现.那么对于有学术 ...

  3. 转载 干货 | 陪伴我学习NLP、知识图谱的那些资源(教程+书籍+网站+工具+论文...可以说很全面了)

    https://blog.csdn.net/guleileo/article/details/81140179 干货 | 陪伴我学习NLP.知识图谱的那些资源(教程+书籍+网站+工具+论文...可以说 ...

  4. 送你一份机器/深度学习自学指南(附视频amp;速成方案)

    本文经AI新媒体量子位(公众号ID:qbitai )授权转载,转载请联系出处. 本文约3052字,建议阅读6分钟. 本文详细讲解了机器/深度学习的学习方法,一共为分三个部分,做出了详细的指南. 怎么入 ...

  5. 深度学习如何入门?怎么入门机器/深度学习?

    链接:https://www.zhihu.com/question/26006703/answer/536169538 怎么入门机器/深度学习? 回答这个问题,最先要考虑的问题是:你有多少时间? 准备 ...

  6. 【随笔】深度学习之美——杨家有女初长成,养在深闺人未识

    1.从机器学习到深度学习 一般来说,知识在两个维度上可以分为四类,如下图. 在横向上,对于可推理的,可以用机器学习的方法完成推理,通过人类的先验知识,把原始数据预处理成各种特征,然后对特征进行分类.然 ...

  7. Hadoop学习笔记—15.HBase框架学习(基础知识篇)

    Hadoop学习笔记-15.HBase框架学习(基础知识篇) HBase是Apache Hadoop的数据库,能够对大型数据提供随机.实时的读写访问.HBase的目标是存储并处理大型的数据.HBase ...

  8. 学习深度学习需要哪些知识_您想了解的有关深度学习的所有知识

    学习深度学习需要哪些知识 有关深层学习的FAU讲义 (FAU LECTURE NOTES ON DEEP LEARNING) Corona was a huge challenge for many ...

  9. 纯新手入门机器/深度学习自学指南(附一个月速成方案)

    原作:Masum Hasan 问耕 编译整理 量子位 出品 | 公众号 QbitAI 怎么入门机器/深度学习? 回答这个问题,最先要考虑的问题是:你有多少时间? 准备用三个月入门,和想要一个月速成,肯 ...

最新文章

  1. 我是这么使用axios的
  2. hive执行流程(3)-Driver类分析1Driver类整体流程
  3. shell实例第12讲:给定目录找出包含关键字的文件
  4. Angular tsconfig.json 文件里的 paths 用法和 scoped module 定义
  5. react 引入 mobx @babel/core: 7.2.2
  6. asp微信会员卡管理系统,超小的源码_带asp微信支付源码
  7. 如何使用rollup打包前端组件/库
  8. 1万吨猪肉只够吃1.5小时,中国人是有多爱猪肉?
  9. Swagger2 生成API文档时泛型总是显示不出来的问题
  10. matlab 图像分割
  11. android ota不打包_android 6.0系统 make otapackage 错误
  12. 【OpenGL】Shader实例分析(七)- 雪花飘落效果
  13. 单片机 STM32 HAL 闪存 AT24C02
  14. 计算机地图概括的原理,第五章地图概括与自动综合
  15. centos/linux 服务器的内存不够了怎么办?centos用虚拟内存扩展内存
  16. 用Excel绘制曲线图
  17. Elasticsearch 索引
  18. 知己知彼 看CIO如何成功领导80后
  19. java.lang.IllegalStateException: Underflow in restore - more restores than saves
  20. 第十六周学习周报(20180618-20180624)

热门文章

  1. 观察者模式Observer
  2. 我和蓝牙BT,BLE有一腿
  3. linux platform 驱动模型分析
  4. Django之验证码的实现,简单快捷的方法
  5. 简单线性回归(Simple Linear Regression)和多元线性回归(Multiple Regression)学习笔记
  6. linux装机量,在没有盗版的世界 Linux桌面的装机量可能占比达到40%
  7. LeetCode 723. 粉碎糖果(模拟)
  8. LeetCode 1053. 交换一次的先前排列
  9. 协程asyncio_Asyncio深入浅出
  10. html5 职工入职后台管理系统_ChemCMS是一款基于GO+PHP+MYSQL+HTML5构建的化学内容管理系统