本章小白将继续介绍人工智能之中自然语言处理的章节部分。

连续词袋

连续词袋(CBOW)的工作方式与跳过克非常相似,但是主要区别在于我们尝试从周围词的矢量和预测中心词,有点像跳过克的倒数。

共现矩阵(基于计数的方法)

跳过语法模型一次捕获一个单词的同时出现。例如,我们一次遍历我们的语料库,看到“深度”和“学习”同时发生,因此我们对这些向量进行了更新并继续进行,然后看到它又再次发生,因此我们进行了另一次更新。

这样做似乎并不是很有效。为什么不通过语料库一次并计算它们一起出现多少次,而不是一次进行一次?
好吧,我们可以使用共现矩阵来做到这一点!看起来像下面的矩阵:

在每一行上,我们都有一个用于所有单词的向量,例如,我们看到“喜欢”和“喜欢”有一些重叠,因此它们可能彼此相似,这很好。但是,不仅矢量会随着我们的语料库中的更多单词而改变大小,而且非常大的语料库也会使这些矢量变得巨大,这不好,因为在使用这些矢量训练任何东西时会遇到稀疏性问题。
答案是将维数减少到仅重要数量的固定数量。

一种减少方法是使用SVD(奇异值分解)。然后,我们将SVD的结果用作词向量。

该方法实际上比2005年提出的跳过语法要早一些,但仍然会产生一些不错的结果。

词表示的全局向量-GloVe模型

因此,使用word2vec类型预测方法或基于计数的方法有其优缺点。这些显示如下:

下一步是将这两种方法的优点结合在一起。结果就是GloVe模型。

在GloVe模型中,我们从大共现矩阵开始。现在,而不是像上面那样使用SVD减少这种情况,我们改为尝试通过最小化新的损失函数来创建类似于跳跃语法的词向量:

在这种损失函数中,P是共现矩阵,而u和v是词向量。

GloVe的训练目标是学习单词向量,使其点积等于单词共现概率的对数。

人工智能-自然语言处理(2)相关推荐

  1. 2019年上半年收集到的人工智能自然语言处理方向干货文章

    2019年上半年收集到的人工智能自然语言处理方向干货文章 自然语言(NLP)发展史及相关体系 读了这篇文字,做年薪百万的NLP工程师 聚焦机器"读.写.说.译",探寻NLP未来之路 ...

  2. 人工智能自然语言处理技术在财务管理专业的应用

    人工智能自然语言处理技术在财务管理专业的应用 人工智能(Artificial Intelligence) ,英文缩写为AI.它是研究.开发用于模拟.延伸 和扩展人的智能的理论.方法.技术及应用系统的一 ...

  3. 人工智能自然语言处理在人力资源管理方面的应用

    人工智能自然语言处理在人力资源管理方面的应用如今,随着科技的快速发展,人工智能已经融入了我们生活的方方面面,无论是在学习中,还是工作中,我们都能看到它的身影.作为一名人力资源管理专业的学生,我也感受到 ...

  4. 人工智能 | 自然语言处理(NLP)(国内外研究组)

    博主github:https://github.com/MichaelBeechan 博主CSDN:https://blog.csdn.net/u011344545 ================= ...

  5. 人工智能 | 自然语言处理研究报告(技术篇)

    博主github:https://github.com/MichaelBeechan 博主CSDN:https://blog.csdn.net/u011344545 ================= ...

  6. 人工智能 | 自然语言处理研究报告(概念篇)

    博主github:https://github.com/MichaelBeechan 博主CSDN:https://blog.csdn.net/u011344545 ================= ...

  7. 人工智能-----自然语言处理(NLP)基础理解

    人工智能的目标 - 推理 - 自动学习&调度 - 机器学习 - 自然语言处理 - 计算机视觉 - 机器人 - 通用智能 人工智能三大阶段 阶段 1--机器学习:智能系统使用一系列算法从经验中进 ...

  8. 人工智能 | 自然语言处理研究报告(人才篇)

    博主github:https://github.com/MichaelBeechan 博主CSDN:https://blog.csdn.net/u011344545 ================= ...

  9. 人工智能自然语言处理NLP入门教程

    导读:自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域. 语言是人类区别其他动物的本质特性.在所有生物中,只有人类才具有语言能力.人类的多种智能都与 ...

最新文章

  1. android 炫酷背景,炫酷-背景图垂直循环滚动登录页,Android RecyclerView实现
  2. Nodejs的http模块
  3. SecureCRT的使用
  4. 用x64汇编优化8位S盒置换(三)
  5. WaitForSingleObject
  6. document.createDocumentFragment 以及创建节点速度比较
  7. 哈佛大学计算机科学专,哈佛大学计算机科学专业
  8. CTS(12)---android 兼容性测试 CTS 测试过程
  9. 【安全】Kerberos协议介绍
  10. spider-抓取网页内容(Beautiful soup)
  11. python elif可以单独使用_elif可以单独使用。( )_学小易找答案
  12. linux----文件权限管理
  13. C++——WebServer服务器项目
  14. linux如何设置显示器亮度调节软件,使用软件调节Ubuntu的屏幕亮度
  15. kaggle猫狗分类
  16. python sorted lambda_详解python中的lambda与sorted函数
  17. python的两种执行方式,python的两种运行方式
  18. ElasticSearch三种分页方式以及各优缺点(一文知道如何抉择)
  19. 【Apache NIFI 操作】Apache NiFi源码目录结构--nifi-nar-bundles
  20. 【云原生 | Envoy 系列】--Envoy Http Ingress,Egress,front Proxy静态配置

热门文章

  1. 下载文件 download
  2. xz2p更新android 9,索尼 XZ2 迎来安卓 9.0 更新,但少了全面屏手势
  3. 华为“美腿9”手机给我的惊艳!
  4. linux安装核显驱动程序,在Ubuntu系统上怎么安装英特尔核显驱动安装器
  5. b站React禹哥版视频笔记-React应用(基于react脚手架)
  6. imx533 配置 制作SD卡启动文件系统
  7. JAVA微信开发-新手接入指南
  8. C++ 九阴真经之线程安全单例类
  9. 小程序_动态设置tabBar主题皮肤
  10. xml文件格式化脚本