最初的 GANs 仅仅定义在实数领域,GANs 通过训练出的生成器来产生合成数据,然后在合成数据上运行判别器,判别器的输出梯度将会告诉你,如何通过略微改变合成数据而使其更加现实。一般来说只有在数据连续的情况下,你才可以略微改变合成的数据,而如果数据是离散的,则不能简单的通过改变合成数据例如,如果你输出了一张图片,其像素值是1.0,那么接下来你可以将这个值改为1.0001。如果输出了一个单词“penguin”,那么接下来可以将penguin对应的高维向量加0.001,但可能不存在改变后对应的单词。 因为所有的自然语言处理(NLP)的基础都是离散值,如“单词”、“字母”或者“音节”。

http://www.sohu.com/a/125922509_473283

为什么GAN不适合处理文本数据

1. 文本数据相比较图片数据来说是离散的,因为对于文本来说,通常需要将一个词映射为一个高维的向量,最终预测的输出是一个one-hot向量,假设softmax的输出是(0.2, 0.3, 0.1,0.2,0.15,0.05)那么变为onehot是(0,1,0,0,0,0),如果softmax输出是(0.2, 0.25, 0.2, 0.1,0.15,0.1 ),one-hot仍然是(0, 1, 0, 0, 0, 0),所以对于生成器来说,G输出了不同的结果但是D给出了同样的判别结果,并不能将梯度更新信息很好的传递到G中去,所以D最终输出的判别没有意义。

2. 另外就是GAN的损失函数是JS散度,JS散度不适合衡量不相交分布之间的距离。

(WGAN虽然使用wassertein距离代替了JS散度,但是在生成文本上能力还是有限,GAN在生成文本上的应用有seq-GAN,和强化学习结合的产物)

参考https://blog.csdn.net/qq_25737169/article/details/78857724

https://blog.csdn.net/qq_29997655/article/details/82711333

为什么GAN不能处理离散数据?相关推荐

  1. matlab绘制离散数据图

    用Matlab来对实验中获得的数据进行画图,得到更加直观的结果. 工具/原料 Matlab 方法/步骤 Matlab使用stem和stairs函数绘制离散数据,分别生成火柴棍图像和二维阶梯图像. st ...

  2. Excel在统计分析中的应用—第二章—描述性统计-分组数据的中位数的求解方法(组离散数据)

    对于未分组数据,可使用Excel的MEDIAN函数求解中位数. 对于分组数据,分为: 1. 组离散数据的中位数: 首先要构造累积频率分布表,然后通过累积频率分布表确定数据的中位数对应的观测值的位置,然 ...

  3. Matplotlib和Seaborn(离散数据的图表选择与一些使用技巧)

    文章目录 为离散数据选择图表 描述统计量.异常值和坐标轴范围 标尺和变换 替代方法 核密度估计: 为离散数据选择图表 如果想要绘制离散型数值变量,直方图或条形图都是可能的选择 . 直方图可能是最直接的 ...

  4. MATLAB图形绘制--离散数据绘图

    离散数据绘图 假如我们现在有五个学生的成绩,我们想要把他们的成绩跟名字一一对应的画在图上,必要的时候可以用折线连接,这个时候我们就要了解以下函数: xtick xticklabel gca set a ...

  5. GAN(生成对抗网络)在合成时间序列数据中的应用(第一部分——利用GAN生成合成(synthetic)数据)

    (本文基本是对Jasen 的<Machine Learning for Algorithmic Trading>第二版的第21章进行翻译.改写和复现,并用于我们的实际情况) 1. 准备阶段 ...

  6. matlab离散数据微积分

    离散数据积分 function result = integral(x,y,c)result = [];for i=1:1:length(y)c=y(i)*(x(2)-x(1))+c ; result ...

  7. Matab拟合离散数据

    Matab拟合离散数据:给定多个离散点,进行曲线拟合并绘图. 方法一:曲线拟合工具箱 cftool 命令窗口输入,打开曲线拟合工具箱: // cftool 输入x,y坐标数值: 选取x,y数值,选取拟 ...

  8. 根据离散点画直线_离散数据的最佳直线求解方法

    离散数据的最佳直线求解方法 高少蔚 ; 丁红胜 [期刊名称] <计量技术> [年 ( 卷 ), 期] 1997(000)012 [摘要] 本文提出了一种在最大偏差最小准则下寻找离散点最佳直 ...

  9. Matlab绘制离散数据杆状图

    1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 %% =======绘制离散数据杆状图========= ...

最新文章

  1. Newtonsoft.Json.dll 本地调用正常,服务器调用不正常
  2. TextBoxSuggest,输入框提示工具,输入建议,输入匹配,辅助输入,输入即时提示,文本编辑器,Visual Studio效果,高速查询引擎,哈希树,模糊匹配,百万条零毫秒
  3. 深蓝学院《从零开始手写VIO》作业一
  4. 无法确定域的标识_标识标牌设计的基本要求:虽然是基本要求,你未必也都知道哦...
  5. python中列表相加规则_在Python字典列表中使用公共键/值求和值
  6. linux shell 批量清空,shell脚本批量删除docker镜像
  7. 未来的创业者和公司,一定要具备三大能力
  8. css hack 尽我所见
  9. 【事件驱动】【蓝牙控制车锁或电灯】初步方案
  10. 后缀的形容词_4.1.3后缀or形容词比较级【p78】
  11. MAC 设计师必备的设计绘图软件 推荐与下载
  12. windows的exe文件反编译为msi安装文件
  13. Python四舍五入保留两位小数
  14. 赛格威机器人待遇_赛格威机器人:泊车助理只是应用之一,开发者计划让机器人有无限可能...
  15. 服务器上搭建Lepus——开源的数据库监控系统
  16. Hadoop之——伪分布安装
  17. Linux网络包接收过程
  18. 解决div高度不自动增加的问题
  19. 千道Java面试真题整理系列:MySQL灵魂五十问,在遇面试也不怕!
  20. semantic navigation 目标驱动的视觉语义导航(一)

热门文章

  1. ai怎样导出所选部分_Illustrator(AI)选定对象批量导出jpg/pdf脚本插件(win/mac)...
  2. 夹逼定理证明 sin(x) / x极限
  3. 北汽eu5车机降级方法
  4. Latent factor model, LFM
  5. Java操作MongoDB增删改查的基本操作
  6. 哈工大/北大Adv. Mater.:中熵合金气凝胶的普适性合成实现甲醇→甲酸盐高效转化并产氢...
  7. [转] error: cannot run test program while cross compiling
  8. shell 知识点补充(3)-修改语系/特殊字符/ printf/sed 工具/awk 工具/diff/cmp
  9. W10系统优化工具 Dism++
  10. 微积分知识点回顾与总结(一)三角函数