2019-11-12 12:49:55

机器之心报道

机器之心编辑部

想要 GPT-2 生成中文故事,听听它对各种主题的看法?你可以试试这个中文预训练 GPT-2 项目,它开源了预训练结果与 Colab Demo 演示,只需要单击三次,我们就能生成定制的中文故事。

  • 项目地址:https://github.com/imcaspar/gpt2-ml
  • Colab 演示地址:https://colab.research.google.com/github/imcaspar/gpt2-ml/blob/master/pretrained_model_demo.ipynb

既然昨天才过完双十一,那么我们先看看这个预训练模型能生成什么样的故事。如下是我们给定前提「双十一」,中文 GPT-2 生成的第一个样本:

Sample, 1 of 10双十一,不只是剁手的节日,更是买买买的狂欢节!10 月 13 日,中国小象开启的全新一年的跨境爆款系列商品双十一的正式来袭,围绕电商双十一的购物理念及战略重点,阿里巴巴、天猫联合打造的潮流趋势支付,正式登陆双十一狂欢夜。潮流界、时尚界盛事的参与者,统统化身成为电商促销的传播者和领导者,时尚界的人们以身作则,走在时尚前线,年轻时尚女性,正用最新的鲜美,向消费者传递快乐与创意。不止双十一,很多行业的大事件会在这个季节火热登场,不只是女性用户,还有男性用户。那么,在这些品牌高调露面的时刻,我们又该如何大玩不同的新玩法?如何抓住双十一的流量红利和品牌曝光点?

首先,形式是核心。网购、预售、快递都是消费者在双十一这个大战场上所接触最多的环节,而品牌商们喜欢的是大玩点创新、玩点新意。其次,先有用户的需求,才能够靠作品的特色获得市场的重视。小象电商的用户就是普通人,所以他们的需求就是需要一个包包,一条围巾,要么想各种创意。

于是,除了颜值,就是线下,大玩奇思妙想!不限于明星、时尚青年的价值需求,一个玩法就是无限加价,为了让所有用户都有收获。潮流的故事往往是颠覆性的,为了引起用户的兴趣,新玩法的推出,要给用户充满惊喜的体验,提供最奇妙的玩法。就算是普通人购物体验也会选择最少的购物过程,这就是品牌持续+创新的理念。来源:综合自阿里巴巴官方微博、阿里妈妈官方微博、中国经济网的特点。对阿里和时尚感兴趣的朋友,可以关注微信号:hzcyhg

这个生成样本说得头头是道,很难看出来它完全是由模型生成的,甚至样本给出了一个微信号,我们查了后估计该微信号与文本是没什么关系的。

既然样本效果这么好,它肯定需要很多中文语料。项目表明,该 15 亿参数量的 GPT-2 中文预训练模型在 15GB 的纯文本上进行训练,一共迭代了 10 万步。这 15GB 的纯文本主要选自 THUCNews 与 nlp_chinese_corpus,它们会做一系列的数据清理。

  • THUCNews:http://thuctc.thunlp.org/#中文文本分类数据集THUCNews
  • nlp_chinese_corpus:https://github.com/brightmart/nlp_chinese_corpus

此外,项目作者还简化整理了 GPT-2 训练代码,移植了 Bert Tokenizer 以添加多语言支持。因为移植了 Bert Tokenizer,所以模型输出结果很容易与基于 BERT 的模型进行整合。

项目作者开放的预训练模型是在 TPU Pod v3-256 上复现的 15 亿参数 GPT2,这也是 GitHub 上第一个支持大规模 TPU 训练的中文 GPT-2 项目。

  • 本项目的训练脚本:https://github.com/imcaspar/gpt2-ml/tree/master/train

极简易用的 Colab 演示

非常吸引人的是,该项目提供了一个非常容易使用的 Colab 项目,只需简单地单击三次,我们就能使用 Colab 体验 GPT-2 续写整段文本的能力。演示地址在文章前面已经提供了,这里主要展示机器之心尝试的效果。

下图是我们尝试使用的结果,简单而言分可以为三步:首先从 GitHub 下载源代码;其次从 Google Drive 下载预训练模型,这里需要获得授权,也非常简单;最后,调用 Colab 的硬件进行推断就行了。

我们可以看到,中文 GPT-2 大部分生成结果,上下文还是非常合理的。如果你也想试一试效果,那就快来试一试吧,没有任何 ML 基础也能看到模型的真实效果。

只需单击三次,让中文GPT-2为你生成定制故事相关推荐

  1. mysql插入数据返回主键值_Mysql千万级别数据批量插入只需简单三步!

    第一步:配置my.ini文件 文件中配置 bulk_insert_buffer_size=120M 或者更大 将insert语句的长度设为最大. Max_allowed_packet=1M Net_b ...

  2. 搭建公司内部论坛 只需简单三步 1 (安装Discuz)

    系列文章 ​​​​​​​搭建公司内部论坛 只需简单三步 1 (安装Discuz) 搭建公司内部论坛 只需简单三步 2 (发布Discuz) 随着公司快速发展,人员也越来越多,但员工人数多也会带来问题, ...

  3. 搭建公司内部论坛 只需简单三步 2 (发布Discuz)

    系列文章 搭建公司内部论坛 只需简单三步 1 (安装Discuz) 搭建公司内部论坛 只需简单三步 2 (发布Discuz) 上一篇 搭建公司内部论坛 只需简单三步 1 (安装Discuz) 在上篇介 ...

  4. 影视解说类视频怎么做,只需简单三步,教你制作影视解说短视频

    影视解说类视频怎么做,只需简单三步,教你制作影视解说短视频 影视解说类视频往往能够在很短的时间之内就将一部影视剧的大概剧情解说完毕,因此很多喜欢看剧的小伙伴们也跃跃欲试,想要尝试做做影视解说类短视频. ...

  5. 华为 java sd卡_无需使用Micro SD卡!只需简单三招,轻松给华为手机扩展容量

    原标题:无需使用Micro SD卡!只需简单三招,轻松给华为手机扩展容量 这些年,智能手机不仅在摄像头像素上屡创新高,而且高端机型也普遍标配128GB存储,甚至出现512GB版本这样的巨无霸.总有一天 ...

  6. 手机换屏太贵!只需学会三种保养屏幕的方法,帮你远离换屏烦恼

    手机在生活中算是一件贵重物品,而手机哪里最脆弱,那肯定就是手机屏幕啦,现在大家一般换手机的原因都是因为屏幕碎了,目前的智能手机换一块屏幕,起码要手机价值的三分之一以上,越贵的手机换屏幕越贵,而且新换的 ...

  7. vscode权威指南 pdf_使用这些简单的方法,将PDF转换为JPG只需单击几下

    尽管PDF文件是将大量文本和图像文档打包在一起的一种绝妙方式,但是它们通常需要外部应用程序或插件,如果只需要一页或一张图像,则不需要.如果你已经有了PDF,则始终可以自己将其转换为图像.像JPG(它与 ...

  8. 数字类 default 0和 default 0_数字化转型从0到N,只需这三步

    图片来源:陈其伟演讲PPT 当今的企业正都面临着宏观环境严峻.市场竞争激烈.用户需求变化和技术迭代加快等四个方面的挑战.也有朋友经常借用了一个军事概念-VUCA,来形容我们今天所处的时代.我还是喜欢简 ...

  9. java mq 积压_解决消息队列的数据积压只需这三招

    点击上方 "Java架构师社区"关注我们,设为星标 回复"架构师"获取资源 1 概述 最近生产环境的消息通知队列发生了大量的数据积压问题,从而影响到整个平台商户 ...

最新文章

  1. 法国飞行计算机检测设备,基于PCI总线的飞行控制计算机通用测试设备
  2. ios - 使用@try、catch捕获异常:
  3. Apollo自动驾驶入门课程第④讲 — 感知(上)
  4. (Object detection)目标检测从入门到精通——第三部分非极大抑制
  5. SSAS事实表和维度表数据类型必须一致
  6. 小米新Logo就加了一行代码?
  7. 新谈:为什么你觉得FPGA难学?如何入门?
  8. 20201022-成信大-C语言程序设计-20201学期《C语言程序设计B》C-trainingExercises19
  9. 通达OA定时任务-未打卡提醒
  10. php 模拟提交金数据,小程序提交表单到金数据实例
  11. QT widget宽高比
  12. 超大图片的缩放算法(撑爆内存的那种)
  13. python黑底白字的车牌_Python+OpenCV实现车牌字符分割和识别
  14. 初探springboot的荆棘之路
  15. 【福利】邀请博主,赢取大奖
  16. display-flex详解
  17. PT100温度电阻转换器
  18. LM7805使用总结
  19. 问题--联通研究院面试
  20. relativelayout设置边框_Android TableLayout 增加边框,以及圆角的实现方式

热门文章

  1. 神经网络是存储了海量的信息还是将海量的关系映射存储在了一起(发挥了存储记忆功能),还是变成了看似是一个公式,实际是成千上万个规律的公式融合在一个式子中( 类似于正弦波的傅里叶分解成无限中频率的波的加和
  2. 反码求和校验: 一个数加上自己取反得到的数正是时钟轮盘上最大那个数
  3. SUSE LINUX配置ORACLE命令
  4. 你就是你自己paper最好的审稿人:宾大苏炜杰提出peer review新机制
  5. 何晓冬:做科研与其各拿十块“铜牌”,不如合力做一块“金牌”
  6. GO!自制一款【不丑】的名片
  7. 深度学习下的医学图像分析 2
  8. 使用容器的概念理解多维数组和多维空间
  9. 独家 | 如何用XGBoost做时间序列预测?
  10. 独家 | 机器学习中的四种分类任务(附代码)