只需单击三次，让中文GPT-2为你生成定制故事

2019-11-12 12:49:55

机器之心报道

机器之心编辑部

想要 GPT-2 生成中文故事，听听它对各种主题的看法？你可以试试这个中文预训练 GPT-2 项目，它开源了预训练结果与 Colab Demo 演示，只需要单击三次，我们就能生成定制的中文故事。

项目地址：https://github.com/imcaspar/gpt2-ml
Colab 演示地址：https://colab.research.google.com/github/imcaspar/gpt2-ml/blob/master/pretrained_model_demo.ipynb

既然昨天才过完双十一，那么我们先看看这个预训练模型能生成什么样的故事。如下是我们给定前提「双十一」，中文 GPT-2 生成的第一个样本：

Sample, 1 of 10双十一，不只是剁手的节日，更是买买买的狂欢节！10 月 13 日，中国小象开启的全新一年的跨境爆款系列商品双十一的正式来袭，围绕电商双十一的购物理念及战略重点，阿里巴巴、天猫联合打造的潮流趋势支付，正式登陆双十一狂欢夜。潮流界、时尚界盛事的参与者，统统化身成为电商促销的传播者和领导者，时尚界的人们以身作则，走在时尚前线，年轻时尚女性，正用最新的鲜美，向消费者传递快乐与创意。不止双十一，很多行业的大事件会在这个季节火热登场，不只是女性用户，还有男性用户。那么，在这些品牌高调露面的时刻，我们又该如何大玩不同的新玩法？如何抓住双十一的流量红利和品牌曝光点？

首先，形式是核心。网购、预售、快递都是消费者在双十一这个大战场上所接触最多的环节，而品牌商们喜欢的是大玩点创新、玩点新意。其次，先有用户的需求，才能够靠作品的特色获得市场的重视。小象电商的用户就是普通人，所以他们的需求就是需要一个包包，一条围巾，要么想各种创意。

于是，除了颜值，就是线下，大玩奇思妙想！不限于明星、时尚青年的价值需求，一个玩法就是无限加价，为了让所有用户都有收获。潮流的故事往往是颠覆性的，为了引起用户的兴趣，新玩法的推出，要给用户充满惊喜的体验，提供最奇妙的玩法。就算是普通人购物体验也会选择最少的购物过程，这就是品牌持续+创新的理念。来源：综合自阿里巴巴官方微博、阿里妈妈官方微博、中国经济网的特点。对阿里和时尚感兴趣的朋友，可以关注微信号：hzcyhg

这个生成样本说得头头是道，很难看出来它完全是由模型生成的，甚至样本给出了一个微信号，我们查了后估计该微信号与文本是没什么关系的。

既然样本效果这么好，它肯定需要很多中文语料。项目表明，该 15 亿参数量的 GPT-2 中文预训练模型在 15GB 的纯文本上进行训练，一共迭代了 10 万步。这 15GB 的纯文本主要选自 THUCNews 与 nlp_chinese_corpus，它们会做一系列的数据清理。

THUCNews：http://thuctc.thunlp.org/#中文文本分类数据集THUCNews
nlp_chinese_corpus：https://github.com/brightmart/nlp_chinese_corpus

此外，项目作者还简化整理了 GPT-2 训练代码，移植了 Bert Tokenizer 以添加多语言支持。因为移植了 Bert Tokenizer，所以模型输出结果很容易与基于 BERT 的模型进行整合。

项目作者开放的预训练模型是在 TPU Pod v3-256 上复现的 15 亿参数 GPT2，这也是 GitHub 上第一个支持大规模 TPU 训练的中文 GPT-2 项目。

本项目的训练脚本：https://github.com/imcaspar/gpt2-ml/tree/master/train

极简易用的 Colab 演示

非常吸引人的是，该项目提供了一个非常容易使用的 Colab 项目，只需简单地单击三次，我们就能使用 Colab 体验 GPT-2 续写整段文本的能力。演示地址在文章前面已经提供了，这里主要展示机器之心尝试的效果。

下图是我们尝试使用的结果，简单而言分可以为三步：首先从 GitHub 下载源代码；其次从 Google Drive 下载预训练模型，这里需要获得授权，也非常简单；最后，调用 Colab 的硬件进行推断就行了。

我们可以看到，中文 GPT-2 大部分生成结果，上下文还是非常合理的。如果你也想试一试效果，那就快来试一试吧，没有任何 ML 基础也能看到模型的真实效果。

只需单击三次，让中文GPT-2为你生成定制故事相关推荐

mysql插入数据返回主键值_Mysql千万级别数据批量插入只需简单三步！
第一步:配置my.ini文件文件中配置 bulk_insert_buffer_size=120M 或者更大将insert语句的长度设为最大. Max_allowed_packet=1M Net_b ...
搭建公司内部论坛只需简单三步 1 （安装Discuz）
系列文章搭建公司内部论坛只需简单三步 1 (安装Discuz) 搭建公司内部论坛只需简单三步 2 (发布Discuz) 随着公司快速发展,人员也越来越多,但员工人数多也会带来问题, ...
搭建公司内部论坛只需简单三步 2 （发布Discuz）
系列文章搭建公司内部论坛只需简单三步 1 (安装Discuz) 搭建公司内部论坛只需简单三步 2 (发布Discuz) 上一篇搭建公司内部论坛只需简单三步 1 (安装Discuz) 在上篇介 ...
影视解说类视频怎么做，只需简单三步，教你制作影视解说短视频
影视解说类视频怎么做,只需简单三步,教你制作影视解说短视频影视解说类视频往往能够在很短的时间之内就将一部影视剧的大概剧情解说完毕,因此很多喜欢看剧的小伙伴们也跃跃欲试,想要尝试做做影视解说类短视频. ...
华为 java sd卡_无需使用Micro SD卡！只需简单三招，轻松给华为手机扩展容量
原标题:无需使用Micro SD卡!只需简单三招,轻松给华为手机扩展容量这些年,智能手机不仅在摄像头像素上屡创新高,而且高端机型也普遍标配128GB存储,甚至出现512GB版本这样的巨无霸.总有一天 ...
手机换屏太贵！只需学会三种保养屏幕的方法，帮你远离换屏烦恼
手机在生活中算是一件贵重物品,而手机哪里最脆弱,那肯定就是手机屏幕啦,现在大家一般换手机的原因都是因为屏幕碎了,目前的智能手机换一块屏幕,起码要手机价值的三分之一以上,越贵的手机换屏幕越贵,而且新换的 ...
vscode权威指南 pdf_使用这些简单的方法，将PDF转换为JPG只需单击几下
尽管PDF文件是将大量文本和图像文档打包在一起的一种绝妙方式,但是它们通常需要外部应用程序或插件,如果只需要一页或一张图像,则不需要.如果你已经有了PDF,则始终可以自己将其转换为图像.像JPG(它与 ...
数字类 default 0和 default 0_数字化转型从0到N，只需这三步
图片来源:陈其伟演讲PPT 当今的企业正都面临着宏观环境严峻.市场竞争激烈.用户需求变化和技术迭代加快等四个方面的挑战.也有朋友经常借用了一个军事概念-VUCA,来形容我们今天所处的时代.我还是喜欢简 ...
java mq 积压_解决消息队列的数据积压只需这三招
点击上方 "Java架构师社区"关注我们,设为星标回复"架构师"获取资源 1 概述最近生产环境的消息通知队列发生了大量的数据积压问题,从而影响到整个平台商户 ...

只需单击三次，让中文GPT-2为你生成定制故事

只需单击三次，让中文GPT-2为你生成定制故事相关推荐

最新文章

热门文章