文章伪原创工具制作

什么是伪原创?

简单点来说,就是将原创文章进行加工后得到一篇意思和原文章相近的原创文章。常见于网站发文,自媒体创作,媒体搬运等。因为个体用户创作经历有限,而为了达到目的需要采取伪原创手法

常见伪原创平台

5118

奶盘

小发猫

有付费平台也有免费的,效果可能差强人意吧

伪原创原理

最为正途的,当然就是AI中,自然语言处理分支。利用语言模型进行 分词,计算词义相似度,DNN语言模型(句子通顺度)等等一系列功能整合之后而达到目的。

核心特点:

近义词,同义词替换

保证句子通顺度

实际应用

有意思的是,我用了两种方式各研究了一下。

第一种,自然语言处理,通过使用百度AI的NLP开发了一个开源项目。项目地址:language-ai , 这种可以达到目的,但很快我就发现了问题,分词,DNN语言模型倒还好,但是同义词,近义词替换这个太影响性能,而且对于同义词库的要求比较高。简单来说,就是伪原创速度慢

第二种,采用语言翻译,我们学习过英语都知道,一次多义很正常 ,这就是同义词最常见的地方。所以我们将中文翻译成英文,就会得到意思相近的文章,而且可能每篇都会不一样。然后将英文再翻译会中文,就能完成同义词,近义词替换了,并且效率很高,几千字的文章也不用多久。

第二种方式虽然有点投机取巧,但在文章伪原创上却是殊途同归

工具开发

素材:

Python3.8

PyQt5

其他依赖包

实操

先用PyQt5的designer画一个界面

这里大致画一下界面

成品效果如下

生成py文件

画好之后,按Ctrl + s 保存成 **.ui文件

在ui文件在所在目录打开cmd, 输入生成.py文件命令: pyuic5 -o fast-artcile.py fast-article.ui

这样就会看到一个同名称的py文件,这时候将py拷贝到项目工程中

调用谷歌翻译

初始化请求头,设置tkk值等

def __init__(self):

self.url = 'https://translate.google.cn/translate_a/single'

self.TKK = "434674.96463358" # 随时都有可能需要更新的TKK值

self.header = {

"accept": "*/*",

"accept-language": "zh-CN,zh;q=0.9",

"cookie": "NID=188=M1p_rBfweeI_Z02d1MOSQ5abYsPfZogDrFjKwIUbmAr584bc9GBZkfDwKQ80cQCQC34zwD4ZYHFMUf4F59aDQLSc79_LcmsAihnW0Rsb1MjlzLNElWihv-8KByeDBblR2V1kjTSC8KnVMe32PNSJBQbvBKvgl4CTfzvaIEgkqss",

"referer": "https://translate.google.cn/",

"user-agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.142 Safari/537.36",

"x-client-data": "CJK2yQEIpLbJAQjEtskBCKmdygEIqKPKAQi5pcoBCLGnygEI4qjKAQjxqcoBCJetygEIza3KAQ==",

}

self.data = {

"client": "webapp", # 基于网页访问服务器

"sl": "auto", # 源语言,auto表示由谷歌自动识别

"tl": "vi", # 翻译的目标语言

"hl": "zh-CN", # 界面语言选中文,毕竟URL都是cn后缀了,就不装美国人了

"dt": ["at", "bd", "ex", "ld", "md", "qca", "rw", "rm", "ss", "t"], # dt表示要求服务器返回的数据类型

"otf": "2",

"ssel": "0",

"tsel": "0",

"kc": "1",

"tk": "", # 谷歌服务器会核对的token

"q": "" # 待翻译的字符串

}

with open('token.js', 'r', encoding='utf-8') as f:

self.js_fun = execjs.compile(f.read())

翻译, 需要注意,返回的内容是个数组,需要将数组拼接回字符串

def query(self, q, lang_to=''):

self.data['q'] = urllib.parse.quote(q)

self.data['tk'] = self.js_fun.call('wo', q, self.TKK)

self.data['tl'] = lang_to

url = self.construct_url()

req = urllib.request.Request(url=url, headers=self.header)

response = json.loads(urllib.request.urlopen(req).read().decode("utf-8"))

# 拼接数据

targetText = []

results = response[0]

for result in results:

if result[0]:

targetText.append(result[0])

# 将数组转成字符

str = '\n'.join(targetText)

originalText = response[0][0][1]

originalLanguageCode = response[2]

print("翻译前:{},翻译前code:{}".format(originalText, originalLanguageCode))

print("翻译后:{}, 翻译后code:{}".format(str, lang_to))

return originalText, originalLanguageCode, str, lang_to

给界面中的按钮添加事件

# 绑定 开始 事件

self.pushButton.clicked.connect(self.startTrans)

添加事件处理方法

def startTrans(self):

# 这里写处理逻辑

# 1. 获取用户输入的源文本

# 2. 将文本 中 译 英, 然后 英 译 中

# 3. 将伪原创之后的内容设置回结果输入框即可

pass

这样,一个伪原创工具就完成啦

项目源码

项目源码,托管于github, 部份谷歌翻译内容,参考GitHub中的项目

项目成品

如果有一闪而过的黑窗口,那应该是打包成exe的时候,参数没填好

成品下载

方式一:关注vx公~号, GitHub严选 , 回复 “伪原创”即可下载,不限次数,永久免费。如果tkk失效,可回来看项目更新。

方式二:可自己根据源码包进行打包

温馨提示

如果报毒,很正常,只要没有发布在360,安全管家等安全平台就会报毒。大家添加信任,或者暂时关闭杀毒软件即可

python文章伪原创_文章伪原创工具制作相关推荐

  1. java伪协议_通过伪协议解决父页面与iframe页面通信的问题

    我们经常会有父页面与iframe页面的操作,比如 这个iframe里面的内容是js写的.如以下代码 var iframe = document.getElementById("iframe& ...

  2. java random 伪随机_真/伪随机、以及随机算法

    伪随机性(英语:Pseudorandomness)是一个过程似乎是随机的,但实际上并不是.伪随机数是看似随机实质是固定的周期性序列,也就是有规则的随机. 什么是随机数 随机数在计算机应用中使用的比较广 ...

  3. vue移除伪元素_获取伪元素的属性和改变伪元素的属性

    获取伪元素的属性值 获取伪元素的属性值可以使用window.getComputedStyle()方法,获取伪元素的CSS样式声明对象.然后利用getPropertyValue方法或直接使用键值访问都可 ...

  4. python移动端爬虫_移动端爬虫工具与方法介绍

    本文来自网易云社区 作者:王涛 本文主要介绍了移动端爬虫的工具与方法,作为一个入门的大纲.没有详细介绍的也给出了本人学习过程中借鉴的资料的链接,适合对移动端爬虫感兴趣的同学入门. 一.抓包模拟 基本原 ...

  5. python档案管理系统代码_文件档案管理工具下载

    晨科文件档案管理系统是一款好用的文件档案管理软件.这款软件为用户提供了电子档案一键查询.快速分享功能,支持音视频.文档.图片等各种格式文件在线预览,可直接预览查看和打印.功能非常丰富,感兴趣的朋友千万 ...

  6. python文本自动伪原创_新手一天30篇伪原创,快速在线生成原创文章

    新手一天30篇伪原创,快速在线生成原创文章 现如今新媒体行业的竞争可谓越来越大,在这个内容为王的时代,优质的内容等于一切.写不出令人满意的内容,自我感觉到失落只是一方面,另一方面则是面临着失业的风险. ...

  7. seo伪原创工具_文章伪原创工具哪个好用(伪原创工具有哪些)

    从事网站seo优化的工作基本上每天都会和文章打交道,因为网站的排名与网站的收录关系是非常大的,网站的收录又和文章息息相关,搜索引擎的胃口是比较喜欢新的内容.原创的内容,而对于一些文案功底比较没那么好的 ...

  8. SEO优化_如何伪原创文章方法

    如何伪原创 1.标题 1.1.拆分替换法 原则.分词打乱顺序 1.2.举例:拥有倩碧的六大理由 拆分:拥有 倩碧 六大理由 伪原创标题:拥有倩碧的7大原因.6大理由让你值得拥有倩碧.6大理由让你爱上倩 ...

  9. seo 伪原创_seo文章优化(怎么样做好伪原创文章)

    在seo网站优化行业中有很大一部分的站点都是以做内容为主,做内容的重点就是写文章,因为很多在搜索引擎中的排名都是靠文章的,那么我们就要着重做好文章,目前还是有很大一部分在做文章的步骤中的问题很大,就是 ...

  10. seo文章优化(怎么样做好伪原创文章)

    在seo网站优化行业中有很大一部分的站点都是以做内容为主,做内容的重点就是写文章,因为很多在搜索引擎中的排名都是靠文章的,那么我们就要着重做好文章,目前还是有很大一部分在做文章的步骤中的问题很大,就是 ...

最新文章

  1. 阅读10、11、12章
  2. javascript要点
  3. 【Python】怎么用matplotlib画出漂亮的分析图表
  4. 【腾讯Bugly干货分享】Android内存优化总结实践
  5. java怎么设置多个输入_Java中从键盘输入多个整数的方法
  6. 去掉右键新建菜单多余内容
  7. 构造函数和复制函数java_什么是Java构造函数?
  8. Storm中Topology、Worker、Executor和Task的关系
  9. 程序员别再迷茫,赚钱,方法比你想得更多
  10. linux模拟发包工具,linux发包软件-线不是一个压力测试工具的linux以上收缩服务器可...
  11. FastDFS 原理 以及 简单使用
  12. 计算机电源安装,手把手教你正确安装主机电源
  13. 如何获取Windows 10的旧默认桌面背景
  14. 交易系统开发(十二)——QuickFIX官方文档
  15. VS2008简体中文版下载及安装破解
  16. control c linux命令,linux中Control+C是什么指令?使用什么命令可以给一个进程发出一个这样的指令?...
  17. mysql 按照条件计数_Mysql按条件计数的几种方法
  18. 如何安装计算机刻录程序,详解怎么用电脑刻录光盘
  19. 资产配置记录20210814
  20. StateFlow 状态流

热门文章

  1. 【Java小项目实训】编写一个窗体程序显示的日历 万年历
  2. 桥梁防撞主动预警系统解决方案-广州泛尔维
  3. 竞赛保研(自动化专业)
  4. 深度学习与计算机视觉教程(6) | 神经网络训练技巧 (上)(CV通关指南·完结)
  5. 仿微信朋友圈发表图片拖拽和删除功能
  6. word查重_2020论文查重倾情分享 | 查重注意要点
  7. 通达信买入离场信号选股公式,精准买卖点 不加密无未来
  8. 监督学习-分类模型1-线性分类器(Linear Classifiers)
  9. 10 QT - 自定义信号和槽
  10. spring boot企业合同管理系统 毕业设计源码161456