庄羽提议郭敬明成立反剽窃基金,AI:反剽窃,不行;剽窃,行!
大数据文摘出品
作者:王烨
郭敬明终于道歉了。
2020年12月31日零时,郭敬明就当年小说《梦里花落知多少》抄袭庄羽的作品《圈里圈外》一事在微博上道歉。
同时郭敬明还表示,将把《梦里花落知多少》的版权收入全部赔偿给庄羽女士,“如果庄羽女士不愿意接受,我会把这笔钱捐给公益慈善机构”。
郭敬明道歉后,庄羽也很快进行了回应:时隔十五年,收到郭敬明的道歉,如郭敬明先生所说,这的确是一份迟来的歉意,我接受郭敬明先生的道歉。
除了接受郭敬明的道歉,庄羽还提议将《圈里圈外》这本小说出版后获得的线上线下所有版税以及全部收益同《梦里花落知多少》的收益合并在一起成立一个反剽窃基金,用以帮助原创作者维权。
至于具体的维权方式,尽管庄羽没有表示,但可以想见只可能是用于支持原创作者在发现别人抄袭自己后,维护自身权益的各种举措。
而以目前的网络文学数量来看,原创作者最需要的——也是最难的一点——是及时发现自己被剽窃了。
如果只是靠人力,多大规模的反剽窃基金都很难做到及时发现剽窃现象。
那这事儿,能不能靠AI?
AI 反剽窃,并不容易
一提到反抄袭、反剽窃,我们的第一反应一般都是论文的自动查重系统。无数学子都曾在“降重”(降低重复率)的路上被论文查重系统按在地上反复摩擦。
传统的论文查重系统并不能称为现在意义上的AI,比如我们熟知的知网论文查询,就是以连续十三个字符重复为原理,通常是以句子为单位,就是说一句话当中如果有连续十三个以上含十三个字符重复的,则该句被判定为重复率的概率就比较高。
但是这一呆板系统有着明显的缺陷,简单的更换同义词、更换语序就能很大程度上避开这种查重。
这就涉及到了NLP领域一个非常有意思的领域——文本语义相似度计算。
举个例子,智能客服如何理解人类针对同一个问题的同一个提法?
“花呗如何还款”&“花呗怎么还款”
“花呗如何还款”& “我怎么还我的花被呢”
“花呗分期后逾期了如何还款”&“花呗分期后逾期了哪里还款”
对AI来说,理解这些相似的问题并不容易。从传统的特征工程方法,到现在的深度学习方法,这一问题都没有得到很好的解决。
Kaggle针对这一问题也有一些比赛,主要是针对搜索引擎和QA系统,这也侧面说明了目前AI连单个句子的相似性分析都很难准确判断,更别谈对整个文章甚至书籍相似度的剽窃判断了。
更何况,即使往后AI解决了文本语义相似度的问题,抄袭者如果在文学作品中只抄袭故事架构和情节,AI想要判断就难上加难了,这个难度甚至超越了AI对于语义的理解,上升到了AI对人类复杂社会和情感关系的理解。
当然了,如果是直白的抄袭,改写都懒得改写,那么最简单的查重系统都可以查出来,比如下面这个。
反剽窃不行,AI剽窃却很在行
AI是把双刃剑,这句话用在剽窃和反剽窃上太合适不过了。
尽管刚才说了目前AI剽窃可能还不能做的很好,但是剽窃这事儿,AI现在却很在行。
在百度上随便搜一下,都能搜到一些可以用AI洗稿的工具,号称可以通过AI识别他人的原创文章,然后通过改写生成一篇“伪原创”的文章。
就针对上面那句话,文摘菌找了一个有线上版本的AI智能改写工具试了一下。顺便看了看工具的介绍,上面列举了几个耳熟能详的NLP技术:情感分析、信息分类、实体识别。
这么一看,效果貌似还行,但还是很容易就看出来是改写的,比如第三句只是将“号称”改成了“声称”。
也许这种改写工具很难对付严格的学术审查,但是对付像微信公众号原创校验这样的反抄袭机制呢?
我们不妨来试试。
首先选择一篇文摘的原创文章,然后进行改写。
之后我们再将改写后的文章复制到后台发送,看能不能通过原创校验。
点击发送之后,微信公众号后台并没有弹出原创校验不通过的选项,而是可以直接发送。
很显然,至少这个工具可以成功剽窃微信公众号文章而不被原创校验机制发现。
这么看来,难道AI真的有点不厚道,反剽窃不行,剽窃却很在行?
近期开班情况
课程详情请扫码咨询
庄羽提议郭敬明成立反剽窃基金,AI:反剽窃,不行;剽窃,行!相关推荐
- 港科夜闻|香港科大与香港资管通有限公司签署校企合作备忘录,成立校企合作基金促科研成果落地...
关注并星标 每周阅读港科夜闻 建立新视野 开启新思维 1.香港科大与香港资管通有限公司签署校企合作备忘录,成立校企合作基金促科研成果落地."港科资管通领航基金"28日在香港成立,将 ...
- 如何理解:先减1后取反和先取反后加1得到的结果是一样的,故仍可采用取反加1的方法,即对于机器数为负数,则有[X]原=[[X]补]补。
对二进制数来说,先减1后取反和先取反后加1得到的结果是一样的,故仍可采用取反加1的方法,即对于机器数为负数,则有[X]原=[[X]补]补. 当然你也可以用先减1后取反的方法来求补码对应的原码. 对于求 ...
- 如何反编译,防止反编译,常见问题总结
本文对如何反编译,防止反编译,和常遇到的问题做了个总结,并略有修改. 资源来自:http://blog.csdn.net/sunboy_2050/article/details/6727581 htt ...
- 【大佬漫谈】5G对AI反欺诈行业提出更高要求——谢映莲
转自:澎湃新闻 硅谷AI创业者谢映莲:5G对AI反欺诈行业提出更高要求 澎湃新闻见习记者 张唯 实习生 邹静祺 2019-03-25 07:37 来源:澎湃新闻 "人工智能的本质是一项技术或 ...
- 常见的反爬措施:UA反爬和Cookie反爬
本文分享自华为云社区<Python爬虫反爬,你应该从这篇博客开启,UA反爬,Cookie 特定参数反爬>,作者:梦想橡皮擦. 通过前面的爬虫程序,你或许已经注意到,对于目标站点来说,爬虫程 ...
- java判断jd安装,java - 安装和使用 java 反编译应用: jd-compiler ,以及命令行的使用...
java - 安装和使用 java 反编译应用: jd-compiler ,以及命令行的使用 2020-07-05 17:26 访问量: 351 分类: 技术 1. 下载 对应的jar 文件 ( jd ...
- 爬虫笔记41之反爬系列四:字体反爬、JS反爬
一.字体反爬 1.什么是字体反爬? 开发者创作了一种字体(字体代号):网页中显示的就是这种字体代号. 字体反爬也叫CSS反爬,就是因为这个字体是隐藏在我们css文件当中的一个.ttf文件. 2.如何 ...
- 卷积、空洞卷积、反卷积与空洞反卷积的计算公式(全)
前言: 经常使用的卷积有卷积.空洞卷积.反卷积与空洞反卷积的,下面总结了他们的计算公式. 一.卷积计算公式 卷积神将网络的计算公式为: N=(W-F+2P)/S+1 其中 N:输出大小 W:输入大小 ...
- 【反编译系列】反编译so文件(IDA_Pro)
概述 安卓应用程序的开发语言是java,但是由于java层的代码很容易被反编译,而反编译c/c++程序的难度比较大,所以现在很多安卓应用程序的核心部分都使用NDK进行开发.使用NDK开发能够编译c/c ...
最新文章
- x86汇编-1(第一章—第二章)8086处理器基本情况
- android:parentActivityName
- ReactJS入门之JSX语法
- linux7.0怎么设置中文,CentOS 7 yum安装zabbix 设置中文界面
- html排序图标,css实现排序升降图标
- Kotlin——中级篇(二): 属性与字段详解
- 华为0基础——名字的美丽度
- 重装win10专业版系统
- 2、什么是软件过程?它与软件工程方法学有何关系?
- 同一个基站连接两个核心网AMF POOL的场景分析及带AMF重选的注册流程
- Dubbo相关问题如何用管程实现异步转同步?
- 【docker问题】Client.Timeout exceeded while awaiting header
- java security_java.security.NoSuchAlgorithmException
- Calcite的PullUp规则
- 字符串根据字节长度进行截取并展示选中效果——js字符串获取字节长度
- vue和java获取地理位置经纬度
- java 属性签名_java – 使用BouncyCastle将签名/身份验证的属性添加到CMS签名
- WebGl之.wrl生成.stl文件
- oracle可视化图标,Oracle Data Visualization Desktop 试用
- 常用的RFID卡 14443A/B, 15693
热门文章
- MySQL——插入数据
- 三星android5 root包,三星 S5360的安卓 2.3.5系统 root成功
- LA 4394 刷字符串(区间dp)
- HTTP状态码 201 304 404 500等代表的含义
- Tokenview.io推出ETH 2.0信标链浏览器
- 【计算机组成原理】实验1:运算器
- Snap--Linux系统下 (Ubuntu)软件包管理工具
- html 5抽奖特效,利用HTML5实现Canvas大转盘抽奖特效
- 【修复H5农场复利】黄金家园农场理财游戏源码Thinkphp开发 带商城仓库商店模块
- win10中安装JDK8以及环境配置