梦晨 发自 凹非寺
量子位 报道 | 公众号 QbitAI

Colossal Information(巨型信息)、Counterfeit Consciousness*(伪意识)”、Elite Figuring(精英盘算)……

这些看起来比机翻都不如的学术名词,竟然都是从计算机类SCI期刊上找到的。

法国图卢兹大学一位副教授Cabanac,从4月份开始注意到这个现象。

他先是发现30篇左右用词实在别扭的论文,去文献搜索平台搜一下这些词又发现更多同类论文。

再把新论文中出现的词汇收集起来挨个去搜索,又能找出更多论文……

这么滚雪球下来,Cabanac搜集到了一大堆辣眼睛词汇,再结合上下文挨个把本来的意思推测出来,做成一张对照表:

原来“巨型信息”就是大数据,“伪意识”指的是人工智能,“深刻神经组织”其实是深度神经网络……

就像是把英语名词机翻成其他语言,经过多道翻译后再翻回英语弄出来的。

到这里Cabanac实在看不下去了,决定带领团队动手查一下到底是谁在搞事。

60%来自同一期刊,大部分来自中国

他利用Dimension文献搜索引擎查询深度神经网络的替代词“profound neural organization”。

发现这个词在《微处理器与微系统》(Microprocessors and Microsystems)这个期刊上出现次数最多。

《微处理器与微系统》是SCI期刊,由爱思唯尔发行,主要关注计算机软件、硬件与架构、网络与通讯和AI这4个领域。

《微处理器与微系统》的影响因子

这本期刊成了重点研究对象,最后统计结果860篇至少包含一个辣眼词汇的论文里有500多篇都来自这里。

为了深入调查,Cabanac团队下载了2018-2021年间发表在《微处理器与微系统》上的所有论文。

对论文的提交日期、接受日期等数据进行分析,发现2021年的论文的评审时间缩短了5倍,只有平均只有42天。

甚至一部分出现在特刊(Special Issues)上的论文,提交、修订和接受日期都相同。

然后,最离谱的来了。

在404篇评审时间少于30天的论文中,有394篇的作者来自中国研究机构,占比97.5%

而615篇评审时间大于40天的论文中,只有58篇的作者与中国相关,占比只有9.5%

面对这个接近10倍的差距,研究人员只能推测在中国有着非常规的论文评审过程。

但是为什么从2021年开始?

Cabanac猜测与以GPT-3为代表的语言模型逐渐成熟有关。

为了验证这一想法,他们找来了检测工具GPT Detector给论文摘要部分打分,分数高代表文本更有可能是通过GPT系列模型生成的。

最终实验结果是,《微处理器与微系统》389篇评审时间少于30天的论文得分显著高于其他控制组。

生成后的论文为了规避查重,才把专业名词都换成经过多道机翻出来的。再配合上不规范的评审流程,这些论文得以大量发表在SCI期刊上。

除了《微处理器与微系统》之外,团队还在其他35种计算机学科期刊上发现带辣眼机翻的论文。

Cabanac的研究结果一经发布,很多计算机学科之外的学者表示:啊这,我也见过这种辣眼机翻。

一位教授怀疑他学生的论文都是在网上找人把维基百科内容替换名词搞出来的:

在化学上,用“瘦电影”代替“薄膜”就太奇怪了:

为了规避抄袭检查

7月中旬,《微处理器与微系统》的出版商爱思唯尔对这一现象展开调查,对6期特刊上的400多篇论文进行逐一重新评审。

爱思唯尔发言人表示,这些论文使用反向翻译进行名词替换很可能是为了规避抄袭检查,也找出了流程中负责论文的编辑不按规定操作的现象。

调查还发现有49篇论文最初被提交给特刊并被特邀编辑接受,但随后应作者的要求,以定期刊物的形式发表。

看到这里我嗅到了一丝熟悉的味道,毕竟刚才在搜索《微处理器与微系统》期刊的基本情况时,跳出来的广告就是这个。

论文地址:
https://arxiv.org/abs/2107.06751

参考链接:
[1]https://www.nature.com/articles/d41586-021-02134-0
[2]https://retractionwatch.com/2021/07/19/tortured-phrases-lost-in-translation-sleuths-find-even-more-problems-at-journal-that-just-flagged-400-papers/

SCI期刊上发现大量辣眼学术名词,用机翻规避抄袭,作者主要来自中国相关推荐

  1. 机翻降重?掩饰抄袭?SCI期刊上的这些「奇言怪语」,不少来自中国作者

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 来源丨机器之心 编辑丨极市平台 导读 研究者将研究重点放在了< ...

  2. 环境类sci期刊排名一区_SCI计算机学术期刊排名(收藏对你有用)

    计算机学术期刊排名 :Computer Science Journal Rankings AREA: Databases Premium: Information Systems ACM Trans ...

  3. 计算机类ei和sci期刊,请教大家计算机领域数据挖掘方面有哪些比较好中的EI期刊和SCI期刊 - 论文投稿 - 小木虫 - 学术 科研 互动社区...

    一.A类 序号 刊物简称 刊物全称 出版社 网址 1 TODS ACM Transactions on Database Systems ACM http://www.acm.org/tods/ 2 ...

  4. 图像处理方面的sci期刊_图像处理类的SCI期刊

    图像处理类的SCI期刊 发布时间:2020-02-26浏览:1次 图像处理属于计算机技术学科之一,主要是用计算机对图像进行分析,以达到所需结果的技术.目前,该项技术已应用于多个领域,比如:医学.化学. ...

  5. SCI期刊论文发表的优势有哪些

    SCI期刊论文发表的优势有哪些?如果可以在SCI期刊上发表论文,这代表有国际水平的实力.有一篇SCI论文就能带给作者众多优势,相比于国内的学术期刊上发表文章,SCI论文在国际上的认可度更高.下面小编就 ...

  6. 投稿指南【NO.14】SCI期刊推荐(mdpi旗下)

    写在前面:SCI论文发表是我国高校机构与基地评估.成果评奖.项目立项.人才培养等方面的重要考核指标,更不要要说关系到我们个人的毕业.晋升和前途.SCI含金量之高,要是读研读博科研工作期间能发表,将对直 ...

  7. 如何查看SCI期刊影响因子

       近期在看论文时多关注了一下期刊,想着未来肯定会考虑期刊影响因子等因素,于是查到了一个比较好的网站--LetPub    官网介绍: LetPub 是ACCDON(美国)旗下为非英语国家科研学者提 ...

  8. 【学术相关】顶级论文创新点怎么找?中国高校首次获CVPR最佳学生论文奖有感...

    几天前,同济大学公布了一条重磅消息:本校学生陈涵晟获得CVPR2022最佳学生论文奖,这也是CVPR自2001年设立最佳学生论文奖以来,获奖论文的第一作者首次来自中国高校. 华人在CV领域崛起 最近几 ...

  9. jeecg输入中文查询导表为空_学术利器—SCI期刊影响因子查询/中文核心期刊查询系统更新...

    吐槽 想起自己第一次投中文期刊的情形:当时学校最低要求是发表一篇核心级别的期刊论文,但是哪些期刊是核心期刊呢?完全不知道!都怎么投稿呢?也完全不知道!只能问问周围的同学或者师兄师姐.他们也就知道谁谁谁 ...

最新文章

  1. 一年几百亿的电费 中国移动再提5G功耗问题
  2. java nio集群_java – Hazelcast:连接到远程集群
  3. 一对多 java_mybatis一对多和多对一
  4. 微信开发七(配置js-SDK,步骤2)
  5. 什么是Vue.nextTick()
  6. 字节跳动九周年张一鸣演讲:反对all-in、抽象概念和方法论
  7. 《游戏大师Chris Crawford谈互动叙事》一1.1 故事叙述的历史
  8. 麦克纳姆轮单轮速度分析
  9. 自定义完整安装rhel7_服务器系统Windows Server 2008 R2安装教程
  10. windows CA的几点记录小结
  11. Atitit 效率提升法细则 v3 t028.docx Atitit 提升效率细则 目录 1. 目标 2 1.1. 配置化增加扩展性 尽可能消除编译 方便增加 调整业务逻辑 2 1.2. 统一接口
  12. EDA技术实用教程 | 复习二 | Verilog基本语法
  13. 计算机属性中没有端口,电脑设备管理器里没有显示COM2端口是什么原因
  14. 【精品软件】鼠标右键菜单设置管理工具
  15. can的总结——笑笑
  16. 3w最简单led灯电路图_三种常用的LED驱动电源电路图详解
  17. Speedoffice(excel)如何加粗边框线条
  18. 数据预处理--缺失值填补《菜菜学习笔记》
  19. Python学习笔记(八)爬虫基础(正则和编解码)
  20. C++ decltype类型提示符总结

热门文章

  1. 如何找到域名的权威名称服务器?
  2. 如何以编程方式在Android上截屏?
  3. \\ n和\\ r之间的区别?
  4. 为什么密码比字符串更喜欢char []?
  5. 页面加载后如何使JavaScript执行?
  6. 如何在JavaScript中验证电子邮件地址
  7. 重新建立域计算机账户与域控制器的联系
  8. springMVC3学习(二)--ModelAndView对象
  9. web网页获取,cookie 的管理,post和get方式的模拟。
  10. 运维用python可以来做什么_学习Python一般可以用来干什么?