每天给你送来NLP技术干货!


文 | python
编 | 小轶

来自 | 夕小瑶的卖萌屋

前言

不知诸位在科研的起步阶段,是否曾有过如下的感受:

  • 总感觉自己写的论文就是和自己读过的论文长得不太一样,也不知道为啥。

  • 投稿的时候,审稿人也总是 get 不到论文的核心,只揪着论文的次要细节不放

在本文中,笔者吐血整理大量的论文写作小细节。从格式到内容上帮你提升论文的清晰度和易读性,可以显著缓解论文写完后导师不爱看,评审看不懂等症状。

本文适合对LaTeX基本语法有所了解的同学食用。

符号篇

数学公式中的字母

  • 标量符号用小写拉丁字母表示。为避免混淆字母 l 和数字 1 ,字母 l 可用 \ell 替代。

  • 有结构的值,如句子、树、图等,用 \boldsymbol(e.g. )。

  • 向量值小写加粗。拉丁字母用\mathbf(e.g. ),希腊字母用\boldsymbol(e.g. )。

  • 矩阵大写加粗。拉丁字母用\mathbf(e.g. ),希腊字母用\boldsymbol(e.g. )。

  • \boldsymbol{x} 组成的集合用\mathcal{X}(),a 组成的集合用 A(a A)。

  • 数域用\mathbb{R}(),\mathbb{Z}()。

标点符号

  • 数学公式中的省略号用\ldots,例如:

  • LaTeX中英文引号的打法是: ``''

  • 尽量避免用引号标记较长的文本,比如 case study 中的例子。因为引号的理解是上下文相关文法,引用文本过长不易把握引号的边界。Case study 中的例子可以用 \textit{} 标记。

  • 网络链接用 \url{} 标记。

公式篇

  • 使用 align 表示一组公式,一般情况下以等号对齐会更好看。对齐方式:每个公式的等号处加 &。

  • (建议,有争议)只对refer的公式加编号,align中,可以用\nonumber去掉编号

  • 公式中的 softmax,proj,enc 等,超过一个字母的变量或符号,要用正文字体,即写成 \textrm{softmax} 或 \textit{FFN}。很多函数有现成的符号,例如:\arg,\max,\sin,\tanh。

  • 公式中的括号,要用\left,\right 进行标记。如 \left(\right),\left{ \right}。<>、|| 这种括号也是一样的。括号中的分割可以搭配\middle。

错误的例子:softmax 中间的迷之空格,pro和j之间的迷之空格。

部分正确的例子:还没有加粗,公式5的乘号也还没有改,只是展示一下align,以及\textrm的影响。

概率相关的例子

表格篇

表格的大小、换行

  • 用 \centering 居中

  • 用 p{2cm} 固定列宽

  • 用\small,\scriptsize,\footnotesize,\tiny 调整字号

  • 用\setlength{\tabcolsep}{8pt} 调整列间距

  • 用\multirow,\multicolumn 合并单元格

  • 用\toprule,\bottomrule, \midrule, \cmidrule画出好看的分隔线

示例:

表格对齐

  • 展示数据的列,如果数据不等长,请右对齐。(下图左边是错误地做左对齐的示例,右边为正确的)

  • 表格中的加粗请使用 \textbf{},而非\bf。上图右边中,14.10的加粗就错误地使用了\bf,导致对齐出现问题(这一问题仅在某些模板中存在),而17.24的加粗就使用了\textbf{}。

词汇篇

避免过于绝对和模糊的表达:

以下词汇除了极特殊情况外,不要出现(→后是可供替代的词):

  • obvious (→ straightforward)

  • always (→ generally)

  • never (→ rare)

  • avoid (→ alleviate)

  • meaning, semantic, better, simple, easy, trivial ...

单复数

  • phenomenons  →  phenomena

  • 不可数名词:evidence 等。

专有名词的大小写

核心原则:符合习惯,与提出者尽量一致,第一次提时全称在前。常用词一般不大写,除非语义和词本意不同(比较少见,同时也尽量避免)。

  • CNN,LSTM

  • graph attention network (GAT),pre-trained language model (PLM)

  • FEVER,ConceptNet,SQuAD,BiDAF,FEVER score,Wikipedia

句子篇

表述尽量具体,避免贴标签

核心在于,要讲清楚提出的方法到底改善了哪里,是什么导致的这个结果。而不要总是说提出的方法提升了分数,提升了某部分分数,相对什么提升了分数。这种贴标签的话,可以有,但一定不能通篇都是。

示例1

  • 贴标签:a simple yet effective approach to solve this problem, which improves performance and robustness.

  • 具体:a simple yet effective approach to help XXX to learn/recognize XXX

示例2

  • 贴标签:experiments show that our model achieves state-of-the-art performance.

  • 不太具体(用于摘要):experiments show that our model can XXX, and outperform exisiting methods in literature.

  • 具体(用于总结):experiments show that our model can make better and full use of XXX, especially those XXX ones, thus achieving state-of-the-art performance.

一句话尽量只说一件事

分割前:全都混在一起,读起来总有一种:“我是谁?我在哪?我在干什么?”的迷惑。

To connect XXX using relations XXX, we train a classifier on XXX, where the sizes of training/validation/test instances are A/B/C, and we finally obtain a accuracy of XXX on the test set.

分割后:做了什么,怎么做的,过程细节,结果效果。四句分开说。

We predict the relations between XXX, linking XXX. Specifically, we train a classifier using XXX. The sizes of training/validation/test instances are A/B/C, respectively. The results show that our method obtains the accuarcy of XXX on the test set.

注意句子间的逻辑

主要需要明确,每句话想表达什么。表达的这个内容的前序铺垫都清楚了么结论和条件之间是否有直接因果关系?或者比较间接但也铺垫充分了?尤其包含对于thus,therefore等因果指示词的句子,需要更加注意。

以及,段落开头的句子是否可以概括段落的核心思想段落中每句话是否都和这个思想相关?有没有跑题?

其实,在处理段与段及章节之间的逻辑时,也都是类似的思路。

他山之石

以下是笔者多年珍藏的各路大佬给出的写作建议,这次也一并分享出来,以供大家参考。

1. 机器翻译学术论文写作方法和技巧:清华大学刘洋老师在CWMT-2014上做的经典报告,以机器翻译的视角,从选题开始,给大家讲解了论文写作的方法和技巧。

http://nlp.csai.tsinghua.edu.cn/~ly/talks/cwmt14_tut.pdf

2. 如何端到端地写科研论文?:复旦大学的邱锡鹏老师在CCL-2018的student workshop上做的报告。

https://xpqiu.github.io/slides/20181019-PaperWriting.pdf

3. 论文写作的易读性原则:刘一佳同学, 阿里巴巴达摩院的阿里星大神,在NLPCC-2018上做的报告。

http://yjliu.net/cv/res/2018-08-19-nlpcc-sws.compressed.pdf

4. 哥伦比亚大学的Henning Schulzrinne老师的一些学术随笔,其中也有一个论文写作的collection。

http://www.cs.columbia.edu/~hgs/etc/writing.html

5. 哈佛大学的Whitesides老师从写提纲的角度切入讲解如何撰写学术论文。

https://onlinelibrary.wiley.com/doi/pdf/10.1002/adma.200400767

6. 如何让摘要吸引人?Nature论文摘要模板值得收藏。

https://zhuanlan.zhihu.com/p/158574876

7. 支付宝研究员王益的建议:“学好语文,才能写好代码”(很多观点对写论文同样适用)

https://zhuanlan.zhihu.com/p/157243326

不管是本文谈到的细节,还是上面大佬们给出的写作建议,都只是一种风格而已,可以参考,但没有必要死守。各家有各家之言。论文写作的首要目的是支撑、凸显核心论点,而在这一前提下,保持一致最为重要。

萌新可以考虑以本文,或上面提到的某位大佬的材料中的写作风格为起点,在和导师、师兄/师姐的磨合中,逐渐形成自己的写作风格。而熟手也可以参考本文,吸收部分建议,融入到自己的风格中,作进一步完善。

写作最重要的还是经验。多写、多练、多总结、多思考、多听取导师的建议,相信你的写作水平会突飞猛进。让你的导师不再看你文章时心急得抓耳挠腮;让评审不会迷失在糟糕的写作中,能够一眼看出你的贡献点,打出 strong accept!


投稿或交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

整理不易,还望给个在看!

学术必备 | 论文写作中注意这些细节,能显著提升成稿质量相关推荐

  1. 吐血整理:论文写作中注意这些细节,能显著提升成稿质量

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 文 | python 编 | 小轶 前言 不知诸位在科研的起步阶段,是否曾有过如下的感 ...

  2. 计算机伦理问题论文,仲伟民:论文写作中的学术伦理问题

    原标题:仲伟民:论文写作中的学术伦理问题 学术论文的文字问题,已经成了学术界的一大困扰,作者.编辑.教师.学生各有苦恼.一般认为不少年轻学人缺乏文字的自觉,需要提醒和指导,但问题似乎没有这么简单,年轻 ...

  3. 论文写作课堂总结4:学术论文写作中的语法问题

    论文写作课堂总结4:学术论文写作中的语法问题 在课上,闵老师讲解了实用的两种方式来在学术论文写作中规避可能的语法问题 1.借鉴法 简单说,就是多阅读顶刊论文,仔细阅读后总结出在顶刊学术论文中常使用到的 ...

  4. 中虚数怎么表示_英文论文写作中的常见错误

    之前写过一篇如何写中文论文,这次就写个英文论文写作中的常见错误吧.都是平时自己整理总结的,也是一路摸爬滚打的见证吧.如有错误,欢迎批评指正.未完待续...... 1.逗号粘连: 两个独立的句子间要用句 ...

  5. endnote style_教你在论文写作中玩转 Endnote

    Endnote的功能主要集中在三个方面,即文献的管理.引用和搜索. 在之前关于Endnote的干货的内容中,小编已经向大家介绍了关于Endnote的基本操作和文献导入方面的内容,阅读本文之前,希望读者 ...

  6. 【论文写作】有了这些网站,可以解决论文写作中99.9%的问题!

    在写论文的过程中,我们会遇到各种各样的问题,包括但不限于文献查找.文献笔记不条理.格式转化.图片修饰等.下面为大家搜集了一些实用网站,可以有效解决论文写作中99.9%的问题! 1 写作必备 mdnic ...

  7. 【学术】英文写作中值得参考的语法、句式(三)

    作者:邹世辉 链接:https://www.zhihu.com/question/23684933/answer/199029667 来源:知乎 著作权归作者所有.商业转载请联系作者获得授权,非商业转 ...

  8. 在论文写作中哪些行为可以被认定为抄袭?

    论文剽窃.学术造假成为学术界.媒体关注的话题.有的学者希望幸运,有的学者不重视学术的严谨性,使之被相关人士揭露,最终名垂千秋. 而许多毕业生由于种种原因,没有注意剽窃现象,最终无法顺利毕业,浪费了几年 ...

  9. 柱状图和折线图_SCI论文写作中折线图和柱状图的区别

    编者按 科研人SCI由洪堡学者,香港大学,中科院等多单位的博士团队联合打造,专注于科研论文写作和科研咨询,欢迎大家点击上方蓝字科研人SCI关注我们. SCI论文写作中折线图和柱状图的区别 在SCI论文 ...

  10. 修改正文中参考文献标注_论文写作中怎样正确插入参考文献,引用文献如何标注?...

    论文写作中怎样正确插入引文文献,引用文献如何标注?不管是大学毕业生还是期刊/评职称的我们在面对撰写论文时,参考文献的引用是必不可少的.参考文献的引用可以给论文增添很多的光彩.正确的在论文中引用参考问下 ...

最新文章

  1. 2 - 4 - 实例:X86的中断与异常机制(9-48)
  2. 信息系统项目管理师范围管理
  3. Codeforces Round #632 (Div. 2) F. Kate and imperfection 数论 + 贪心
  4. html5 支持音频格式,html5中audio支持音频格式
  5. 【转】Dynamics 365中开发和注册插件介绍
  6. 数值计算方法(七)——两种消去法求解线性方程组
  7. 花生壳动态域名解析工具原理
  8. IOS推送通知的实现步骤
  9. Mac版正式上线剪映,适配用M1
  10. C++ printf输出
  11. Installing Perl modules from CPAN
  12. 数据分析师人才需求的分析报告
  13. 数学建模入门-python实现单目标模糊综合评价法
  14. 实验一:线性表的基本操作实现及其应用
  15. 单点登录(SSO)-- 实现单点登录的几种方式
  16. div布局三栏-左中右
  17. 淘淘商城——展示购物车商品列表
  18. 豆豆趣事[2016年03月]
  19. 2021最新chrome浏览器与chromedriver版本对照表
  20. python中tell_Python中tell()方法的使用详解

热门文章

  1. 同步,异步,阻塞,非阻塞?
  2. python模块-logging和collections以及random模块
  3. 删除none的images
  4. fastdfs安装部署
  5. 团队计划(4.22)
  6. UVa11809-Floating-Point Numbers
  7. 获取当前时间---年月日时分秒------iOS
  8. Node.js 应该用在什么地方
  9. itsdangerous
  10. translclude