CONTENT:

example : KDE bug report:

https://bugs.kde.org/show_bug.cgi?id=188311

(其中还有很多comments没显示)
构建分类器,对comments中的每一句话(sentence)进行二分类。其中,0代表不选入summary,1代表选入summary。
最终,生成对bug report的答案:

研究问题:

实验方法:

1.找一帮人(10个人),对5个开源项目(Eclipse,Platform,Gnome,Mozilla和KDE)的bug report进行人工的总结,最后对每个bug report,总结出所谓的gold standard summary(GSS)。

2.根据语料库的不同(email,email&meeting data,bug report data),定义统一的特征,分别建立三个分类器。

为什么选择email和meeting data,是因为,他们都属于conversation(类似于对话的形式)的数据。

所谓的conversation features:

特别地,对于第一个分类器,基于email threads:

第二个分类器,基于email threads和meeting:

第三个分类器,基于bug report:

采用一部分bug report拿来做训练,每句话同时由三个人看过。0代表没有一个人将这句话纳入gold standard summary,1代表只有一个人将这句话纳入gold standard summary,以此类推。。。

因此,2和3(≥2)表示为positive sentence。

3.对于同一个(新的)bug report,三个不同的分类器都会生成三个不同的summary。

将其与gold standard summary进行比较,看看哪个更接近gold。

个人观点:

对于bug report的summary,更多应该针对于具体的内容而言,而其中的一些feature,例如,word count,position等显然没有十分丰富的意义,更多应该考虑一些语义方面的信息转化成为可以量化的feature。

 备注:TSE2013
 

转载于:https://www.cnblogs.com/XBWer/p/6417522.html

Automatic Summarization of Bug Reports相关推荐

  1. Combining Deep Learning with Information Retrieval to Localize Buggy Files for Bug Reports

    题目:Combining Deep Learning with Information Retrieval to Localize Buggy Files for Bug Reports 作者:An ...

  2. 如何组织成功的bug bash--摘录

    Bug bash的来源与意义 要做好这样的活动,首先我们必须明白这项活动的意义. Bug bash(Bug大扫除)来源于微软,通常发生在项目开发各阶段(微软叫里程碑)的末期,比如Beta版发布前,划出 ...

  3. ZBB – ZERO Bug Bounce

    ZBB - 0 bug 反弹 - zero bug bounce ZBB是指在项目中的某一点上,开发活动最终赶上了测试的步伐,当前已经不存在活跃bug.在ZBB之后,bug数量的峰值将显著减小,并且b ...

  4. 文件系统管理 之 Linux 创建文件系统及挂载文件系统流程详解

    作者:北南南北 来自: LinuxSir.Org 摘要:本文对新增硬盘,切割硬盘,创建硬盘分区,为硬盘分区创建文件系统,以及加载文件系统的流程做总结性论述:主要是为初学者弄清楚这一操作过程:本文涉及f ...

  5. 初识50个Linux命令

    1. [命令]:cat [功能说明]: concatenate files and print on the standard output #连接文件并打印到标准输出,有标准输出的都可以用重定向定向 ...

  6. FD.io VPP配置文件详解

    目录 VPP Configuration File - 'startup.conf' Introduction Command-line Arguments Configuration File Co ...

  7. about command : wget

    2019独角兽企业重金招聘Python工程师标准>>> about command : wget wget help lwk@qwfys:~$ wget --help GNU Wge ...

  8. 机器学习(Machine Learning)深度学习(Deep Learning)资料(Chapter 2)

    机器学习(Machine Learning)&深度学习(Deep Learning)资料(Chapter 2) - tony的专栏 - 博客频道 - CSDN.NET 注:机器学习资料篇目一共 ...

  9. 机器学习和深度学习资料汇总【02】

    <Image Scaling using Deep Convolutional Neural Networks> 介绍:使用卷积神经网络的图像缩放. <Proceedings of ...

最新文章

  1. 不懂这几个问题就落后了:Python、Android开发者必读!
  2. fatal error LNK1112: module machine type 'x64' conflicts with target machine type 'X86'
  3. Apache配置文件
  4. c# point偏移_.NET 在图片上写文字出现偏移的解决
  5. mysql修行练级之字符集,数据类型与存储引擎选择
  6. 【Android 启动过程】Activity 启动源码分析 ( ActivityThread 流程分析 二 )
  7. MFC控件编程之组合框跟列表框
  8. RTX5 | 线程管理02 - 创建线程(动态堆栈方式)
  9. 操作系统之计算机系统概述:7、操作系统的体系结构
  10. 『转』图解硬件特性!
  11. 向日蔡远程连接锁定计算机,如何远程连接电脑?向日葵远程工具告诉你?
  12. 计算机毕业设计论文资料查找
  13. Avoid passing null as the view root (needed to resolve layout parameters on the inflated layout's ro
  14. java 投票防重复_关于防止重复刷投票的个人观点
  15. C_Primer第12章 存储类型、链接和内存管理
  16. 【高并发】如何解决可见性和有序性问题?这次彻底懂了!
  17. 基于Gitee搭建免费图床
  18. 樊登读书赋能读后感_樊登读书会本周末视频解读新书:《赋能》拉开你与别人的差距,决定你人生的高度...
  19. 图解RAM结构与原理,系统内存的Channel、Chip与Bank
  20. Sloan中性群落模型(NCM)推断群落构建原理及其R实现

热门文章

  1. Java初学者都应该搞懂的六个问题
  2. 使用.Net平台构建企业应用系统场(下)
  3. SSO单点登录三种情况的实现方式详解
  4. 多类SVM的损失函数
  5. 深度学习进入芯片领域,揭秘寒武纪神经网络处理器
  6. 哈尔特征(Haar-like features)
  7. 设置Grid某列的Title样式和列内数据样式
  8. 【Excle数据透视表】如何创建非共享缓存的数据透视表
  9. 网络主机托管的特点和优点_主机托管有哪些特点和优点
  10. 这样写的博客才有更多的人愿意看