来源:微软研究院AI头条

本文约3600字,建议阅读10分钟。

2019年度数据智能与计算及图形学领域论文推荐。

数据智能

1. Data-anonymous Encoding for Text-to-SQL Generation

论文链接:https://www.microsoft.com/en-us/research/publication/data-anonymous-encoding-for-text-to-sql-generation/

在跨领域 Text-to-SQL 研究中一个重要的问题是识别自然语言语句中提到的列名、表格、及单元格的值。本文中提出了一种基于中间变量和多任务学习的框架,尝试同时解决表格实体识别和语义解析问题,取得了良好的效果。论文在 EMNLP 2019 会议发表。

2. Towards Complex Text-to-SQL in Cross-domain Database

论文链接:https://www.microsoft.com/en-us/research/publication/towards-complex-text-to-sql-in-cross-domain-database-with-intermediate-representation/

计算机的可执行语言(例如 SQL 语句与存储结构紧密相关)与自然语言存在不匹配问题,给复杂问题的语义解析带来了困难。为了解决这个问题,论文中设计了一种中间语言。先将自然语言转换成中间语言,再将中间语言转换成 SQL,可以提高语义解析的准确率。该论文已在 ACL 2019 会议发表。

3. Leveraging Adjective-Noun Phrasing Knowledge for Comparison Relation Prediction in Text-to-SQL

论文链接:https://www.microsoft.com/en-us/research/publication/leveraging-adjective-noun-phrasing-knowledge-for-comparison-relation-prediction-in-text-to-sql/

在自然语言理解中,知识的运用非常重要。本文以 Adjective-Noun Phrasing Knowledge 为切入点尝试在 Text-to-SQL 中运用语言相关知识来提高语言理解的准确率。论文在 EMNLP 2019 会议发表。

4. FANDA: A Novel Approach to Perform Follow-up Query Analysis

论文链接:https://www.microsoft.com/en-us/research/publication/fanda-a-novel-approach-to-perform-follow-up-query-analysis/

在多轮式对话中,对话语句中经常存在省略或指代,需要根据上下文来理解当前语句。本文分析总结了在对话式数据分析中普遍出现的省略或指代现象,并提出了将当前语句补充完整的方法。论文发表在 AAAI 2019。

5. A Split-and-Recombine Approach for Follow-up Query Analysis

论文链接:https://www.microsoft.com/en-us/research/publication/a-split-and-recombine-approach-for-follow-up-query-analysis/

本文中提出了一个处理上下文的 split-recombine 框架,能够用来有效处理对话语句中经常存在上下文省略或指代问题。这个框架既可以用于将当前语句补充完整(restate),也可以直接生成 logic form(例如SQL)。论文发表在 EMNLP 2019。

6. QuickInsights: Quick and Automatic Discovery of Insights from Multi-Dimensional Data

论文链接:https://www.microsoft.com/en-us/research/uploads/prod/2019/05/QuickInsights-camera-ready-compliant.pdf

该论文创新性地提出了多维数据中洞察 (insights) 的一种普遍适用的抽象定义,并系统化地提出了面向大规模多维数据的有效的洞察挖掘算法。文章发表在 SIGMOD 2019。相应技术从2015年起转化到微软 Power BI,Office 365 等产品中。

7. TableSense: Spreadsheet Table Detection with Convolutional Neural Networks

论文链接:https://www.microsoft.com/en-us/research/uploads/prod/2019/01/TableSense_AAAI19.pdf

文章提出的基于深度学习模型的 TableSense 技术,可对电子表格进行区域检测和表格结构理解,并将其转换为结构化的多维数据进行自动分析。这项技术已转化到微软的 Office 365 产品中,随 Ideas in Excel 功能全面上线。文章发表在 AAAI 2019。

8. Text-to-Viz: Automatic Generation of Infographics from Proportion-Related Natural language Statements

论文链接:https://www.microsoft.com/en-us/research/publication/text-to-viz-automatic-generation-of-infographics-from-proportion-related-natural-language-statements/

该论文发表在 IEEE VIS 2019,首创了由自然语言自动生成数据信息图(Infographics)的技术。该技术使人们能够非常容易的获得大量数据信息图的设计,用于加强数据故事的表达。

9. DataShot: Automatic Generation of Fact Sheets from Tabular Data

论文链接:https://www.microsoft.com/en-us/research/publication/datashot-automatic-generation-of-fact-sheets-from-tabular-data/

该论文发表在 IEEE VIS 2019,提出了一种从数据表格出发自动生成由多个数据信息图组合而成的数据海报的技术。

10. Towards Automated Infographic Design: Deep Learning-based Auto-Extraction of Extensible Timeline

论文链接:https://www.microsoft.com/en-us/research/publication/towards-automated-infographic-design-deep-learning-based-auto-extraction-of-extensible-timeline/

该论文提出了一种自动从图片中抽取数据信息图模板的技术。利用计算机视觉技术,将时间轴的设计图片分解成多个视觉元素并重新组合,使可视化时间轴设计图片的重用成为了可能。该论文发表在 IEEE VIS 2019。

11. Visualization Assessment: A Machine Learning Approach

论文链接:https://www.microsoft.com/en-us/research/publication/visualization-assessment-a-machine-learning-approach/

该论文发表在 IEEE VIS 2019,探索了自动评估可视化图片特性的方法,比如记忆度、美观度,让机器学习的算法在可视化的生成、推荐中发挥作用。

12. Supporting Story Synthesis: Bridging the Gap between Visual Analytics and Storytelling

论文链接:https://www.microsoft.com/en-us/research/publication/supporting-story-synthesis-bridging-the-gap-between-visual-analytics-and-storytelling-2/

该论文定义了一个新的故事生成框架,将数据分析到结果展示的过程抽象成普遍的故事生成流程。该框架支持交互式地从复杂的可视分析结果中生成可以让普通读者理解的故事。论文发表在 TVCG 2019。

13. Cross-dataset Time Series Anomaly Detection for Cloud Systems

论文链接:https://www.microsoft.com/en-us/research/publication/cross-dataset-time-series-anomaly-detection-for-cloud-systems/

文章提出了基于迁移学习和主动学习的跨数据集异常检测框架,可以有效地在不同时间序列数据集之间进行迁移,只需要1%-5% 的标注样本量即可达到高精度检测。文章发表在系统领域顶级会议 USENIX ATC 2019 上。

14. Robust Log-based Anomaly Detection on Unstable Log Data

论文链接:https://www.microsoft.com/en-us/research/publication/robust-log-based-anomaly-detection-on-unstable-log-data/

文章提出了基于深度学习技术的模型 LogRobust,可有效克服日志不稳定问题,在快速迭代的实际工业数据中取得了出众的效果,该研究发表在了软件工程领域顶级会议 FSE 2019。

15. An Intelligent, End-To-End Analytics Service for Safe Deployment in Large-Scale Cloud Infrastructure

论文链接:https://www.microsoft.com/en-us/research/publication/an-intelligent-end-to-end-analytics-service-for-safe-deployment-in-large-scale-cloud-infrastructure/

该文章提出了时空相关性模型,在时间和空间的双重维度上对比故障前后的系统状态,为故障诊断提供线索,该模型在安全部署中取得了很高的准确率,研究成果将发表在系统领域顶级会议 NSDI 2020上。

16. Outage Prediction and Diagnosis for Cloud Service Systems

论文链接:https://www.microsoft.com/en-us/research/publication/outage-prediction-and-diagnosis-for-cloud-service-systems/

该文章提出了一种智能的大规模中断预警机制 AirAlert,AirAlert 收集整个云系统中的所有系统监控信号,采用鲁棒梯度提升树算法做预测,并利用贝叶斯网络进行诊断分析。相关研究短文发表在 WWW 2019。

17. Prediction-Guided Design for Software Systems

论文链接:https://www.microsoft.com/en-us/research/publication/prediction-guided-design-for-software-systems/

文章提出了智能缓冲区管理方法,基于预测导向(Prediction-Guided)框架,以机器学习预测引擎为核心,可监控集群已部署的工作负载与平台操作,对这些负载在发生故障的概率和新的容量增长需求进行预测,动态调整预留缓冲区。该方法已成功集成到微软 Azure 中,提高了容量配置的稳健性,减少了巨大的成本支出。相关研究将在 AAAI 2020 Workshop 发布。

18. An Empirical Investigation of Incident Triage for Online Service Systems

论文链接:https://www.microsoft.com/en-us/research/publication/an-empirical-investigation-of-incident-triage-for-online-service-systems/

该文章基于微软 20 个大型在线服务系统展开实例研究,发现错误的故障分派会导致额外的时间开销,进而验证了已有软件 Bug 分派算法在故障分派场景下的效果。这是首次研究故障分派在工业大型在线服务系统中的实践,相关研究发表在 ICSE SEIP 2019。

19. Continuous Incident Triage for Large-Scale Online Service Systems

论文链接:https://www.microsoft.com/en-us/research/publication/continuous-incident-triage-for-large-scale-online-service-systems/

该文章提出一种基于深度学习的自动化连续故障分派算法 DeepCT。DeepCT 结合了一个新的基于注意力机制的屏蔽策略、门控循环单元模型和改进后的损失函数,可以从工程师对问题的讨论中逐步积累知识并优化分派结果。相关成果发表在 ASE 2019。

20. Neural Feature Search: A Neural Architecture for Automated Feature Engineering

论文链接:https://www.microsoft.com/en-us/research/publication/neural-feature-search-a-neural-architecture-for-automated-feature-engineering/

文章提出了神经特征搜索(Neural Feature Search,NFS),基于递归神经网络(Recurrent Neural Network,RNN)的控制器,通过最有潜力的变换规则变换每个原始特征,取得了优于现有自动特征工程方法的性能。该成果已在在数据挖掘领域会议 ICDM 2019 发表,在自动特征工程研究领域确立了新的技术水平。

图形学

21. Repairing Man-Made Meshes via Visual Driven Global Optimization with Minimum Intrusion

论文链接:http://haopan.github.io/mesh_repair.html

文章提出的方法修复了 ShapeNet、ModelNet 等大型 3D 数据集中的模型缺陷。该文章发表在 SIGGRAPH Asia 2019。

22. Learning Adaptive Hierarchical Cuboid Abstractions of 3D Shape Collections

论文链接:https://isunchy.github.io/projects/cuboid_abstraction.html

人造物体如家具通常具有结构化特征,人类可以容易地将这些物体抽象化为简单的几何形状的组合,如长方体,便于物体理解和分析。该论文通过在同类物体上进行无监督学习,生成具有自适应并层次化的长方体抽象表达。文章发表在 SIGGRAPH Asia 2019。

23. A Scalable Galerkin Multigrid Method for Real-time Simulation of Deformable Objects

论文链接:http://tiantianliu.cn/papers/xian2019multigrid/xian2019multigrid.html

一种在无结构网格上的 Galerkin 多重网格法,其极大加速了现有柔性体仿真技术的性能。该方法可实时仿真含近百万有限元的柔性体模型,将人们在虚拟世界中可交互的模型复杂度提升了一到两个量级。该论文发表在 SIGGRAPH Asia 2019。

24. Deep Inverse Rendering for High-resolution SVBRDF Estimation from an Arbitrary Number of Images

论文链接:https://gao-duan.github.io/

该论文提出了一种在纹理材质本征空间进行优化的方法,实现了针对任意数量输入图片的纹理材质建模。在给定图像数量较少时给出视觉上合理的结果,而随着输入数量的增多,逐渐得到更为精确的重建结果。该论文发表在 SIGGRAPH 2019。

25. Synthesizing 3D Shapes from Silhouette Image Collections using Multi-Projection Generative Adversarial Networks

论文链接:https://arxiv.org/abs/1906.03841

利用二维轮廓图像学习三维形体生成。该方法仅需要对于某一类物体的大量二维轮廓图像,并不需要任何对应关系,它通过该类别物体在不同方向上的轮廓所具有的特征分布,学习并生成满足这些训练数据分布的三维形体。该论文发表在 CVPR 2019。

编辑:王菁

校对:林亦霖

收藏 | 数据智能与计算机图形学领域2019推荐论文列表(附链接)相关推荐

  1. 数据智能与计算机图形学领域推荐论文列表

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 转载于 :微软 数据智能 1. Data-anonymous Encoding f ...

  2. 计算机图形学应用论文,计算机图形学研究和应用论文.docx

    计算机图形学研究和应用论文 关于计算机图形学的发展及应用探究 [摘要]计算机图形学经过三十多年的发展,在计算机艺术.计算机动画.自然景物仿真.图形实时绘制的方面都有很大程度的成就.图形学发展速度很快, ...

  3. 计算机图形学和数据科学实验,计算机图形学作业-图像处理实验室——中国科学技.PDF...

    计算机图形学作业-图像处理实验室--中国科学技 计算机图形学作业 薛迪秀 2014 10 30 xuedixiu@mail.ustc.edu.cn 作业(homework) • 邮件附件 • 附件命名 ...

  4. 计算机图形学领域国际期刊以及会议介绍

    图形学领域相关期刊推荐 及部分SCI影响因子(非官方分类,仅供参考) 一.  A类(顶级刊物,投稿须谨慎) 序号 刊物简称 刊物全称 影响因子 出版社 网址 1. TOG ACM Transactio ...

  5. 与计算机图形学相关的研究论文,计算机图形学相关论文范文数据库,与计算机图形学的相关技术与相关专科毕业论文范文...

    计算机图形学相关论文范文数据库,与计算机图形学的相关技术与相关专科毕业论文范文 关于计算机图形学及计算机及计算机动画方面的免费优秀学术论文范文,计算机图形学相关本科毕业论文,关于计算机图形学的相关技术 ...

  6. 与计算机图形学相关的研究论文,计算机图形学论文

    一. 摘要 计算机图形学(Computer Graphics,简称CG)是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学.简单地说,计算机图形学的主要研究内容就是研究如何在计算机中 ...

  7. 关于计算机图形学的书籍推荐

    /*-------------------------------------------------------------------------------------------------- ...

  8. 计算机图形学直线扫描转论文,计算机图形学实验报告-实验1直线段扫描转换.doc...

    PAGE 32 PAGE 7 计算机图形学 实验报告 班级 计算机工硕班 学号 2011220456 姓名 王泽晶 实验一:直线段扫描转换 实验目的 通过本次试验,学生可以掌握直线段的扫描转换算法及其 ...

  9. 独家 | 一份数据工程师必备的学习资源,干货满满(附链接)

    作者:PRANAV DAR 翻译:张玲 校对:车前子 本文约6500字,建议阅读15分钟. 本文首先详细介绍了数据工程的职责.与数据科学家之间的差别以及其不同的工作角色,然后重点列出了很多与核心技能相 ...

最新文章

  1. 17日南土所蒋瑀霁报告:红壤团聚体尺度养分转化的生物学过程(线虫-微生物互作机制)...
  2. python整理数据_Python数据类型整理
  3. SpringMVC快速入门-开发步骤
  4. 数据库 CURD测试题【中等】
  5. 教你玩转CSS Position(定位)
  6. java隐含转化_java中自动转换和强制转换还有隐含转换
  7. Linux学习笔记5
  8. 披一张机器皮,智能就有了?!
  9. linux opencl安装方法,如何在Ubuntu上安装libOpenCL.so
  10. 使用免费的Open NFC simulator模拟器在BlackBerry模拟器上进行NFC程序调试
  11. Hart 常用命令 命令格式+命令含义 中文翻译
  12. matlab对列矢量求方差,matlab 求标准差 std函数用法
  13. Kolmogorov复杂性简介(转)
  14. 关键词选择与维护教程
  15. 分组交换(Packet Switching)和线路交换(Circuit Switching)
  16. 收到offer不想去,如何优雅拒绝?
  17. 微信小程序——推箱子小游戏
  18. Angular CLI简介
  19. adb控制移动数据、wifi开关、下拉菜单栏
  20. Practical_RichFaces要点Chapter11

热门文章

  1. vue 可合并表格组件_merge-table
  2. jstl 获取 javascript 定义的变量_一个后端开发者前端语言基础:JavaScript
  3. 让开发变得更简单 | 阿里云中间件推出全新开发者服务
  4. idea设置自动编译
  5. Xcode iOS9.3 配置包 iOS10.0 配置包 iOS10.2 配置包 could not find developer disk image
  6. Azure中继摆脱了WCF的桎梏,走向跨平台
  7. 在线文档预览方案-office web apps续篇
  8. 想写点什么留下点念想
  9. python读取html内容 dom获取_python学习笔记十三 JS,Dom(进阶篇)
  10. torch.backends.cudnn.deterministic 生成随机数字设置 每次输出一样的方法