安妮 编译整理
量子位 出品 | 公众号 QbitAI

科学图表能简洁地概括趋势、速率和比例等有价值的信息,让我们直观地了解概念。而机器对这种结构化视觉信息的理解能帮助我们从大量文献中提取信息。

这不,微软旗下的Maluuba对这事的研究有了新进展。

近日,Maluuba推出了一个用于推理的可视化数据集FigureQA,并将研究相关论文《FigureQA: An Annotated Figure Dataset for Visual Reasoning》发布在ArXiv上。量子位挑其重点编译整理,与大家分享。

数据集简介

在关系推理最新研究的启发下,研究人员推出了FigureQA数据集,其中包含了基于10多张图表的100多万对问答,用于研究机器理解和推理方面的问题。

FigureQA数据集中有五种常见的图表模型,这些图表能显示连续的和分类信息,分别为折线图、点图、垂直柱状图、水平条形图和饼图。而其中的问答对,会涉及到图表中元素一对一和一对多的关系,例如:X是中位数吗?X与Y相交吗?得出正确答案需要对多图表中的要素进行推理。

 数据集中包含的5种图表类型

数据集中的问题,共有15种类型,涉及到数值大小、最大值、最小值、中值、曲线下面积、平滑度和图像交叉点等信息。

 FigureQA中包含的15类问题

问答集中问题均基于上述问题,答案统一为“是”或“否”。

 数据集以问答的形式呈现。Q:Medium Seafoam和Light Gold相交吗?A:是。Q:Medium Seafoam是否有最低值?A:否

微软团队在介绍论文中表示:“FigureQA是一个合成的数据集,类似视觉推理相关的CLEVR数据集。虽然数据没有真实环境中那么丰富,但能更大程度控制任务的复杂性,还支持辅助监管信号。此外,通过分析在FigureQA上训练的模型真实数据,还能扩展语料库处理弱项问题。”

制作过程

FigureQA数据集的生成制作分阶段进行。

首先,研究人员根据一组经过仔细调整的约束和启发式设计对数值数据进行采样,让使取样数据显得更自然。随后,研究人员用开源可视化库Bokeh绘制图表中的数据,得到定量数据。

此外,研究人员修改了所有图表的Bokeh后端输出的边界信息:包括数据点、坐标轴、坐标轴标签、标记和图注等信息。他们还提供了底层数值数据和一组边界数据作为每张图表的补充信息。

最后,研究人员平衡了每个问题答案中“是”和“否”的比例,这保证模型不会利用回答频率上的偏差来推断结果,而忽略视觉内容。

测试结果

在论文中,研究人员表示,FigureQA中测试集的准确率还达不到人类水平。接下来,研究人员计划测试在FigureQA上训练的模型在真实科学数据上的表现,并将数据集扩展到人类编写的自然语言问题上。FigureQA“官方”版的数据集可公开使用,是未来研究的基准。

 数据集与人类回答15种问题的准确性对比

研究人员还提供了生成脚本,它们配置容易,使用户能调整生成参数生成自己数据。

资料下载

FigureQA数据集已经可以下载了,可以移步Maluuba官网下载此数据集:

https://datasets.maluuba.com/FigureQA/dl

关于FigureQA的介绍我们可以在ArXiv上一探究竟:

https://arxiv.org/abs/1710.07300

祝你玩得愉快~

加入社群

量子位AI社群10群开始招募啦,欢迎对AI感兴趣的同学,加小助手微信qbitbot4入群;

此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。

进群请加小助手微信号qbitbot3,并务必备注相应群的关键词~通过审核后我们将邀请进群。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态

微软旗下Maluuba推出看图问答数据集,想让AI看懂图表相关推荐

  1. 图像识别利用计算机对图像进行,计算机在看图的时候,图像识别在看什么?

    计算机在看图的时候,它在看什么? 图像识别技术是指对图像进行处理,识别各种不同模式的目标和对象的技术. 随着数字化浪潮的到来,越来越多的数据以图片为载体存在.面对海量的数据,就要求我们具备能快速从中提 ...

  2. 计算机维修看图,计算机在看图的时候,图像识别在看什么?

    描述 计算机在看图的时候,它在看什么? 图像识别技术是指对图像进行处理,识别各种不同模式的目标和对象的技术. 随着数字化浪潮的到来,越来越多的数据以图片为载体存在.面对海量的数据,就要求我们具备能快速 ...

  3. 小度在家推出密语功能,个性化定制让AI更懂你

    北京2018年8月17日电 /美通社/ -- 近日,由小鱼在家联合百度共同定义.深度合作的国内首款带屏智能音箱小度在家推出了"小度密语"功能,密语功能够让用户"教会&qu ...

  4. Facebook开源看图问答模型Pythia:拿下VQA比赛冠军就靠它

    夏乙 发自 凹非寺 量子位 报道 | 公众号 QbitAI --猫戴着什么? --帽子. --天气怎么样? --下雨. --披萨上面是什么? --蘑菇. 看图回答这些问题,对我们人类来说再简单不过了, ...

  5. 看图写英语作文关于计算机,看图写话英语作文模板

    看图写话,以一幅幅图画作为材料,培养学生的观察.想象和表达能力,那你想知道看图写话英语作文模板怎么写吗?下面是小编收集整理的一些看图写话英语作文模板,大家一起来看看吧! 看图写话英语作文模板篇一:对比 ...

  6. 二年级机器人伙伴看图写话_机器人的看图写话范文-看图写话机器人老师?

    看图写话机器人老师? 今天,老师的嗓子有点痛,但仍给我们讲课.看着老师难受的样子,听着老师沙哑的声音,我的心"咯噔"了一下,希望将来能造一个机器人老师,来代替普通的老师给学生上课, ...

  7. 看图写英语作文关于计算机,看图说话 英语作文图片上是一个小女孩看着电脑发呆,要求120字~...

    共回答了24个问题采纳率:100% 所以就随意发挥了哦 Lucy always surfs on the internet for about 3 hours everyday. She someti ...

  8. 看图写英语作文关于计算机,看图写一篇英文作文

    今天,老师让我们选择英文名,老师没有让我选择英文名让我班别的同学选择英文名.本来我要选择Anny安妮的,后来我们班的一名同学叫另外一名同学选择这个英文名,让我生气后来我并没有生气,我那个同学一定会想办 ...

  9. 绿色高速看图器V1.9官方版——绿色软件下么

     高速看图器 小巧.快速的看图软件,界面非常漂亮.它仅是为高速查阅图片而设计,不具备任何编辑功能,这似乎使得它的速度优势更加突出这个软件需要微软的wic组件,这玩意更新也太频繁了吧~~~~~小小鄙视下 ...

最新文章

  1. 数据结构与算法(6-5)二叉树的应用--哈夫曼树与哈夫曼编码
  2. 如何解决2012年7月1日增加闰秒后引起linux系统重启问题
  3. 4.6 什么是神经风格迁移-深度学习第四课《卷积神经网络》-Stanford吴恩达教授
  4. 病的不轻?教你 2 招,拯救拖延症!
  5. python 编辑距离_最小编辑距离python
  6. logstash-input-jdbc 同步mysql数据到es
  7. iis 中php的mime类型,IIS添加MIME扩展类型及常用的MIME类型列表
  8. Java高级面试题!传智播客java基础入门pdf
  9. 2022软科中国最好学科排名——计算机科学与技术
  10. 移动应用的全新方式:超级app+轻应用
  11. JavaScript 中 var 、let、const区别
  12. 小说 · 凉生,我们可不可以不忧伤
  13. JAVA十六进制数据转换
  14. flutter/Android接入友盟、阿里百川SDK,打包APK后报无法加载arr库的坑
  15. ueEditor 增加插件,超级方便
  16. 【愚公系列】2023年05月 攻防世界-Web(unseping)
  17. 做好织梦dedecms安全防护全部方法
  18. SEO常用外链资源站整理分享
  19. 中国丙烯酸羟乙酯市场深度调研与投资方向预测报告2022-2028年
  20. 太大的ppt文件怎么压缩变小

热门文章

  1. swiper监听滚动条_swiper Scrollbar滚动条组件详解
  2. 游戏 发烧型计算机配置清单,这才是发烧级硬件玩家的电脑配置清单
  3. c语言 分函数,C语言部分函数.doc
  4. php 遍历文件夹并压成zip_php ZipArchive实现多文件打包下载实例
  5. python面向对象的含义_Python面向对象(一)
  6. android imageview scaletype 按钮状态,Android ImageView 之 ScaleType 详解
  7. [Vue-cli3] is a Vue CLI 3 only command and you are using Vue CLI 2.9.6. You may...
  8. chromium禁用ajax,页面加载时,jQuery AJAX不会在Chrome / Chromium中启动
  9. 移动路由器刷linux,Linux小课堂开课了(7)-三线IP刷路由-移动-联通-电信
  10. Python循环遍历(cycle)