也许用不了多久,人们就会看到全新的数据库交互方式。

不一定是专业的SQL语言开发者,也不用局限于传统的条件筛选,交互很简单,说说话,就可以随心所欲的调用所需数据,甚至完成更复杂的“逻辑”式计算。更重要的,数据库开发和应用的舒适度都有望大大提升。

这就是NL2SQL的魔力。

得益于人工智能和NLP的发展,用自然语言生成可执行的SQL语句,进而挖取数据价值,正成为新兴研究领域。6月3日,国内首届中文NL2SQL挑战赛正式上线启动。

大赛由国内领先的智能语义公司追一科技主办,总奖金池16.5万,将发布全球首个中文数据集,向海内外高校学生、研究机构、企业开发者开放,共同推进NLP在数据库交互上的创新研究与普惠应用。

打通人与结构化数据间的壁垒

在AI、区块链、IoT、AR等高新技术飞速发展的当下,数据库这一宝库似乎被遗忘在了角落。数据库存储了大量的个人或者企业的生产运营数据,每天都会和数据库产生或多或少的交互。

通常,如果想要查询数据库中的数据,需要通过像SQL这样的程序式查询语言来进行交互,这就需要懂SQL语言的专业技术人员来执行这一操作。

为了让非专业用户也可以按需查询数据库,当前流行的技术方案设计了基于条件筛选的专门界面,用户可以通过点选不同的条件来查询数据库,比如这个筛选汽车的界面。

然而,在这个界面上进行操作,极大地限定了数据库查询的使用场景和查询界限。同时,即使是对于精通数据库程序语言的专业人士,经常构思SQL语句、维护这样一个查询界面也是一项重复度较高的工作。

在CUI(Conversation User Interface)的大背景下, 如何通过自然语言自由地查询数据库中的目标数据成为了新兴的研究热点。

Natural Language to SQL( NL2SQL)就是这样的一项技术,可以将用户的自然语句转为可以执行的SQL语句。

此次比赛,也是中文研究领域首次举办NL2SQL相关比赛。

在海外,NL2SQL领域的研究,已经取得了一定成果,发布了WikiSQL、Spider、WikiTableQuestions、ATIS 等诸多公开数据集。一些数据集的准确度,已经达到了90%以上,但很大程度只是抛砖引玉,落地场景价值受限。高价值数据集,难度又令人望而生畏。

作为智能语义的领跑者,追一科技在智能交互上,拥有深厚的积累,包括在对话机器人、阅读理解、文本挖掘等,形成了大量前瞻研究与商业应用案例。对于数据库智能化交互,追一科技将率先发布首个中文NL2SQL数据集。

据了解,本届NL2SQL比赛目标是利用NLP技术来解决数据库交互问题,让非技术背景用户可以通过自然语言的方式与数据库进行交互,打通人与结构化数据间的壁垒,更有效地利用结构化数据,实现人机交互体验升级。比赛过程中会涉及到结构化数据理解、语义理解、数据库交互等多方面的挑战。

首个NL2SQL中文数据集

追一科技将提供预处理好的有标签数据集及相应的数据库文件,以助力数据驱动型学习。参赛者需要在初赛阶段提交线下预测结果,复赛阶段提交线上预测代码及模型,在不可见的数据集上进行测试,按测试结果进行最终排名。

本次比赛的数据集包含有约4,500张表格、50,000条基于这些表格提出的自然语言问句,以及自然语言问句所对应的SQL语句。数据来源是通过爬取并解析公开数据源中存在的表格,内容则主要覆盖了金融领域及通用领域。

与现有的英文NL2SQL数据集不同的是,本次比赛的数据集包含了更口语化的表达、额外引入表格内容作为输入的一部分,这就要求选手不仅要结合自然语言问句与表结构来正确地预测SQL语句骨架,更需要思考何将自然语言语义与结构化的表格结构及表格内容有效地融合和理解,从而生成正确的SQL语句。

NL2SQL的未来

在行业研报、业绩报告、新闻公告、使用说明书等各种书面信息载体上,尤其是金融、快消等行业的各种报告,充斥着许多表格形式的结构化数据。而当用户去查询表格中的内容时,需要肉眼去从表格中去筛选满足条件的数据,准确率和效率都较低。

通过NL2SQL,用户在查询这些表格的内容时,可以直接通过自然语言与表格进行交互,并得到结果,用户体验会很自然。

“我们相信,随着NLP进入AI领域研究的焦点位置,越来越多场景将被解锁,并激发出创新的应用和商业模式。数据库的创新交互,将拥有巨大的潜力。”追一科技联合创始人兼CTO刘云峰表示,此次NL2SQL大赛,只是一个起点,追一科技作为智能语义领跑者,期待与更多NLP和AI开发者一起努力,不断探索NLP赋能新秘境。

 追一科技联合创始人兼CTO刘云峰

报名通道

进入下方网址,或点击阅读原文,进入报名页面:
https://tianchi.aliyun.com/markets/tianchi/zhuiyi

比赛日程

初赛:本地训练和预测,6月24日-8月6日
复赛:线上训练和预测,8月19日-9月9日
决赛:线下答辩和颁奖,10月(具体时间、地点待定)

奖项设置

总奖金池16.5万

一等奖8万(1支队伍)
二等奖5万(1支队伍)
三等奖2万(1支队伍)
优胜奖获价值7500元的数码产品(2支队伍)

获奖者均可获得追一科技校招offer直通卡,免简历筛选和笔试,直接进入技术面试。

大咖评审

毛可智
新加坡南洋理工大学副教授

新加坡南洋理工大学副教授,谢菲尔德大学博士。在机器学习、文本分析、自然语言处理和信息融合方面拥有20多年经验,发表了大约100篇科学论文。

俞扬
南京大学教授

俞扬博士,南京大学教授,中组部万人计划青年拔尖人才计划。主要研究领域为机器学习、强化学习。获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖。发表论文40余篇,获得4项国际论文奖励和2项国际算法竞赛冠军,入选2018年IEEE Intelligent Systems杂志评选的“国际人工智能10大新星”,获2018亚太数据挖掘”青年成就奖”,受邀在IJCAI’18作关于强化学习的”青年亮点”报告。

漆桂林
东南大学教授

东南大学教授、博士生导师,东南大学认知智能研究所所长,英国贝尔法斯特女皇大学博士,发表高水平学术论文 150 余篇。

AI社群 | 与优秀的人交流

精选直播 | 大牛的观点碰撞

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧!

竞赛报名 | AI时代数据库交互怎么玩?首届中文NL2SQL挑战赛开战相关推荐

  1. 论坛报名 | AI 时代,新药研发真能告别「十年磨一剑」吗?

    2021年6月1日-3日,第三届北京智源大会将隆重举办.现正式开放大会线上和线下报名渠道,线下地点为「中关村展示中心会议中心」. 2021年北京智源大会召开在即,6月1日至6月3日,持续三天,13场主 ...

  2. 玩游戏也能学编程!少儿编程教育如何为中国AI时代“播种”?

    大数据文摘出品 疫情期间,在线教育一夜爆红,学习编程语言也成为了热门话题.不少B站上的编程教学视频被重新翻出来,众多博主中,一个10后小朋友成功吸引了文摘菌的注意.这个戴着大眼镜的"小老师& ...

  3. 免费报名通道限时开启!解锁QCon「AI 时代下的融合通信技术」专场

    万物之始,大道至简,衍化至繁.千年前的中国文明贯穿古今,也依旧在照鉴未来.从 1902 年的肯塔基无线电话装置到 1946 年第一架计算机的诞生再到如今高速发展的互联网, 横亘不变的正是底层通信技术这 ...

  4. 招商银行周天虹:AI时代的分布式数据库是什么样的?

    在AI.大数据技术的推动下,银行的传统经营模式正在发生根本性的变化,数据驱动的轻型银行模式随之诞生.而在向数据驱动方向奔驰的路上,如何高效处理海量数据成为一个重要的课题.作为我国银行业数字化转型的先锋 ...

  5. AI时代用脸玩“飞机大战”,PaddleHub让你秒变“脸控”游戏达人

    AI时代还拿着手机打飞机游戏是不是out了?飞桨PaddleHub带你体验不一样的游戏玩法. 从世界上第一款游戏诞生开始,电玩都需要依赖手柄和按键进行,无论是PC游戏,还是 XBOX .PS 这类主机 ...

  6. Java计算机毕业设计大学生学科竞赛报名管理系统源码+系统+数据库+lw文档

    Java计算机毕业设计大学生学科竞赛报名管理系统源码+系统+数据库+lw文档 Java计算机毕业设计大学生学科竞赛报名管理系统源码+系统+数据库+lw文档 本源码技术栈: 项目架构:B/S架构 开发语 ...

  7. IC验证培训——AI时代:软件已经起飞,硬件还在路上?

    为响应全国各地心心念路科验证培训的路粉们,路科将在9月1日进行线上培训,线上报名方式如下: 手机安卓端(暂不支持iOS)可在[腾讯课堂]APP搜索"路科验证",即能够找到报名入口, ...

  8. 揭秘5G+AI时代的机器人世界!【附报告下载】

    AI 和 5G 与机器人技术结合,正在不断催生新的消费电子品类.AI 解决机器理解世界,以及人机交互的问题.5G 拓展机器人的活动边界,并为机器人提供更大的算力和存储空间(云协作机器人) . 今天,我 ...

  9. 第十八届全国大学智能汽车竞赛报名信息统计

    01 报名信息 一.前言   截止到 2023年6月15日, 第十八届全国大学生智能车竞赛 竞速比赛 报名阶段接近尾声. 参赛赛队伍在 竞赛网站 按照 竞赛网络报名方法 进行了注册, 并提交了队伍参赛 ...

最新文章

  1. matlab 跳步循环,跳步急停是用单脚或双脚起跳,上体稍后仰,两脚同时平行落地。落地时()着地,用前脚掌内侧抵蹬住地面,两膝弯曲,降低重心,两臂屈肘微张,以保持身体平衡。...
  2. mysql严格模式 报错_代码一上传服务器就报错-尝试开启 MySQL 严格模式
  3. PHP_SELF、 SCRIPT_NAME、 REQUEST_URI区别
  4. Nodejs微信开发
  5. Diffie-Hellman:安全网络通信背后的天才算法
  6. centos8安装中文(zh_CN)语言包
  7. IE10兼容性故障的解决办法
  8. UnityShader15:前向渲染
  9. 《AI算法工程师手册》读书笔记(1)
  10. 【算法学习】【图像增强】【Retinex】Retinex Image Processing(NASA)
  11. 别不把自己当有钱人 ——让白领族成为百万富翁族的六大理财秘籍
  12. 离散数学真值表c语言实验报告,NJUPT【离散数学】实验报告
  13. c2c运营流程图_电商运营流程图模板分享,运营的核心都在这里了,快来拿走吧...
  14. asp.net922-基于Web的房屋中介管理信息系统
  15. 第2章 应用层-计算机网络
  16. 拿不到offer退全款 | 廖雪峰的“Web 全栈架构师”开班了!
  17. FTP 打开文件夹提示该文件没有程序与之关联来执行该操作 请在控制面板的文件夹选项中创建关联
  18. 一个程序员的真实故事上
  19. C语言——三目运算符的进阶用法,比较三个或者四个数的大小
  20. 关于Chandrashekhar阿扎德概述

热门文章

  1. 霍夫变换概述和标准霍夫变换
  2. CentOS 5升级Python版本(2.42.7)
  3. IOS中GPS定位偏移纠正(适用于Google地图)
  4. 如何在sharepoint2010中配置Google Anlytics 分析服务
  5. Flask驱动的静态站点生成器(译)
  6. Oracle 11g Release 1 (11.1) Data Pump 导入模式
  7. VS2005 实用快捷键,迅速提高代码编写效率!
  8. 获取网页源代码的最简单办法
  9. centos系统盘满了 如何清理_教你5步把系统盘迁移至SSD,让你的电脑加速,瞬间提升10倍!...
  10. isis协议_ISIS基础知识介绍