由CSDN主办,IBM和兴业数金协办的PowerAI人工智能线下马拉松编程大赛Q2场将拉开序幕。本赛季赛题将聚焦金融行业的语料大数据识别,基于人工智能相关技术,计算有关金融场景的信息聚类,将电话银行海量通话内容结构化,并打上各类标签。通过挖掘分析有价值信息,为服务与营销提供数据与决策支持,发现最新的市场机遇和客户关注热点。活动旨在进一步推动人工智能技术在行业领域的落地,贴近生活并与真实案例场景,也是系列赛题内容的一大特色。

截止目前,本轮活动已收到了大量参赛者报名,绝大部分参赛团队成员来自金融机构和相关的技术服务公司,例如招商银行上海分行、民生银行、包商银行、华通银行、陆金所、太平洋保险、华为、东方证券研究所、上海金融期货信息技术有限公司、中国大地保险、国泰基金、西藏东方财富证券、东软集团、实达电脑等,也有一些一线互联网公司和顶尖的科研院所报名,例如今日头条、京东、中科院上海所、上海交大、中国科学技术大学等。

从本季题目内容来看,主办方会提供训练样本数据,分为训练和测试部分。训练部分包括: 
- 对话内容文件(文件格式可能存在转码需求),对话内容分为11类 
- 对话内容标签文件,包括理财产品分类和意愿分类(肯定、否定、疑问) 
- 语料文件-文件格式为txt格式。内容包括中文和标点符号。文章内容是金融相关的文章。文件总量在50M左右。参赛团队可以利用这些文件来建立自己的语言模型、分词模型 
- 训练数据:每个分类的样本个数不少于150条。数据样本间有一定区分度。

参赛者需要根据训练文件进行购买产品分类和意愿分类;大赛鼓励参赛选手自己构建分词和语言模型,如果选手选择使用第三方分词或者语言模型需要自己解决平台依赖。

在参赛要求方面,主办方也给出了一些建议: 
1.参赛者可以通过Caffe、Tensorflow、Torch 、Theano 进行模型训练, 鼓励发挥GPU on Power硬件特性;

2.要求参赛者编写神经网络模型实现考题需求。参赛者可以修改Caffe、Torch、Theano或者Tensorflow源代码,但是必须在修改后,提供代码修改说明以确定没有违规部分。参赛者也可以使用Github上开源的不同发行版的Caffe、Torch、Theano或者Tensorflow,但是必须自己解决在Power上的依赖和编译问题;

3.本次比赛涉及金融领域对话文本分类问题。希望选手通过深度神经网络能够对客户感兴趣购买的保险或者理财产品的类型和意愿进行分类。语料中会有“肯定”,“疑问”,“否定或者双重否定”语句。传统的词频或者简单的SVD方式很难在测试数据集中有良好的表现;

4.本次比赛涉及金融领域对话文本分类问题。希望选手通过深度神经网络能够对客户感兴趣购买的保险或者理财产品的类型和意愿进行分类。语料中会有“肯定”,“疑问”,“否定或者双重否定”语句。传统的词频或者简单的SVD方式很难在测试数据集中有良好的表现;

大赛开战在即,CSDN也对某位报名参赛的开发者进行了简短采访,他就目前人工智能技术在金融行业的应用现状和挑战等话题分享了自己的看法。以下为采访内容(受访者不便透露真实姓名,以李成代替):

1.CSDN:请先介绍下自己所从事的工作和参赛原因。 
李成:目前本人在金融行业软件公司工作,主要负责银行、证券行业的信息开发服务。这次主要是想检验自己在项目中用到的技术,也想结识更多在金融行业从事人工智能技术研究的开发者,互相切磋。

2.CSDN:请谈谈您对人工智能技术在金融行业应用现状的看法。 
李成:随着金融信息化的不断深入,银行正在从过去的手工银行转变成数字化银行,极大的推动了全球金融的发展。由于云计算、大数据、人工智能等技术在金融行业的不断普及,更多的银行都在思考如何通过这些新技术提供客户粘合度,为客户提供全生命周期的服务,提高服务质量,以及从所积累的海量用户数据中挖掘新的商机。目前,我们看到人工智能技术已经在金融领域的授信、反欺诈、风控、审批、差异化服务等多方面落地。

3.CSDN:从您的介绍看有从事人工智能应用项目的经历,请谈谈当时所希望解决的问题。 
李成:主要有几个方面:1.通过人像识别技术在银行监控范围内识别客户的各种行为特征,例如身份认证、人脸刷卡,或者其他安全识别等;2.通过语音识别判断客户目前的状态和特征;3.可以通过人像、语音识别缩短业务流程;4.通过呼叫中心平台识别客户具体语音,如客户说出某关键词以后自动处理下一步业务等。

结合我现在正在做的项目,具体来说,目前银行信用卡中心的业务都是通过电话进行,我们希望利用语音识别技术,对通话进行实时分析,帮助银行提升服务的质量。还有就是利用机器学习,可以让机器人回答客户的提问和交互。

4.CSDN:您认为现阶段,在金融行业什么样的应用场景是比较适合用机器学习或人工智能技术来解决的? 
李成:不管是在提升客户体验还是内部管理效率,商机挖掘以及风险防范方面,人工智能在金融行业的应用前景都非常广泛。结合我的经历,我认为银行行用卡中心应该是一个很好的验证场景。人工智能,目前语音方面技术是最成熟的,而银行信用卡中心,基本全部的业务都是通过电话进行,技术应用潜力非常大。

5.CSDN:您之前是否了解过IBM的产品或解决方案?从您的角度看,IBM在人工智能领域的机会主要在哪些方面? 
李成:了解过。IBM的机会在于不仅在技术上持续投入很大,而且对于金融行业的业务、流程都很熟悉。在这个金融行业向数字化转型的风口,只要切准用户痛点,技术精深+业务流程熟悉,就能找到很多机会。

6.CSDN:对本次大赛有什么期望,对参赛伙伴有什么寄语? 
李成:我相信这次的选手中大拿很多,我自己在金融行业和人工智能也有一些实践经历和积累,希望大家能获得优异的成绩。另外,希望通过AI技术能够真正帮助金融机构提升他们的业务。

据悉,本次所有的参赛团队,都将现场免费体验所有参赛团队,将现场免费体验IBM专门为人工智能所建的高性能计算服务器PowerAI。PowerAI人工智能平台基于Power8体系结构,支持开源机器学习和深度学习架构,包括Caffe, Chainer、TensorFlow、Theano、Torch、cuDNN、NVIDIA DIGITS以及其它若干个机器学习与深度学习架构和库。参赛者将轻松便捷地使用这些人工智能方法,创建新的计算机模式以高效的对数据进行分析。

最后,一如既往,主办方为获胜团队和参赛者准备了丰厚的现金和奖品奖励,欢迎大家6月17日来玩!

本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

IBM PowerAI编程大赛Q2场来袭!探秘金融语料大数据识别相关推荐

  1. 开始报名啦!——第二届融360“天机”金融风控大数据竞赛火热来袭

    炎炎夏日正好是提升数据分析能力,成为数据科学家的好机会.由融360和统计之都共同主办的第二届融360"天机"金融风控大数据竞赛开始报名啦!不论你是什么学校什么专业,只要你对大数据和 ...

  2. 【首场盛会】UBDC全域大数据峰会·2016震撼来袭!

    [友盟+]携新品唤旧友,共赴猴年首场盛会 UBDC全域大数据峰会·2016 无数据不智能 别急,让我们先砸彩蛋! 彩蛋一:[友盟+]发布全域数据新品,究竟有何大招? 彩蛋二:国内首份[全域大数据报告] ...

  3. CNCC 2018 今日开幕,五场特邀报告引爆「大数据推动数字经济」| CNCC 2018

    雷锋网(公众号:雷锋网) AI 科技评论按,2018 中国计算机大会(CNCC2018)于 10 月 25-27 日在杭州国际博览中心举办,会议由中国计算机学会(CCF)主办,杭州市萧山区人民政府.浙 ...

  4. 数据仓库etl编程_莱牛教育:浅谈大数据ETL大数据工程师所需具备的能力

    ​ 在当今这个数据大爆炸的时代,海量的数据存储.处理.分析.管理成为各大企业在数字经济时代的新的挑战.大数据工程师作为对海量数据进行处理.分析的专业型技能人才,对各大企业迅速转型到数字经济领域都起到非 ...

  5. 数据分析两场NBA比赛结果!大数据+NBA=?

    本文长度为2976字,建议阅读4分钟 本文为你介绍大数据在NBA中的应用,并分析其缺陷和前景. 北京时间11月17日,NBA常规赛比赛继续进行,火箭队以142-116大胜太阳队.备受国人关注的周琦在本 ...

  6. “甜橙金融杯”数据建模大赛发布,8万重金寻找大数据金融人才!

    全世界有3.14 % 的人已经关注了 数据与算法之美 随着互联网+概念不断发展,越来越多的商家进入这一市场.为了在竞争中拉取新用户,培养用户的消费习惯,各种类型的营销和补贴活动层出不穷.为正常用户带来 ...

  7. 刚入职场的菜鸟,这些大数据知识点,你必须掌握了!

    一.Hadoop入门 1.常用端口号 hadoop3.x HDFS NameNode 内部通常端口:8020/9000/9820 HDFS NameNode 对用户的查询端口:9870 Yarn查看任 ...

  8. python编程:tabula、pdfplumber、camelot进行表格数据识别

    本文就目前python图表识别的库进行测试 1.tabula 2.pdfplumber 3.camelot 准备数据 excel:names.xlsx,两个表格 表格1:所有字段都被线条包围 表格2: ...

  9. 数据流畅驰骋:探秘Logstash在大数据领域的卓越表现【上进小菜猪大数据系列】

    上进小菜猪,沈工大软件工程专业,爱好敲代码,持续输出干货. 摘要:Logstash是大数据领域中常用的数据处理引擎,能够高效地采集.转换和输出数据.本文将深入介绍Logstash的基本概念.工作原理和 ...

  10. 八折进行中 | 暌违一载,2018 中国大数据技术大会(BDTC)首轮讲师阵容震撼来袭!...

    暌违一载,今又相约.作为年度技术趋势与行业应用的风向标,2018 中国大数据技术大会(BDTC 2018)携主题"大数据新应用"再度强势来袭,稳踏技术时代浪潮,势将引爆今冬技术圈. ...

最新文章

  1. 26 进程优先级队列Queue
  2. mysql驱动profilesql_java连接mysql的驱动配置问题
  3. 脑洞大开!拿Transformer和CNN比较!犯错都像人类
  4. 多线程十 Timer
  5. C#GDI画立体渐变圆角panel
  6. Grunt usemin前端自动化打包流程
  7. STM32——库函数版——交叉闪烁灯程序
  8. 46种国内外的PCB设计工具-你知道的有哪几种呢?
  9. php私人云,PHP源码Cloudreve乐云网盘私人云盘源码 资源下载不限速功能
  10. 第十届全国大学生光电设计大赛分析前瞻(一文看懂光电设计大赛创意赛,做好准备)
  11. 存储器基本概念及分类介绍
  12. MAC直接的剪切快捷键
  13. <数据结构> rear指针指向队尾元素 牺牲一个存储位置 的循环队列实现(C语言)(第4种/共6种)
  14. 2021-2027全球与中国美容淋浴器市场现状及未来发展趋势
  15. Python中 {:.0f} 格式化输出,{0:^30}什么意思 . format(name))
  16. 机器学习 | 一个基于机器学习的简单小实践:波斯顿房价预测分析
  17. 【洛谷】P1001 A+B Problem
  18. 拼多多成于“性价比”,困于“性价比”
  19. 知乎问答:为什么现在又流行服务器端渲染html?
  20. cmos图像传感器简介

热门文章

  1. 【Flask】通过Flask_login实现用户登录
  2. js函数中变量声明提前
  3. 队列服务(Queue)
  4. Java面试问题 021-030
  5. 微信云控开发SDK使用教程--手机回传朋友圈点赞数量通知服务端
  6. 深入理解JVM虚拟机(一):JVM运行时数据区
  7. a标签增加onclick事件提示未定义function
  8. 在Windows Mobile上隐藏你的应用程序
  9. Spring源码分析——读取Xml过程
  10. c#Winform程序CPU占用高的原因和解决方法(转载)