视学算法报道  

编辑:桃子 好困

【新智元导读】要说自然语言处理最厉害的兵器,非「轩辕」剑莫属。近日,度小满金融AI-Lab研发的轩辕 (XuanYuan) 预训练模型刷榜CLUE,距离人类「表现」仅差3.38分!

自然语言处理是人工智能皇冠上的明珠,近日,度小满金融AI-Lab让人类摘得明珠的步伐又前进了一步。

据中文语言理解领域的权威测评基准官网公布,度小满金融AI-Lab研发的轩辕 (XuanYuan) 预训练模型在CLUE1.1分类任务中「力压群雄」获得了排名第一的好成绩。距离人类「表现」仅差3.38分!

CLUE是中文语言理解领域最具权威性的测评基准之一,涵盖了文本相似度、分类、阅读理解共10项语义分析和理解类子任务。

其中,分类任务需要解决6个问题,例如传统图像分类,文本匹配,关键词分类等等,能够全方面衡量模型性能。

该榜单竞争激烈,几乎是业内兵家必争之地,例如快手搜索、优图实验室 & 腾讯云等等研究机构也都提交了比赛方案。

据悉,位居榜首的「轩辕」是基于Transformer架构的预训练语言模型,涵盖了金融、新闻、百科、网页等多领域大规模数据。因此,该模型「内含」的数据更全面,更丰富,面向的领域更加广泛。

传统预训练模型采取「训练-反馈」模式,度小满金融AI-Lab在训练「轩辕」的时候细化了这一过程,引入了任务相关的数据,融合不同粒度不同层级的交互信息,从而改进了传统训练模式。

模型设计思路有两点:

1.宏观角度,先从通用大规模的数据逐渐迁移到小规模的特定业务以及特定任务,然后去通过不同的阶段逐渐训练,直到满足目标任务。

2.微观角度,针对不同的下游分类任务,会相应的设计出定制化的分类模型。然后采用自监督学习、迁移学习等等提升模型的性能。

目前,「轩辕」还处于1.0的版本,更侧重于自然语言理解能力,在接下来的2.0版本中,研发人员会采用更大规模的数据,训练出更加通用的预训练模型,从而赋能更多的业务和领域。

度小满为何「看中」预训练模型?

预训练模型是一种迁移学习的应用,可以利用几乎无限的文本,学习输入句子的每一个成员的上下文相关的表示,它隐式地学习到了通用的语法语义知识。

换句话说,预训练模型把通用人类的语言知识先学会,然后再代入到某个具体任务。它可以将从开放领域学到的知识迁移到下游任务,以改善低资源任务;还可以使自然语言处理由原来的手工调参、依靠ML专家的阶段,进入到可以大规模、可复制的大工业施展的阶段。

不止是融合人类知识,预训练模型的「改善」、「大规模」、「可复制」等关键词背后意味着降成本、提效率。这和度小满金融CEO朱光「用科技服务小微企业是金融科技公司的价值和使命」的理念不谋而合。

今年5月21日,在度小满金融成立三周年之际,度小满金融CEO朱光表示,「未来三年,度小满将继续加大人工智能技术的研发投入,聚焦小微客户,持续降低小微企业主的整体融资成本,为3000万小微企业主提供值得信赖的综合金融服务。」

目前,除了预训练,度小满金融AI-Lab在文本分类、信息抽取和技术资源等方向亦有布局。在战略上会有两点侧重:首先加强自身的数据生态建设,合法合规使用用户数据,解决数据孤岛;其次通过产学研相结合,布局前沿技术,落地金融场景业务。

目前,度小满与北京大学光华管理学院成立了「金融科技联合实验室」,和西安交大成立了「西安交通大学-度小满金融人工智能联合研究中心」,并与中国科学院自动化研究所共建博士后工作站,共同开展人工智能及相关领域的博士后联合招收培养。

度小满研发人员一直相信人工智能技术势必会变革金融领域的已有研究范式。因此,连接理论前沿研究与业界的技术应用研究,推动人工智能技术在金融产业中发挥更大价值,会是度小满一直的追求。

点个在看 paper不断!

超越快手腾讯!度小满NLP模型登顶CLUE榜首相关推荐

  1. 从顶级赛事殿堂飞向人间烟火:度小满的NLP技术突破能给小微企业带来什么?...

    一家企业的技术实力究竟怎么样,国际顶级赛事的比拼,绝对是一块试金石. 最近,在微软举办的MS MARCO 比赛中的文档排序Document Ranking(文档排序)任务中,来自度小满金融科技的AI- ...

  2. 京东探索研究院NLP水平超越微软 织女Vega v1模型位居GLUE榜首

    在近日公布的全球自然语言处理领域顶级测试GLUE中,京东探索研究院联合悉尼大学.武汉大学以及北京航空航天大学组成梦之队(JDExplore Dream Team, d-team)参与其中,其提出的织女 ...

  3. 春晚营销大战枪声响起,快手度小满各怀心思

    今年的春节来得有点早. 今年快手成为2020年<春节联欢晚会>独家互动合作伙伴,快手宣布将在除夕当晚发放10亿元现金红包.去年在央视春晚撒币9亿的百度则已启动新一轮春晚战事,央视2020年 ...

  4. 我是如何拿到:百度 腾讯 头条 美团 度小满等互联网offer的?

    关于答主:985.通信.A+学科硕士,2018年的秋招收获了:百度.腾讯.头条.美团.猿辅导.度小满.猫眼.流利说等offer.秋招之后,申请了一个微信公众号[菜鸟名企梦],初衷是把自己的求职期间的总 ...

  5. 摩根大通打造ChatGPT式人工智能服务;度小满开源金融大模型“轩辕”;2022年中国数字孪生市场规模超100亿元丨每日大事件...

    ‍ ‍数据智能产业创新服务媒体 --聚焦数智 · 改变商业 企业动态 阿里巴巴:网传裁员为谣言,今年预估新招15000人 5月25日,阿里巴巴集团官微宣布,2023年六大业务集团总计需新招15000人 ...

  6. ACM顶会CIKM 2022放榜!度小满AI Lab三篇入选

      视学算法报道   编辑:好困 [导读]国际顶会历来是AI技术的试金石,也是各家企业大秀肌肉的主战场. 近日,第31届ACM信息与知识管理国际会议(The 31th ACM Internationa ...

  7. 李宗纯:图机器学习在度小满风控中的应用

    来源:DataFunTalk 本文约6900字,建议阅读10+分钟 本文主要介绍度小满的超大规模图平台,以及它在真实金融风控业务中的应用.其中会包括一些应用方法和案例,希望能为大家在图机器学习落地产品 ...

  8. 神经网络并不是尚方宝剑,我们需要正视深度 NLP 模型的泛化问题

    来源:AI 科技评论 前段时间的文章<顶会见闻系列:ACL 2018,在更具挑战的环境下理解数据表征及方法评价>中,我们介绍了 ACL 大会上展现出的 NLP 领域的最新研究风向和值得关注 ...

  9. 如何0代码、快速定制企业级NLP模型?百度工程师详解技术选型与模型调优策略...

    主讲人 | 龙心尘 百度NLP资深研发工程师 量子位编辑 | 公众号 QbitAI 近几年以预训练为代表的NLP技术取得了爆发式发展,新技术新模型层出不穷.企业与开发者如何将最先进的NLP领域科研成果 ...

最新文章

  1. 【MSDN文摘】使用自定义验证组件库扩展 Windows 窗体: Form Scope
  2. leetcode1047. 删除字符串中的所有相邻重复项(栈的日常应用)
  3. 信息学奥赛一本通 1069:乘方计算 | OpenJudge NOI 1.5 13
  4. zabbix mysql安装配置_ZABBIX4.4 安装及配置
  5. Kafka eagle 安装
  6. 一款APP设计的从0到1之:Android设计规范篇(转载)
  7. 一、1.1 Kaggle中kernel技巧
  8. 启动SQL Server 时自动执行存储过程
  9. 正则表达式(二)常用正则表达式——验证真实姓名
  10. 截止失真放大电路_音频放大器结构组成_音频放大器分类
  11. 什么是BSIC及其在GSM系统中的应用
  12. vue实现点击播放英语单词
  13. 2022年上半年国家教师资格证考试
  14. 智慧酒店的建议和分析
  15. LeetCode——706,设计哈希映射
  16. Android Support Library介绍
  17. windows快捷方式
  18. 微信隐藏功能系列:微信笔记怎么制作?微信备忘录?计划表?2步完成
  19. RGB,YUV的来历及其相互转换
  20. h头文件不要包含c++的库

热门文章

  1. windows 内存泄露和资源泄漏调试
  2. Php Fatal error: Allowed memory size of 33554432 bytes exhausted 的解决办法
  3. 详解Oracle安装与配置.
  4. LeetCode实战:2的幂
  5. LeetCode实战:合并两个有序数组
  6. 【建模必备】遗传算法的基本原理与步骤(变异)
  7. 让语音助手听懂方言,这个数据集能搞定
  8. 5G+云网融合,移动云带领开发者释放边缘计算的力量
  9. 谷歌AI专家爆料:90%的人都不知道,写不出好代码,是输在了这点上!
  10. Python 炫技操作:合并字典的七种方法