前言

第 19 届 CNCC 于2022年12月8-10日召开,本届大会为期三天,首次采取全线上举办形式,主题为“算力、数据、生态”,重点在保持多样性、聚焦热点前沿话题、平衡学术界和产业界参与等维度展开讨论。大会由CCF会士、中国科学院院士、国防科技大学教授王怀民担任主席,共设有 14 个特邀报告、3 场大会论坛、118 个涉及 30 多个领域方向的技术论坛以及特色活动,共有图灵奖获得者、田纳西大学教授Jack Dongarra,中国科学院院士、北京航空航天大学计算机学院教授钱德沛,中国科学院院士、西安交通大学教授管晓宏,中国工程院院士、北京邮电大学教授张平等七百余位计算领域讲者作报告。本文对本次大会中NLP相关的两个报告进行下述总结。


报告1——少标注NLP讨论

目前主流的自然语言处理模型均高度依赖大规模标注数据,然而由于自然语言处理任务具有标注难度高、任务种类多、领域差异大且层出不穷等特点,导致针对特定任务的标注数据量往往较少。因此,研究如何基于少量标注数据构建高精度自然语言处理系统具有重要意义。但是由于自然语言处理还具有知识的依赖性、表示的符号性、任务的多样性等特点,使得现有少标注学习方法在面向自然语言处理问题时往往显得力不从心。本论坛将邀请多位自然语言处理专家,就少标注自然语言处理理论以及方法的最新研究进展、未来发展方向进行深入探讨。

本报告由哈尔滨工业大学的车万翔教授主持,共有4场子报告,分别由西湖大学张岳教授、浙江大学陈华钧教授、清华大学刘知远教授和复旦大学邱锡鹏教授主讲。

  • 第一场报告中,张岳老师提到语言模型在跨域场景下的鲁棒性问题,首次尝试使用提示学习(Prompt Learning)做命名实体识别工作,此外,使用数据增广的方式可以大大提升模型在同分布和跨分布场景下的小样本学习能力。

    在本报告结束后,车万翔老师提出一个模型能力跃迁的问题:大模型是否会自动处理OOD等问题?张岳老师表示这一问题值得持续关注。

    个人思考:语言模型在训练过程中如果找到Shortcut,就会投机取巧,泛化性则相应下降,那是不是对于安全性较低(如容易植入后门)的模型,根据其泛化性可以对其进行识别?

  • 第二场报告中,陈华钧老师围绕知识图谱(Knowledge Graph)与低资源学习(Low Resource Learning)两个概念延伸出 LRL4KG 以及 KG4LRL 两大任务,并针对 KG4LRL 场景总结为:大样本靠机器学习,小样本靠知识推理,由此可见知识在低资源场景下的重要性。

  • 第三场报告中,刘知远老师围绕“Delta Tuning:大模型的小参数高效微调”这一主题,针对“预训练+微调”这一范式,对 Fine-tuning 与 Prompt-learning 的区别进行对比,就如何在小范围微调参数的前提下将大模型更好地应用于下游任务展开报告。

    关于OpenDelta相关工作,具体论文见:Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models(arXiv, 2022)

  • 第四场报告中,邱锡鹏老师以“语言模型及服务”(Language Model as a Service,LMaaS)展开报告,主要有两个挑战:(1)构建一个适用于所有nlp任务的模型,即 One Model Fits All 任务(2)设计不同微调方法,如报告中提到的y-Tuning、Black Box-Tuning等研究工作。

    相关论文:

本场报告中,几位老师都不约而同提到了大模型时代,知识对于语言模型的重要性。语言模型的训练离不开支知识的加持,在语言模型尤其是大规模模型发展过程中,大量知识的支撑是必不可少的,这也是大势所趋。


报告2——现代文本摘要技术研究

近些年来预训练语言模型的出现极大推动了自然语言处理领域的进步,文本摘要作为自然语言处理领域最经典任务之一,又发生了哪些技术变革?事实一致性、低资源成为新的研究热点;同时,谷歌、亚马逊等互联网公司相继推出面向不同领域的在线摘要服务,为摘要技术的发展建立了新的应用场景,科研人员也对科学文献、对话等全新领域掀起了新的探索热潮。 本次“现代文本摘要技术研究”论坛即是希望针对摘要技术最新问题进行研讨,也是希望在大模型技术加持下,摘要任务如何构建具有其自身特色的科学问题和方法模型深入挖掘。为此,特邀五位嘉宾从多个维度入手,分别就:自然语言生成技术、科学文献摘要、摘要的事实一致性研究、对话摘要和低资源文本摘要技术等几方面进行交流探讨。

本报告由哈尔滨工业大学的秦兵教授和北京大学的万小军教授共同主持,共有5场子报告,分别由清华大学黄民烈教授、百度肖欣延博士、哈尔滨工业大学冯骁聘教授、北京理工大学高扬副教授和中国人民大学严睿副教授主讲。

  • 第一场报告中,黄民烈老师以ChatGPT开篇,就“自然语言生成的未来”展开报告。大纲如下:

    • NLG 挑战和机遇

      • 挑战:

        1. 难以提高模型性能
        2. 模型的时效性(模型迭代加快)
        3. 资源和时间成本递增
      • 机遇:
        1. 新的任务、应用场景
        2. 新的生成方法
    • Universal LM(预训练语言模型的理解)

      • Understanding:探索预训练语言模型学到的知识,便于更好地完成下游任务
      • Universality:模型的可解释性——为何预训练语言模型能够适配很多下游任务
      • Reliability:Prompt的探索,选择最佳的prompt
    • 长文本生成:面临问题包括(1)可控性(2)重复(3)连贯性(4)冲突

    • 非自回归生成(Non-Autoregressive Text Generation,NATG):生成的文本同时解码,推断速度加快,而且无暴露偏差,更灵活的解码方式
      未来方向:机器翻译 ➡️ 通用文本生成如对话生成

    • Evaluation(文本生成的评估)

    • 总结:

      • 生成模型大规模线上部署面临两大瓶颈:(1)算力消耗(2)解码速度
      • 安全性和可控性问题有待解决:检测算法、生成更安全

此处推荐试玩小程序“AI乌托邦”,人格化AI创建引擎

  • 第二场报告中,百度肖欣延老师就“面向事实一致性的可靠文本生成”为主题展开报告。事实一致性即可靠性,未来展望:可靠文本生成与评测方法。

  • 第三场报告中,冯骁聘老师就 “知识指导的对话摘要技术研究”为主题展开报告。关于对话摘要,产业界已有一些落地应用如 Google:Conversation Summary & Amazon:Call Summarization & Microsoft:Call Summarization & Headroom:Meeting Summarization.

    对话摘要 = 对话理解 + 摘要生成。对话摘要示例:

    输入文本

    输出文本

    与传统的文本摘要任务不同,对话摘要面临对话为源内容,数据稀缺、对话建模、场景理解等挑战。此外,报告中提到主题漂移现象,即对于输入的长对话文本,可能具有多个主题,这时首先需要对主题进行提炼。

    未来方向:多模态、多领域、多语言、可靠性对话摘要

  • 第四场和第五场报告中,高扬老师和严睿老师分别就 “面向低资源的文本摘要生成技术”和“Learning towards Abstractive Text Generation”为主题展开报告。由于这两个报告介绍的研究工作比较具象,没有详细记录。


此外,在大会的其他报告中了解到一个概念:MLOps,MLOps 是 Machine Learning Operations 的缩写,是一门工程学科,旨在统一 ML 系统开发(dev)和 ML 系统部署(ops),以标准化过程生产高性能模型的持续交付。详细介绍参见这篇博客。


参考资料

  1. 2022 中国计算机大会(CNCC 2022)
  2. 2022 中国计算机大会(CNCC 2022) 大会手册
  3. 揭秘大模型背后的机理,清华49页长文全方位分析参数高效微调方案Delta Tuning - 腾讯云开发者社区-腾讯云 (tencent.com)
  4. “语言模型即服务”必读论文 - 知乎 (zhihu.com)

2022 CNCC 中国计算机大会参会总结相关推荐

  1. 开课吧python学费-开课吧成为CNCC中国计算机大会唯一教育合作伙伴

    原标题:开课吧成为CNCC中国计算机大会唯一教育合作伙伴 10月22日,一年一度的计算技术领域的年度盛会--中国计算机大会CNCC在北京(主会场),沈阳.杭州.济南(分会场)同步召开, 本届大会以&q ...

  2. 开课吧学python靠谱吗-开课吧成为CNCC中国计算机大会唯一教育合作伙伴

    原标题:开课吧成为CNCC中国计算机大会唯一教育合作伙伴 10月22日,一年一度的计算技术领域的年度盛会--中国计算机大会CNCC在北京(主会场),沈阳.杭州.济南(分会场)同步召开, 本届大会以&q ...

  3. eBPF 技术的发展与挑战---2022云栖大会参会纪实

    前言: 非常荣幸受云栖大会和龙蜥操作系统峰会的邀请,参加了eBPF论坛的现场分享.从可观测到安全.从平台到基础架构,今天的云栖大会eBPF会场的各位嘉宾从多维度多角度,分析和分享了各自领域应用eBPF ...

  4. CNCC 2019 | 计算领域年度盛会—中国计算机大会10月将在苏州举行

    2019年7月24日,中国计算机学会(CCF)和苏州工业园区管委会共同举办2019中国计算机大会(CNCC2019)新闻发布会,向各界介绍CNCC2019的筹备情况. 据本届CNCC大会指导委员会主席 ...

  5. 众享比特董事长严挺出席2022中国计算机大会“元宇宙、Web3.0、NFT:机遇还是泡沫?”技术论坛

    12月10日晚,为期三天的2022中国计算机大会(2022CNCC)成功落下帷幕.众享比特董事长严挺出席"元宇宙.Web3.0.NFT:机遇还是泡沫?"技术论坛并参与专题研讨. 第 ...

  6. 2021年度中国计算机大会的技术论坛,值得一谈

    CCF秘书长唐卫清详细介绍了今年CNCC技术论坛,无论是从数量.质量,或是覆盖范围的角度来说,本届CNCC技术论坛都超过了往届,将为参会者带来学术.技术.产业.教育.科普等方面的全方位体验. 中国计算 ...

  7. CNCC 2017大会第一天,邱成桐,梅宏,沈向洋,李飞飞,汤道生,马维英都讲了什么?...

    本文讲的是CNCC 2017大会第一天,邱成桐,梅宏,沈向洋,李飞飞,汤道生,马维英都讲了什么?, 10月26上午8:30分,由中国计算机学会(CCF)主办,福州市人民政府.福州大学承办,福建师范大学 ...

  8. 2022 CCF中国软件大会(CCF Chinasoft)“泛在计算时代的智能化运维”论坛成功召开...

    2022年11月27日,2022 CCF中国软件大会(CCF ChinaSoft)泛在计算时代的智能化运维论坛成功举办.本次大会由中国计算机学会(CCF)主办,CCF软件工程专委会.系统软件专委会.形 ...

  9. 2015中国计算机大会在合肥举行

    10月22日上午,2015中国计算机大会(CNCC)在合肥开幕,本次大会主题为"互联网催生新经济".会议由中国计算机学会(CCF)主办,中国科学技术大学和合肥市人民政府联合承办.C ...

  10. 领航未来,2022 世界人工智能大会「元宇宙的数字原生进化」论坛等你来!

    2022世界人工智能大会 (WAIC2022) 将于 2022 年 9 月 1-3 日在上海举办.大会由国家发展和改革委员会.工业和信息化部.科学技术部.国家互联网信息办公室.中国科学院.中国工程院. ...

最新文章

  1. 今年,自动驾驶卡车将在无人驾驶的情况下上路
  2. 创建型模式 简单工厂模式
  3. .top域名应注意什么
  4. 形变立体跟踪-基于稠密运动估计和力学仿真(1)
  5. 如何正确使用Windows的Ping命令
  6. Spring Bootstrap中具有配置元数据的高级配置
  7. matlab 中sumg,MATLAB)课后实验答案[1]
  8. html一个页面多个动画,如何在单个html页面中添加两个相同的adobe边缘动画?
  9. 用python画小黄人-怎么用python画小黄人
  10. 在GNS3中使用SecureCRT6.1出错的解决方案
  11. python多进程编程实例_[python] Python多进程编程技术实例分析
  12. npm install 本地安装与全局安装
  13. UE4 官方文档阅读笔记——材质篇
  14. 【高并发解决方案】高并发解决方案汇总
  15. 产品经理项目流程(四)——需求文档
  16. 项目经理之我思员工能动性
  17. 推销计算机英语作文,2018年12月英语四级作文范文:卖电脑
  18. Linux系统下实现监控摄像头RTSP协议对接腾讯云直播
  19. r5 5600g和5600x的区别 选哪个好
  20. 1020 月饼 (25分) 冒泡排序

热门文章

  1. 零预算也能用SEO技巧达到Google自然搜寻结果第1名
  2. 【C语言学习】sscanf的简单使用.
  3. 京版国八条终于出来了——京十五条
  4. java给文件夹加密码_用JavaScrpt 实现文件夹轻松加密 (转)
  5. 逆火软件测试工资,逆火刷机软件介绍和软件使用说明
  6. 张馨予一幅画拍出几十万,然而范冰冰却一直在向粉丝要画!
  7. 麻雀虽小,五脏俱全!RT-Thread BK7252 麻雀一号开发板上手体验
  8. C Primer Plus 第十章学习总结……2015.4.30
  9. matlab output()函数,matlab 函数y=f(input,output)该如何实现?
  10. 计算机公式求时间差公式,日期差计算(Excel表格中如何计算日期、时间差)