点击蓝字

关注我们

AI TIME欢迎每一位AI爱好者的加入!

随着ChatGPT、SAM为代表的大规模预训练模型的横空出世,对于人工智能、自然语言处理、计算机视觉以及软件开发等领域都带来了巨大的影响。2023年4月12日,AI TIME与上海交通大学人工智能研究院共同举办了CVPR 2023 预讲会,在panel环节,来自上海交通大学的王琦、任星宇、李逸轩、官同坤四位同学,围绕论文投稿、研究热点以及大模型时代下的科研等话题进行了思辨,以CVPR为例与观众分享了大模型新时代下的科研之路。

01

顶会论文投稿经验分享

● 投稿时间安排

任星宇:我认为论文投稿尽早准备比较好,留出更充裕的时间打磨文章,打磨的次数越多,论文的瑕疵就能相对越少。在第一次投稿的时候,经验不足,有很多问题是正常的,但需要留出足够的时间和导师一起修改,多次投稿熟悉写作套路之后,就能对整个流程比较清楚。

李逸轩:能早做的事情就尽可能在前期做完,比如画图、对比实验、写文章等等,给后面的文章润色留出更多时间。看文章与自己写文章是有差距的,如果是第一次写文章,最好在deadline一个月之前开始写,留出2周左右的时间修改文章是很重要的。

官同坤:对于顶会投稿,精度提升当然是必要的。还有很重要的一点是,写论文时想清楚任务的意义,如何打磨好整个故事。比如针对落地成熟的场景,应该具有有一定的实际意义,对真正落地起到一定的推动作用。

王琦:一开始不要过于追求完美,先让实验模型有个原型,论文有个初稿,在此基础上不断打磨、迭代。

● 如何Rebuttal?

任星宇:Rebuttal过程中最困难的两种情况,一是创新性不够,提出的观点难以让人信服;第二个是多个审稿专家对一个问题同时提出review,那说明论文中的某个点确实存在问题,这种情况会比较困难。如果提出的是实验细节问题或者理解不清的地方,这种会比较容易修改。在投稿过程中若遇到“创新性不足”问题,那就需要将整个故事重新给审稿专家讲一遍,把核心的观点和研究动机理顺,说清和前人工作中最主要的区别,阐明自己不同于别人的优势。若是遇到补充实验的要求,但是实验耗费时间较长,这种情况下我们需要实话实说,在最后的提交版本补充材料。但一般情况下我们会在交完初稿继续补实验,在Rebuttal环节补充。

李逸轩:针对创新性不足的问题,我的方法是给审稿人重新讲一遍整篇论文的故事,针对他的疑问和意见耐心解答,但要注意有所侧重,精简回答问题,尽量让他认可自己的想法。如果遇到特殊的情况(比如审稿人提出的问题不够专业),需要考虑其他的策略。

官同坤:在回答审稿人的意见之前,我们需要揣摩审稿人提出问题的动机,在问题之外他有什么疑惑,将这一点搞清楚,我们才能清楚如何更准确地回答问题。

王琦:当审稿人给出的评分非常不合理的时候,可以尝试给领域主席(AC)发邮件说明具体情况,一般是由AC决定论文是否录用。

02

科研经验分享

● 目前的研究方向及研究热点

任星宇:我目前的研究方向是三维人脸建模,它包括几何重建和纹理重建。该领域实践性更强,相关的文章更看重实际效果和落地性。在大模型的时代,现在的主流思路是与语言、文本大模型结合去提高特定任务的性能。CVPR的很多文章也都是这种范式,包括Stable diffusion视觉大模型的提出也促进了很多下游任务的优化,大家可以多多关注这方面的研究。但是学校中的算力条件有限,我们更应该关注应用层面,研究如何更好地使用大模型、结合多个大模型拓展更新的任务。

官同坤:我的研究方向是文本检测与识别,首先OCR目前的研究方向可以结合自监督,比如如何利用无标注的图像做自监督文本检测,自监督文本识别,面向检测与识别的自监督训练。其次,现有的语言模型在语义预测上错误率很高,较多的只是辅助视觉模型操作,可以在未来对语言模型进行深度优化,使语言模型具有语义矫正的功能。然后,端到端文本识别在目前仍需要一系列流程,还不够丝滑,未来的再突破也是一个问题。最后,OCR的应用场景很广泛,在一些场景下识别的精度还有待提升,比如工业场景,所以将研究聚焦到具体的任务当中也是值得研究的。

李逸轩:首先,现在的换脸算法与影视级别、游戏级别的应用是有差距的,如何将最新的技术与换脸结合并且达到很好的效果,并且如何与CG的方法系统地结合起来实现更好地落地是需要研究的。其次,3D换脸方面要解决的问题很多,比如目前使用3D GAN技术换脸的背景、头发效果并不理想且耗时长,与2D GAN的效果相比有差距,想要实现一些动态的驱动效果或者与下游任务结合也是非常值得探索的。

● CVPR中的idea来自哪里?

任星宇:总结日常生活中的直觉,将直觉提炼为一个规律,发现前人研究中的不足,对自己从日常生活中总结的经验加以探索研究。

官同坤:Idea的产生需要有任务引导,在实际任务中意识到存在的问题,并且现有研究中尚未解决,我们就可以继续研究。

李逸轩:首先出于自己的研究兴趣分析目标工作,找出与自己想实现的效果之间的差距。然后做出第一个demo之后重新理思路,加上一定的约束或者框架,讲好整个故事,让别人理解自己的想法。

● 对科研小白的忠告

任星宇:实践出真知。idea是通过实践得来的,抓紧时间动手,多做验证的工作才能知道有没有效,不要停留在空想的阶段。有实验结果之后,抓紧时间开始写论文,提前完成初稿才有更多时间打磨。其次选方向需要很慎重,不要太耗计算资源,选自己所在条件接受范围内的研究方向做起来会比较顺畅。

官同坤:首先科研小白初期可以将自己研究方向所有的研究工作看一遍,了解整个发展过程,记录重要的点,剖析前人未解决的问题。然后针对具体任务做实验,会发现不同的想法和问题,针对问题提出解决方案。有了想法和实验之后,写文章很重要,文章的打磨和修改也是需要锻炼的。多看论文,多动手实践,改进过程发现新的想法,并通过不断的实验验证有效性,在学习过程中不断成长。

李逸轩:最初的idea需要通过实践去验证,在尝试的过程中调整方向。写代码、配环境需要靠自己多动手实践,可以对照着代码看文章,理解思路和难点。多看新接触领域的文章,学会精读和泛读文章,要了解领域内大致的研究状况。

王琦:Get your hands dirty,理论要和实践相结合,有一个较为清晰的 idea,就可以动手实践了,通过实践得到反馈,不断地调整 idea。

03

大模型时代下的科研转变

任星宇:在大模型时代,我们可以将自己的方向与大模型结合匹配,将大模型作为先验提升自己任务的性能。对于遥感、医学等有具体物理意义的领域,针对其具体的物理场景做一个大数据集是很有意义的。如何将通用大模型与3D大模型以及其他更多的大模型更好地融合起来是值得思考的。

官同坤:第一,大模型对OCR的冲击是有的,但应该放平心态,积极想对策,拥抱大模型的到来,将自己的任务与其结合起来,做一些更有效果的工作;第二,技术工作可以被替代,但是大脑创造的鲜活性还是需要人类,我们要始终保持创造力。

李逸轩:找到合适的切入点将自己的领域与大模型做融合,将大模型作为工具,积极地拥抱新生事物。

王琦:我们可以将大模型结合到已有的任务上做改进,不断优化,将大模型作为工具来帮助我们更好地科研和生活。

整理:陈研

审核:王琦、任星宇、李逸轩、官同坤

点击“阅读原文”跳转可以查看回放哦!

往期精彩文章推荐

记得关注我们呀!每天都有新知识!

关于AI TIME

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1000多位海内外讲者,举办了逾550场活动,超600万人次观看。

我知道你

在看

~

点击 阅读原文 查看回放!

干货!拥抱大模型,探寻新时代的科研范式相关推荐

  1. 2023年AI大模型市场研究报告:迈向通用人工智能,大模型拉开新时代序幕

    省时查报告-专业.及时.全面的行研报告库 省时查方案-专业.及时.全面的营销策划方案库 [免费下载]2023年4月份热门报告合集 万字干货:ChatGPT的工作原理 无需翻墙,ChatGPT直接使用 ...

  2. 马斯克推出xAI,AI大模型进入新时代

    北京时间7月13日凌晨,马斯克在Twitter上宣布:"xAI正式成立,去了解现实."马斯克表示,推出xAI的原因是想要"了解宇宙的真实本质".Ghat GPT ...

  3. 数字人度晓晓AI画作卖出17万元,飞桨文心大模型推动AIGC时代到来

    本文已在飞桨公众号发布,查看请戳链接: 数字人度晓晓AI画作卖出17万元,飞桨文心大模型推动AIGC时代到来 一年一度的国内顶尖艺术院校的毕业展,成为最值得期待的中国艺术新兴力量们的展示舞台.在今年6 ...

  4. 中英文最大AI模型世界纪录产生,大模型竞赛新阶段来了

    边策 发自 凹非寺 量子位 报道 | 公众号 QbitAI 超大AI模型训练成本太高hold不住?连市值万亿的公司都开始寻求合作了. 本周,英伟达与微软联合发布了5300亿参数的"威震天-图 ...

  5. 干货丨李睿:新时代的医学影像及心脑血管成像的应用

    8月1日,主题为"新时代的医学影像及心脑血管成像的应用"的思享会在清数D-LAB成功举办.本期思享会由清数大数据产业联盟和清华校友总会AI大数据专委会共同主办,特邀清华大学医学院生 ...

  6. 干货下载|5G+AI新时代,音视频技术有哪些突破和创新?

    4G时代,音视频技术高速发展,直播行业异军突起,在社交.娱乐.电商.教育.医疗等领域高歌猛进.5G和AI时代已至,音视频技术定会上升到一个全新的高度,新场景.新应用.新标准也必将出现.特殊的2020年 ...

  7. 大而强 VS 小而美 | 史晓东、周明等共论:大模型主导的时代,NLP 该如何演进?...

    [专栏:前沿进展]近来,超大规模预训练模型快速发展,在自然语言处理领域引起热议.基于深度学习的自然语言处理技术正沿着"极大数据.极大模型.极大算力"的轨道,"无所不用其极 ...

  8. 大模型应用新范式:统一特征表示优化(UFO)

    从深度学习技术被提出以来,一直践行着"think big"的理念.特别是当预训练技术被广泛应用之后,更多的数据结合更大的模型参数量会持续带来模型性能的提升,这条定律不断被近期发布的 ...

  9. 平台+AI:全面拥抱大模型的商业创新,打造企业数字化「柔性供应链」 | D3演讲实录

    马斯克曾说:"高生产率解决诸多问题." 在社会化内卷的大环境下,借助数智化"降本增效"已是不争事实.AI技术日新月异.大量信息繁杂涌现,无数原来烟囱式的模式亟需 ...

最新文章

  1. MetaHuman效果炸了!但如果只想到元宇宙,那格局有点小了
  2. 8年程序员210天没找到工作,小公司老板:降薪5千,爱来不来
  3. html select选择事件_用 Java 拿下 HTML,分分钟写个小爬虫
  4. Arduino UNO WIFI开发板,学习必备开发套件
  5. js带开关的时钟_昌利JS系列混凝土搅拌机衬板配件
  6. csv文件用excel打开有多行是空的,用sublime打开空白行没有''处理方案
  7. java jdbc连接_java-jdbc数据库连接
  8. 物联网专题--基于APP Inventor的BLE蓝牙4.0数据通信
  9. Go 字典(Map)
  10. Codecov后门事件验证分析
  11. n1 linux wifi,【教程】N1在EMMC安装LINUX和HASSIO实现智能家居中枢
  12. (11)数据分析-TableOne工具
  13. Spring Data JPA持久层中的一对一和一对多
  14. 数据科学家成长指南(上)
  15. 移动宽带覆盖小区查询 (广东范围)
  16. 设备巡检的痛点和巡检方案
  17. 【中间件技术】第四部分 Web Service规范(10) Web Service规范
  18. 搜狗二季度财报解读:有扎实的现在,也有性感的未来
  19. ibm tivoli_集成Tivoli Federated Identity Manager和Tivoli Identity Manager
  20. 如何优雅地管理微信数据库?

热门文章

  1. 详细讲解回溯算法(一)
  2. Cadence报错ERROR: Netlister: can‘t find the date RFIC_sim/gmid/schematic was last extra
  3. 软件测试需要什么学历?
  4. 爬取古诗词网的诗经全文
  5. 微粒贷小贴士:了解网络虚假APP诈骗套路,以防上当受骗
  6. P3628 [APIO2010]特别行动队(简单斜率优化)
  7. 软件测试初识以及测试流程
  8. 清理缓存的问题ctrl+F5或者引入外部js的时候?加任意数字
  9. java orm框架 博客园_自己写ORM框架 DBUtils
  10. 传送到Kindle的Instapaper改变了您消费网络内容的方式-加上IFTTT,博客等