博雯 发自 凹非寺
量子位 报道 | 公众号 QbitAI

5位学生2个月做出来的AI项目,能走到哪一步?

不仅能通过目标基因查询对应药物,还能查询癌症相关药物的具体基因,包括靶向的基因和通路:

像这样的项目还不止一个:

寓教于乐的教育桌游、提取金融文档事件的系统、营销号短文生成器,甚至还有AI陪你一起拼乐高……

这就是今年画风及其丰富多变的AI训练营——DeeCamp。

两个月时间,这群海内外名校的学生们五六人一组,迅速做出了各种算法、软件、解决方案、有趣的玩法……

甚至连商业化路线都做出了规划。

也就难怪大赛评委,创新工场董事长兼CEO李开复博士在点评获奖作品时表示:

DeeCamp 2021充分说明AI技术已经走出实验室,在各行各业找到了非常好的商业化场景。

非编码区基因预测疾病

冠军团队GeneBERT的项目是基因检测及诊断。

具体来说,是通过全基因组序列分析,结合启动子,转录因子结合位点等基因调控元件对疾病进行预测。

“全基因组”是什么意思呢?

众所周知,基因是用来编码蛋白质的。

而在人类基因组中,98%的部分都是非编码序列,并不直接参与蛋白质的合成。

因此,这98%的非编码区一度被认为是冗余或无用的。

不过随着全基因组测序等项目的开展,人们也逐渐意识到,这98%的非编码区同样对基因表达有着重要的调控作用。

GeneBERT就希望通过学习多种非编码调控区域之间的交互作用,更好地理解疾病的成因,也为新药研发提供更多潜在的靶点。

首先,团队成员采用了一种多模态预训练方案,利用各类模态相关信息来训练向量:

这里的多模态,一个是标记(token)序列,另一个则是多种调控元件在DNA上的结合位置。

训练则在包含了人类胚胎大脑的开放染色质数据的ATAC-Seq数据集上完成:

然后就可以扩展到各种下游任务上。

一个成功的案例就是对复杂的多基因影响遗传病:先天性巨结肠病的预测。

在使用了疾病相关的RET基因的非编码区片段的内部数据做预训练后,模型成功预测了该疾病的患病风险。

目前团队已经初步建成了基因检测到个性化诊疗方案设计的一体化服务平台,对于下一步的方向,他们还表示:

项目的研究还会继续,我们的项目将进一步提升预训练模型的泛化性能,为学术界提供更多的用来分析非编码区基因突变的新范式。

清华大学讲席教授、智能产业研究院院长张亚勤教授对GeneBERT则评价道:

同学们可以尝试在企业服务、产业工业化等to B垂直领域着手,帮助to B企业解决真实的问题。

冠军团队GeneBERT无论是交叉学科的选题,还是商业化思路,都起到了很好的示范作用。

医疗、教育、金融、还有拼乐高

除了冠军团队之外,其他几条赛道的获胜项目也非常显眼。

来自南京大学的Free Lunch团队获得了“人工智能驱动的商业场景”赛道冠军。

他们的金融文档事件提取系统能够从海量篇章级金融文本中抽取事件以及相关实体信息:

团队也用抽取得到的结构化金融信息搭建了一个项目平台,提供金融文档分析、金融日历、热点推荐等功能。

而由清华大学、澳科大、西农科大和美国哥伦比亚大学同学组成的Edutainment Club团队获得了“人工智能的创新与创意”赛道的冠军。

他们研发的“Click”是一款结合推荐系统的教育桌游

这一游戏将矢量棋盘的图形化游戏设计与AI生成的STEM题库融合,枯燥的加减运算题也就变为了管道联通的游戏场景。

“语言与知识的智能创新”赛道的冠军则是来自同济大学和美国波士顿大学的团队。

他们研发了能够根据产品关键词生成营销文案的“AI荐”系统,根据用户上传的产品图片或特征,为不同风格的受众提供各有侧重的营销文案:

而同样走到了最终决赛的ICU智能诊疗一体化项目,能够在点击关键词时,自动生成影像报告及可视化解释:

还有可以进行AR辅助积木拼装的BrickPal,能够根据NLP技术自动生成积木拼装顺序,并通过AR达到一种沉浸式的积木拼装:

DeeCamp人工智能训练营

DeeCamp是一个由创新工场发起的AI训练营。

这是一项面向全球大学生,专注培养应用型AI人才的公益项目,自2017年发起开始,已经举办了五届。

而刚刚结束的DeeCamp 2021,则由创新工场和清华大学智能产业研究院(AIR)联合主办。

整场比赛共有来自全球200名顶尖高校的学生共组成了39支队伍,向语言、医疗、创新、商业4大赛道的13个赛题发起挑战,最终有6支队进入总决赛。

在8月17日的总冠军答辩&结营典礼上,6支队伍里的GeneBERT团队获得了总冠军和10万元大奖:

而四位分赛道冠军则分别获得了3万元奖金。

对于2021年的这一批学员,李开复博士表示:

从同学们的项目里:游戏、学习、广告、文本生成、信息的理解和分析上,我们可以看到AI不仅在各行各业都有商业化的成果,而且落地速度也非常快。

过去两三年,甚至半年前刚刚出来的技术,现在已经被非常好地使用了。

最后,他也鼓励同学们去寻找好的商业落地的伙伴,用AI搭配行业专家的方式,用技术解决技术带来的挑战,给社会带来正能量,从而造福更多的人类。

DeeCamp2021结营仪式云合影

DeeCamp官网:
https://deecamp.com/#/home

参考链接:
[1]https://www.qbitai.com/2021/05/23618.html
[2]http://www.genebert.com/

DeeCamp 2021冠军用“垃圾DNA”预测癌症,李开复:医疗是AI的下一个突破点相关推荐

  1. 李开复:旗下AI公司或在2021年上市,估值至少10亿美元

    人工智能技术的公司已经到了开花结果的时刻,用技术价值转换为商业价值的公司,一定是未来. 根据商业媒体网站 Bloomberg 报道,创新工场(Sinovation Ventures)董事长兼首席执行官 ...

  2. 李开复「预见2021」:四大领域将迎来空前发展机遇

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 转载自:量子位 疫情突袭.国际关系变幻莫测--黑天鹅事件频出的2020年,也已仅剩2天时间. 站在如此 ...

  3. 放射学中基于影像组学和人工智能预测癌症预后

    人工智能(AI)在医学影像诊断中的成功应用使得基于人工智能的癌症成像分析技术开始应用于解决其他更复杂的临床需求.从这个角度出发,我们讨论了基于人工智能利用影像图像解决临床问题的新挑战,如预测多种癌症的 ...

  4. 易基因 | 文献速递:RRBS方法绘制1538例乳腺癌甲基化图谱并预测癌症发生/预后

    大家好,这里是专注表观组学十余年,领跑多组学科研服务的易基因. 错过RRBS技术在人和小鼠疾病表观遗传特征研究的可点:Mol Biol Evol | 利用RRBS技术多维度分析人和小鼠的疾病表观遗传特 ...

  5. 谷歌对2021年的六个预测:数据和云技术的革命即将到来

    来源:AI前线 作者:Debanjan Saha 译者:平川 策划:钰莹 预测是充满挑战的,因为具体的预测取决于特定的时间框.但从云应用方面表现出的趋势来说,我们 2020 年看到的一些事情可能预示着 ...

  6. 今年天津分数线高考成绩查询2021年,2021年天津高考分数线预测(2021年天津高考录取分数线)2021年天津高考分数会降低吗...

    高考一直都是大家谈论的热点话题,家长们都希望自己的孩子能够考出一个好的分数,录取分数线是每回高考过后大家最为关注的事情,这意味着能上一个什么样的大学,对于2021年要参加天津高考的考生来说,肯定想要预 ...

  7. 【干货】2021年中国主要经济指标预测-中国科学院.pdf(附下载链接)

    大家好,我是文文(微信号:sscbg2020),今天给大家分享中国科学院预测科学研究中心于2021年1月发布的干货报告<2021年中国主要经济指标预测.pdf>,伙伴们别错过了呀. 本报告 ...

  8. 2021四川艺术高考成绩查询,2021四川高考艺术类分数线预测

    2021四川高考艺术类分数线预测2021-04-21 08:56:18文/叶丹 四川高考艺术类录取分数线大概是多少分?现在考生们都很关心艺术类分数线,下面是高三网小编根据历年分数线情况进行的推测,仅供 ...

  9. 2021漳州一中历年高考成绩查询,2021漳州一中录取分数线预测

    2021漳州一中录取分数线预测2021-04-18 10:14:50文/颜雨 福建省漳州第一中学在1978年被确定为省首批办好的17所重点中学之一:1996年通过了省一级达标学校验收. 漳州一中录取分 ...

最新文章

  1. 计算机应用基础10000字论文,计算机应用基础论文
  2. c语言程序能够在不同的操作系统下运行,这说明c语言具有很好的,程序设计(C)作业一(有答案)...
  3. boost::hana::is_an用法的测试程序
  4. Caused by: java.net.UnknownHostException: ubuntu: Name or service not known
  5. C++不能被声明为虚函数
  6. python制作查询工具发给别人使用_用Python做一个简单的翻译工具
  7. c语言发牌小游戏,大家想想怎么用c实现我们经常玩的斗地主游戏的发牌过程呢?...
  8. 使用gitpages开启个人域名博客
  9. 如何根治BYOD中国式“水土不服”
  10. C语言中如何使用system函数
  11. 遗传算法原理及其python实现
  12. 内核启动流程分析----内核启动
  13. gmssl java api_关于GmSSL Java API编译
  14. matlab实现一阶低通滤波器,matlab仿真一阶低通滤波器幅频特性和相频特性[计算机类]...
  15. 200724 EXCEL
  16. 电科 | 电子器件微纳米加工技术
  17. VS 【】处有未经处理的异常(在【程序名】.exe 中): 0xC00000FD: Stack overflow (参数: 0x00000000,0x008D2000)。
  18. 用MATLAB的函数scatter()绘制散点图
  19. 用豆瓣源安装pytorch1.5.1(速度很快)
  20. 「算法与数据结构」从入门到进阶吐血整理推荐书单

热门文章

  1. 骑马钉 单联 竖版 正反印
  2. mt4双线macd_mt4双线macd指标丨mt4双线macd指标独家选股秘笈
  3. 怎样经营好一家汽车美容店
  4. 景点特色Scenic Spots Feature
  5. Android 模拟器下载应用(APK)到 PC 研究
  6. 在Unity中实现区域连线
  7. 做不喜欢但是应该做的事
  8. 关于考驾照科目三的总结
  9. kubeadm部署Kubernetes(k8s)完整版详细教程
  10. 网络调试助手建立tcp服务器失败的一种解决方案