百度顶会论文复现营论文心得
百度顶会论文复现营论文心得-day1
博主参加了今天百度AI studio主办的顶会论文复现营,现进行到论文精读阶段,需要从约10篇文章中选择出1篇,写下心得体会,然后作为作业进行提交,这也是我第一次在CSDN上写文章, 全当练手了。这几篇论文里,按主要内容大致分为视频分类方向和GAN两个,由于博主科研方向与视频分类不太相关,所以就是想选择GAN相关的了,GAN还是蛮有意思的,其中有篇论文是BIGGAN的,本想很想做,但是硬件平台根本不允许,故放弃,最终选择了这篇:《Few-shot Video-to-Video Synthesis》,附上论文连接:链接:https://pan.baidu.com/s/1A5hKW-97phVDZBvCTXWsOA 密码:vgg8。这篇论文的摘要大致翻译是:视频到视频合成(vid2vid)旨在将输入的语义视频(例如人体姿势或分割蒙版的视频)转换为输出的逼真的视频。
尽管vid2vid的最新技术已经取得了显着进步,但现有方法存在两个主要局限性。
首先,它们需要大量数据。
训练需要目标人体或场景的大量图像。
第二,学习的模型具有有限的泛化能力。
姿势到人的vid2vid模型只能合成训练集中单人的姿势。
它不会推广到不在训练集中的其他人。
为了解决这些限制,我们提出了一个简单的vid2vid框架,该框架可通过在测试时利用目标的少量示例图像来学习合成先前未见过的主题或场景的视频。
我们的模型通过利用注意力机制的新型网络权重生成模块实现了这种快速的泛化能力。
我们进行了广泛的实验验证,并使用几个大型视频数据集(包括人类跳舞视频,谈话视频和街头现场视频)与强基准进行了比较。
实验结果验证了所提出框架在解决现有vid2vid方法的两个局限性方面的有效性。
可以在我们的网站上找到代码。
总结来说,创新就是两点,1是支持小样本量2是支持泛化到训练集中没有的人物。
由于时间仓促(博主还在上班),后续会继续更新,就当自己的记录了,目前先把作业交上去。
百度顶会论文复现营论文心得相关推荐
- 百度官方论文复现营!顶会审稿人28天手把手带你复现顶会论文
对于本科生,论文复现可以帮你快速奠定理论基石并彻底搞懂,为课题研究打好基础: 对于硕博生,如果你要发AI论文,就必须要快速大量的阅读特定方向的重要论文,并且理解创新点,进行复现,这才有利于找到自己的研 ...
- paddle复现pytorch踩坑(二):paddleAPI对照表(百度论文复现营活动提供)
百度提供了paddlepaddle对应pytorch的API对照表 环境:paddlepaddle1.8 百度论文复现营活动:论文复现营 Pytorch的API名称 Paddle的API名称 torc ...
- 【PaddlePaddle论文复现营】Temporal Pyramid Network for Action Recognition
[PaddlePaddle论文复现营]Temporal Pyramid Network for Action Recognition 写在前面的话 论文简介 从视频分类领域中的一个痛点谈起 相关工作 ...
- PaddlePaddle飞桨论文复现营——3D Residual Networks for Action Recognition学习笔记
PaddlePaddle飞桨论文复现营--3D Residual Networks for Action Recognition学习笔记 1 背景知识 1.1 C3D C3D是一种3D卷积提取视频特征 ...
- 飞桨论文复现营 CFDGCN-Paddle
★★★ 本文源自AI Studio社区精品项目,[点击此处]查看更多精品内容 >>> 飞桨论文复现营 科学计算 Combining Differentiable PDE Solver ...
- 计算机视觉顶会论文复现,计算机视觉论文_2014年 计算机视觉会议征稿_accv
计算机视觉哪个领域更有市场前景和就业前景,更可能出论文专利成果? 本人在一所大学的视觉实验室学习,面临方向选择,有语义分割,显著性检测,slam,医学图像,希望大佬们能- 在计算机视觉论文中bench ...
- 论文复现-1论文重读:Black-Box Tuning for Language-Model-as-a-Service
论文核心:使用PLM的API进而完成prompt learning,微调完成任务. 具体来说,是采用连续prompts拼接在input_text之后,然后,通过derivative-free的框架,完 ...
- 百度Paddle视频分类论文3D Resnet论文复现
前段时间参加了百度深度学习论文复现营--视频分类论文复现,在此做一些学习记录,希望可以帮助到有需要的朋友 学习资源 百度顶会论文复现营 https://aistudio.baidu.com/aistu ...
- 3D目标检测(单目)D4LCN论文复现(paddlepaddle)
D4LCN: Learning Depth-Guided Convolutions for Monocular 3D Object Detection (CVPR2020) 基于深度引导卷积的单目3D ...
- 百度顶会论文复现(3):视频分类综述
本节课主要是对视频分类的发展进行了介绍,包括任务与背景,分类方法,前沿进展等.课程地址为:https://aistudio.baidu.com/aistudio/course/introduce/13 ...
最新文章
- 第十七课.有向图模型与条件独立性
- 转载:QTableView中嵌入可视化组件
- Metaspliot 控制终端利用Samba漏洞渗透
- python图像识别代码_用Python进行简单图像识别(验证码)
- Linux的/var/www/html目录
- InnoDB中Adaptive hash index存在问题、Percona改进及一个bug
- BZOJ1283 序列(费用流)
- 基于matlab的车牌识别系统设计
- Python爬虫系列(一)——手把手教你写Python爬虫
- 雷达篇(十) dB和dBm的意义,功率W和dBm之间的换算
- 【思考】windows补丁提权的疑问
- python爬取LOL皮肤
- [Pandas] 数据合并 pd.merge
- Turtle图形绘制(绘制奥运五环)
- 把数字翻译成字符串python_把数字翻译成字符串
- 03 - 大学生如何使用GPT
- 业务巡检系统的整体设计和数据流程
- 初学python100例-案例34 单词转字母并排序 少儿编程python编程实例讲解
- 会计学原理 读书笔记2
- 镇魂街武神躯怎么修改服务器,镇魂街武神躯开服bug在哪里提交-开服bug提交方法-Appfound...
热门文章
- 计算机组成原理中rr,计算机组成原理作业~第四章.doc
- Typora自动上传图片
- maplab(2):ROVIOLI简介
- 《UnityAPI.Texture纹理》(Yanlz+Unity+SteamVR+云技术+5G+AI+VR云游戏+Texture+mipMapBias+wrapMode+立钻哥哥++OK++)
- 高可用、全集成、定制化,蚂蚁金服自动化测试如何演进
- 网易校招编程题------最长公共子括号序列
- ai背景合成_AI突破次元壁又火了!《飞屋环游记》动漫角色一秒变真人,网友:小罗的“猫王发型”有点酷...
- PPT里面如何插入斜体文字
- 转载:深圳入户和房价相关
- 手机计算机都无法上网,手机能上网但win7电脑不能上网怎么回事?