AMiner会议论文推荐第三十五期

2024-05-13 02:14:37

AMiner平台由清华大学计算机系研发，拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱，提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线，吸引了全球220个国家/地区1000多万独立IP访问，数据下载量230万次，年度访问量超过1100万，成为学术搜索和社会网络挖掘研究的重要数据和实验平台。

AAAI 2021 论文推荐

Semantic MapNet: Building Allocentric SemanticMaps and Representations from Egocentric Views

论文链接：https://www.aminer.cn/pub/5f7c348e91e0117ac2a78860/?conf=aaai2021

推荐理由：该工作研究语义映射任务–具体来说，该任务给一个具身代理（机器人或以自我为中心的人工智能助手）新的环境，要求其从一个位置已知的RGB-D相机的自我中心观察中（通过定位传感器）建立一个分配中心的语义地图（“什么在哪里？”）。为了实现这一目标，作者提出了SemanticMapNet（SMNet），该模型由以下部分组成。(1)一个以自我中心的视觉编码器，它对每个以自我为中心的RGB-D帧进行编码；(2)一个特征投影器，它将以自我为中心的特征投射到平面图上的适当位置；(3)一个空间记忆张量，其大小为平面图长x宽x特征半径，可以学习积累投射的自我中心特征；(4)一个地图解码器，它使用记忆张量来生成语义自上而下的地图。SMNet结合了投影相机几何学和神经表征学习的优势，在Matterport3D数据集的语义映射任务上的部分表现显著优于其他基线。此外，作者还展示了如何将SMNet建立的神经表象记忆和空间语义分配中心表征用于同一空间的后续任务。

DIRV: Dense Interaction Region Voting for End-to-End Human-Object Interaction Detection

论文链接：https://www.aminer.cn/pub/5f7aef0c91e011983cc81ee5/?conf=aaai2021

推荐理由：近年来，人机交互（ human-object interaction，HOI）检测取得了令人瞩目的进展。然而，传统的两阶段方法通常推理速度较慢，现有的单阶段方法主要集中在交互的联合区域，这对HOI检测引入了不必要的视觉信息作为干扰。为了解决上述问题，作者在本文中基于交互区域这一概念提出了一种新型的单阶段HOI检测方法DIRV。与以往的方法不同的是，该方法集中在对每对人-物不同尺度的密集采样交互区域，从而捕捉到交互最本质的细微视觉特征。此外，为了弥补单一交互区域的检测缺陷，作者引入了一种新型的投票策略，充分利用这些重叠的交互区域来代替传统的非最大抑制（Non-Maximal Suppression，NMS）。

Vid-ODE: Continuous-Time Video Generation with Neural Ordinary Differential Equation

论文链接：https://www.aminer.cn/pub/5f8d5f6d91e0116f3d44db04/?conf=aaai2021

推荐理由：视频生成模型通常是在固定帧率的假设下运行的，这导致在处理灵活的帧率(例如，增加视频中更多动态部分的帧率以及处理丢失的视频帧)时，性能不理想。为了解决现有视频生成模型在处理任意时间步长方面的局限性，作者提出了将神经ODE(Vid-ODE)与像素级视频处理技术相结合的连续时间视频生成方法。该方法以最近提出的神经ODE的卷积版本ODE-ConvGRU作为编码器，使模型Vid-ODE可以学习灵活帧率的输入视频的时空动态。解码器将学习到的动态函数集成到任意给定时间步长的视频帧中进行合成，其中像素级合成技术用于保持单个帧的清晰度。作者通过在四个真实世界的视频数据集上的大量实验，验证了Vid-ODE在各种视频生成设置下的性能优于最先进的方法。

ICLR 2021 论文推荐

Co-Mixup: Saliency Guided Joint Mixup with Supermodular Diversity

论文链接: https://www.aminer.cn/pub/600831499e795ed227f530a5/?conf=iclr2021

推荐理由：虽然深度神经网络在对训练分布的拟合上表现出了良好性能，但提高网络对测试分布的泛化性能和对输入扰动敏感性的鲁棒性仍是挑战。虽然已有研究提出了一些基于混叠的增强策略来解决上述问题，但如何最好地利用每个输入数据内的监理信号进行混叠仍不清楚。该工作提出了一种新的批量混叠观点，并制定了优化构建一批混叠数据的方法，最大限度地提高每个单独混叠数据的数据显著性度量，并鼓励构建的混叠数据之间的超模态多样性。为此，作者提出了一个新型的离散优化问题，即最小化子模态函数之间的差异。同时，该工作还描述了一种基于模块近似的迭代子模态最小化算法，用于每一个minibatch的高效混搭计算，适合基于minibatch的神经网络训练。

Evolving Reinforcement Learning Algorithms

论文链接: https://www.aminer.cn/pub/600833a89e795ed227f531aa/?conf=iclr2021

推荐理由：该工作提出了一种元学习强化学习方法，通过在计算图的空间上搜索，计算出基于价值的无模型RL代理优化的损失函数。上述方法学习到的算法是不分领域的，能够泛化到训练过程中未见的新环境。同时，该方法既可以从头开始学习，也可以从已知的现有算法（如DQN）上进行自举，从而实现可解释的修改。通过在经典控制和网格世界任务上进行从头学习，该工作重新发现了时差（temporal-difference，TD）算法。在DQN的引导下，作者强调了两个学习算法，它们在经典控制任务、网格世界类型任务和Atari游戏上拥有良好的泛化性能。

Rao-Blackwellizing the Straight-Through Gumbel-Softmax Gradient Estimator

论文链接: https://www.aminer.cn/pub/5f85722e91e011ff328095d7/?conf=iclr2021

推荐理由：最简单的无偏估计器往往具有高方差，因此离散潜变量模型中的梯度估计极具挑战性。为解决上述问题，现代估计器或引入偏差，或依赖多个函数评估，或使用依赖于输入的基线。因此，急需一种仅用最小调整、计算成本低、均方差小的估计器。在本文中，作者展示了流行的Gumbel-Softmax估计器的直通变体的方差可以通过Rao-Blackwellization减少，而不增加函数评估的次数。同时，作者通过实证证明，该方法能够减小两个无监督潜变量模型的方差，提高收敛速度。

Contrastive Explanations for Reinforcement Learning via Embedded Self Predictions

论文链接: https://www.aminer.cn/pub/5f8581a591e011ff3280972d/?conf=iclr2021

推荐理由：作者研究了一种深度强化学习（reinforcement learning，RL）架构，它能够解释为什么一个学习代理喜欢一个动作而非另一个动作。其关键思想是学习人类可理解的预期未来属性直接表示的行动值。上述方法通过嵌入式自我预测(embedded self-prediction，ESP)模型来实现，该模型能够根据人类提供的特征来学习其属性。同时，行动偏好可以通过对比每个行动所预测的未来属性来阐述。为了解决大量特征存在的情况，作者开发了一种新的方法，用于计算最小充分的ESP解释。在三个领域的案例研究表明该ESP模型可以有效地学习并提供有洞察力的解释。

Complex Query Answering with Neural Link Predictors

论文链接: https://www.aminer.cn/pub/5fa9175f91e011e83f7407f4/?conf=iclr2021

推荐理由：神经链接预测器对于识别大规模知识图谱中的缺失边缘非常有效。然而，如何使用这些模型来回答在一些领域中更复杂的查询仍然不清楚（例如使用逻辑连词、不连词和存在性定量器的查询，并考虑缺失的边缘）。在这项工作中，作者提出了一个框架，用于高效回答不完整知识图谱上的复杂查询。该框架将每个查询转化为一个端到端可区分的目标，其中每个原子的真值由一个预先训练的神经链接预测器计算。在实验中，所提出的方法比最先进的方法–在数百万个生成的查询上训练的黑盒神经模型–产生了更准确的结果，而不需要在大量和多样化的复杂查询上进行训练。

DiffWave: A Versatile Diffusion Model for Audio Synthesis

论文链接:https://www.aminer.cn/pub/5f69e4bc91e011a2f0270974/?conf=iclr2021

推荐理由：在本文中，作者提出了DiffWave，一个多功能的Diffusion概率模型，用于有条件和无条件的Waveform生成。该模型是非自回归的，在合成时通过一个恒定步数的马尔可夫链将白噪声信号转换为结构化波形，并通过优化数据似然的变异约束有效地进行训练。DiffWave可以在不同的波形生成任务中产生高保真的音频，包括以旋律谱图为条件的神经声码、类条件生成和无条件生成。同时，作者证明了DiffWave在语音质量方面可以与强的WaveNet vocoder相媲美，同时合成速度快了一个数量级。在具有挑战性的无条件生成任务中，从各种自动和人工评估的音频质量和样本多样性来看，该模型明显优于自回归和基于GAN的波形模型。

订阅了解更多论文信息，定制您的个人科研动态信息流：https://www.aminer.cn/user/notification?f=mt

AMiner会议论文推荐第三十五期相关推荐

AMiner会议论文推荐第五十一期
AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...
AMiner 会议论文推荐第十一期
AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...
AMiner 会议论文推荐第十二期
AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...
AMiner 会议论文推荐第十三期
AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...
AMiner 会议论文推荐第十八期
AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...
AMiner 会议论文推荐第十期
AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...
AMiner会议论文推荐第二十六期
AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...
AMiner 会议论文推荐第六期
AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...
AMiner 会议论文推荐第一期
AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权.平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价.专家发现.智能指派.学术地图等科技情报专业化服务.系统2 ...

最新文章

热门文章