Sequential End-to-end Network for Efficient Person Search
Zhengjia Li 李正甲 苗夺谦 同济大学
座位挨着甲哥的菜鸡,希望跟着沾光
论文地址代码地址:https://zhuanlan.zhihu.com/p/358152127
Abstract
行人搜索旨在共同解决人员检测和人员重新识别(re-ID)问题。现有的工作已经设计了基于Faster R-CNN的端到端网络。然而,由于Faster R-CNN的并行结构,提取的特征来自于区域提案网络生成的低质量提案,而不是检测到的高质量边界框。行人搜索是一项细粒度的任务,这些较差的特性将显著降低re-id性能。为了解决这个问题,我们提出了一个连续的端到端网络(SeqNet)来提取优越的特征。在SeqNet中,检测和re-ID被认为是一个渐进的过程,并通过两个子网络依次进行处理。此外,我们还设计了一种鲁棒的上下文双向图匹配(CBGM)算法,以有效地利用上下文信息作为人匹配的重要补充线索。在两个广泛使用的人的搜索基准,CUHK-SYSU和PRW上进行的广泛实验表明,我们的方法取得了最先进的结果。此外,我们的模型在一个GPU上以11.5帧/秒的速度运行,并且可以轻松地集成到现有的端到端框架中。
Introduction
行人检测(Girshick等。2014年;格希克,2015年;Ren等人。旨在检测图像中所有人的边界框(BBoxx)。人员重新识别(re-ID)(Yang等。2017年;赵等人。2017年;Wang等人。2019年;傅等人。2019年;郝等人。2019年;赵等人。用于将感兴趣的人与手工裁剪的人的图像相匹配。虽然近年来这两个领域得到了广泛的研究,但由于其功能有限,它们不能直接应用于实际应用。为了缩小差距,徐等人。介绍旨在在场景图像中定位目标人的人搜索任务(Xu等。2014)。行人搜索可以看作是行人检测和人员重新识别的结合。在视频监控、查找失踪儿童、自助超市等领域具有广阔的应用前景。
(行人检测和reid目的区别介绍一下,存在不能应用于实际,开端徐发表了啥,应用领域是怎么样的)
如图1所示,现有工作将任务分为生成图像中所有人的BBox和person re-ID。他们要么用两个独立模型(两阶段方法)来解决问题或联合使用一个多任务模型(端到端方法)。

对于端到端方法(Xiao等。2017年,2019年;Munjal等人。2019年),他们设计了一个基于faster-R-CNN的多任务框架(Ren等人。2015)。建立了一个区域提案网络(RPN)来生成区域提案,然后将其输入到后续的并行检测和reID分支中。然而,由网络提取的这些特征来自于低质量的建议,而不是检测到准确的BBoxes。虽然这些劣质特征对粗粒度( coarse-grained)分类任务的影响很小,但它们会显著降低细粒度reID任务的性能。这个问题是由faster-R-CNN的并行结构引起的。由于检测和re-ID是同时处理的,所以在提取re-ID特征之前没有准确的盒子。对于两阶段的方法,没有这样的问题,因为检测和re-id是用两个单独的模型依次处理的。然而,它们是耗时和资源消耗的。
(端到端以及两阶段的代表作,以及缺陷,原因)
基于上述观察结果,我们提出了一个图1©所示的顺序端到端网络(SeqNet)来提取高质量的特征。具体来说,检测和re-ID分享茎表示,detectionand re-ID share the stem representations 但用两个头网络顺序求解。与基线相比,我们的模型使用了一个额外的faster-R-CNN头作为一个增强的RPN,以提供高质量的盒子。然后利用未经修改的基线头提取这些盒子的判别特征。在测试时,采用非最大抑制(NMS)在识别前去除冗余框以提高效率。此外,为了提高基线头对高(IoU)样本的分类能力,我们采用了更可靠的检测头分类结果。一般来说,我们的SeqNet不仅继承了两阶段方法的顺序过程,which可以为re-ID阶段提供准确的盒子,而且还保留了端到端训练方式和效率。
(总结,作者提出啥,和前人区别在哪,大致过程介绍一下)

图2:一个匹配查询图像和图库图像的示例。蓝色框表示查询人员,绿色框表示地面真相。每条黄线上附加的数字表示由这条线连接起来的两个人之间的相似性。
行人搜索面临的另一个挑战是如何利用上下文信息来执行更稳健的匹配。如图2所示,给定一个查询人(a),©为对应的地面真相,但相似度最大(0.6)的(d)将被错误地预测为前1名的结果。如果考虑到上下文信息(b),为了最大限度地提高总相似性,最优匹配应该为(a)↔©,(b)↔(d)。这样,就可以将错误的预测(d)修正为©。受此启发,我们设计了一种上下文二部图匹配(CBGM)算法来利用上下文信息作为对单个特征的补充。具体来说,我们将查询图像和每个图库图像中的所有人分别视为两组顶点。在这两组顶点上建立了一个完整的双向图,每条边的权重是由行人搜索网络计算出的对应顶点之间的相似性。然后利用Kuhn-Munkres(K-M)算法(Kuhn1955;Munkres1957)发现了具有最大权重的最优匹配。在此匹配中,将与查询者连接的人作为前1个结果。
(存在的挑战,加例子,我的解决办法是啥,大致做法)
本文的贡献有三方面:
•我们注意到以前的端到端框架的性能受到劣质特性的限制,并制定了一个连续的端到端网络(SeqNet)来对其进行改进。
•为了充分利用上下文信息,我们提出了一种上下文双向图匹配算法来实现更鲁棒的匹配。
•我们的方法在两个广泛使用的基准测试CUHK-SYSU上优于所有其他最先进的方法(Xiao等人。2017年)和PRW(Zheng等。2017)。此外,我们的方法可以很容易地集成到现有的端到端框架中。
(贡献是啥,分条)
Related Work
Person Search

自从两个大规模数据集CUHK-SYSU发布以来,行人搜索已经引起了人们对计算机视觉社区的广泛兴趣(Xiao等人。2017年)和PRW(Zheng等。2017)。这是一个简单的解决方案,可以通过行人检测器和re ID描述符依次解决问题。郑等人。对各种检测器和描述符进行系统的评估,并提出一种调整匹配相似度的重加权算法,以抑制假阳性检测(Zheng等。2017)。Lan、Zhu和Gong指出行人搜索的性能受到多尺度匹配的限制,并提出了一种能够学习更多识别性身份表示的跨层次语义对齐(CLSA)方法(Lan、Zhu和Gong2018)。陈等人。首先揭示了行人检测与行人re-id之间固有的优化冲突,并提出了一种掩码引导的双流(MGTS)方法来消除冲突(Chen等。2018)。韩等人。引入RoI变换层,共同优化检测和re-id模型(Han等。2019)。王等人。注意到在行人搜索中,这两个子任务之间的一致性要求,并采用任务一致的两阶段(TCTS)框架来解决以往工作中存在的不一致性(Wang等。2020)。董等人。提出一个实例指导建议网络(IGPN),以减少建议的数量,以减轻重re-ID的负担(Dong等。2020b)。
(主要讲行人搜索的最新文章方法,固有冲突,以及存在一致性)
除了两阶段框架外,基于faster R-CNN的更快、更简单的端到端方法也很受欢迎。肖童等人。设计第一个端到端行人搜索网络,用标准的faster R-CNN损失和他们提出的在线实例匹配(OIM)损失进行训练(Xiao等人。2017)。肖等人。引入中心损耗来提高特征表示的类内紧致性(Xiao等。2019)。Liu等人没有为图像中的所有人生成bboxes,而是,建议在查询的指导下递归地缩小搜索区域(Liu等。2017)。Chang等人。采用类似的想法,首先将深度强化学习引入到行人搜索框架(Chang等。2018)。严等人。建立一个图模型,利用上下文信息作为行人匹配的互补线索(Yan等。2019)。Munjal等人。提出了一个查询引导的区域提案网络(QRPN)来生成与查询相关的提案,以及一个查询引导的相似度子网络(QSimNet)来学习查询引导的reID得分(Munjal等人。2019)。陈等人。提出了一种层次在线实例匹配(HOIM)损失,利用检测和reid之间的层次关系来指导其网络的特征学习(Chen等。2020a)。董等人。设计一个双向交互网络(BINet)来删除bboxes外的错误上下文信息(Dong等。2020a)。为了调和这两个子任务的矛盾目标,陈等人。提出了一种名为规范感知嵌入(NAE)的新方法,将人嵌入到规范和角度中,分别进行检测和重新id(Chen等。2020b)。
更细致的 fasterrcnn相关的肖童论文,加上另一个想法相关的图方面的论文,外加 BINET NAE ,这些提到的算法在后续表6中都有展现!)
Multi-stage Faster R-CNN
一些研究人员将faster R-CNN扩展到一种多阶段的潮流。Gidaris and Komodakis提出了一个后处理步骤,即网络在推理阶段迭代多次,以获得更好的定位性能(Gidaris和Komodakis2015,2016)。Cai and Vasconcelos设计一个级联框架,该框架包含一系列经过不断增加的IoU阈值训练的检测器,以便对接近的假阳性具有更高的选择性(Cai2018)。受此启发,我们的模型被设计为一个多阶段的框架,将顺序过程引入到端到端人员搜索网络中。
(顺序过程的启发来自2018年的cascade网络,级联,不同的iou)
Method
在本节中,我们首先revisit端到端人员搜索网络,然后讨论它的缺点。接下来,我们将描述我们提出的顺序端到端网络(SeqNet)。最后,我们用公式表示了一个上下文双向图匹配(CBGM)算法来利用上下文信息。
End-to-end Network for Person Search
我们采用多任务网络NAE(Chen等。作为我们的基准。这个基线的概述如图3(a)。所示它采用了ResNet50(He等人2016)作为骨干网络。具体来说,以res1∼4作为茎网络,去提取图像的1024通道的茎特征图。区域提案网络(RPN)建立在这些特征图上,以生成区域建议。在NMS之后,我们保留了128个提案,并利用RoI-Align为每个提案汇集了一个1024×14×14区域。接下来,将这些区域输入res5,以提取2048维度的特征,然后将其映射到256维度的特征。它(该网络)使用这些2048-dim特征来计算回归和256-dim特征来执行分类和reid任务。规范感知嵌入器(NAE)的设计旨在监督分类和reid分支,并采用Smooth-L1-Loss(Girshick2015)来监督回归分支。
Problems of the End-to-end Framework
如前所述,基线接受较差的特征。为了调查其影响,我们训练了基线模型,并在表1中报告了两种评估设置下的结果。原始的设置是用并行化来表示的。在第二个设置称为序列化中,网络将迭代两次依次来解决检测和re-id。第一次迭代将输出检测到的bboex。然后,我们利用RoI-Align为每个BBox汇集一个固定大小的区域,并将它们输入res5以提取re-id特征。这样,就可以在re-id阶段之前获得更好的盒子。表1显示了在CUHK-SYSU上,re-ID的mAP增加了0.75%,对PRW的比例为1.12%。这说明网络的再识别能力受到方案劣质特征的极大限制。我们还注意到,检测性能略有下降。这是由于训练和测试阶段两者之间的不一致,即网络由RPN生成的建议进行训练,但由检测到的bboxes进行测试。因此,有必要在模型训练中引入序列化,而不仅仅是在测试阶段。
(没看明白这个实验是咋回事)

表1:较差的特征对CUHK-SYSU和PRW数据集性能的影响。我们将行人搜索分为检测和re-id,并分别评估他们的性能。粗体字体表示最佳结果。大部分的实验结果将以这种形式呈现。
Proposed Sequential End-to-end Network
我们的模型的概述如图3(b)。所示它由两个头网络组成,分别解决人检测和reid问题。首先使用faster R-CNN头来生成精确bboxes。然后未经修改的基线头用于进一步微调这些bboxes,并提取它们有鉴别性的特征。
主要的想法是利用faster-R-CNN作为一个更强的RPN来提供更少但更准确的候选盒子。这些高质量的bboxes导致了更有区别的嵌入。
Training
在训练阶段,两个头都用阈值0.5进行训练,以区分正样本和负样本,特征学习受以下5个损失的监督。
Lreg1/Lreg2:第一/第二头的回归损失。Np为阳性样本数,ri为第i个阳性样本的计算回归,三角形i为相应的ground truth回归,Lloc为smooth-l1损失。

Lcls1:第一个头的分类损失。N为样本数,pi为第i个样本的预测分类概率,ci为ground truth标签。

Lcls2,Lreid:第二个头的分类和re-id损失。它由NAE计算。f是提取出的256维的特征。

整体学习目标函数为:

λ1设置为10,其他的为1。

图3:(a)。基线(b)。我们的Sequential End-to-end网络,其中黄色部分是修改,NMS只应用于test阶段。RoI-Align之前的结构与基线相同,所以这里没有显示它来简化。

图4:测试阶段第一头部检测到的标记行人箱的IoU统计数据。
Inference
在推理阶段,应用NMS在re-ID阶段之前删除冗余的盒子。这样,推理速度将大大加快。
First Classifification Score (FCS)
从图4可以看出,在测试阶段检测到大量IoU>0.8的盒。第二个头部用0.5的阈值进行训练,因此可能无法正确分类这些高iou值样本。因此,我们以第一个头部预测的更可靠的分类分数作为输出。
Discussion
我们的SeqNet与之前的工作具有相似的结构(Gidaris2015,2016;蔡和瓦斯康塞洛斯2018),但我们的方法在以下几个方面有很大的不同:
动机:为了获得更好的检测性能,提出了previous多阶段faster-R-CNN算法。然而,我们的方法旨在通过联合优化的网络顺序求解检测和re-id,以提取更多的鉴别特征。
效率:我们的SeqNet拥有一个额外的NMS,这确保了在测试阶段的效率。相比之下,它们其他人的每个网络头都需要处理所有的bboxes。
Context Bipartite Graph Matching
在本节中,我们提出了一种新颖的上下文二部图匹配(CBGM)算法,用于测试阶段将上下文信息集成到匹配过程中。
传统的行人搜索任务可以看作是一种单点匹配策略,它以与图库图像中的查询者最相似的人作为搜索结果。但当整体图像中有许多人有非常相似的形象时,它可能会失败。我们将其扩展到一个多点匹配策略,它将查询者及其周围的人与整个图像中所有检测到的行人进行匹配。这样,当单点匹配策略失败时,只要周围的人能够正确匹配,就仍然可以识别出查询人。
以图2为例,我们定义了以下符号。

在图论中,无向图中匹配的M=(V,E)是一组没有共同顶点的边。V是顶点的集合,E是边的集合。我们进一步定义了以下概念。


然后利用Kuhn-Munkres(K-M)算法(Kuhn1955;Munkres1957)找到具有最大权重(M)的最优匹配。在图2中,匹配值为(a)↔©,(b)↔(d),查询人(a)可以与地面truth©。正确匹配。
算法1中描述了所提出的上下文二部图匹配(CBGM)算法。我们按SIM(q,G)对所有图库图像进行降序排序,并保留top-k1需要被处理。通过这种方式,可以删除q没有出现的大多数图库图像。此外,过多的上下文信息可能会带来噪音。因此,我们只将查询图像中具有top-k2检测置信度的人作为上下文信息。在找到最优匹配M后,取C(M)作为q与其匹配的人之间的相似性。

Experiments
在本节中,我们首先将介绍数据集和评估协议。然后,我们描述了实施细节,然后通过消融实验对每个组成的有效性进行研究。最后,我们将我们的方法与最先进的方法进行了比较。
Datasets and Evaluation Protocol
CUHK-SYSU
CUHK-SYSU(Xiao等人。2017)是一个大规模的个人搜索数据集,包含18184张场景图像和96143个注释的盒子,从两个来源收集:街头抓拍和电影。所有人都被分为8432个标签身份和其他未知身份。该训练集包含11206张图像和5532个不同的身份。该测试集包含6978张图像和2900名查询人员。训练集和测试集在图像和查询人员上没有重叠。对于每个查询,都预先定义了从50到4000的不同图库大小来评估搜索性能。如果不指定,则默认使用图库大小为100。
PRW
PRW是另一个广泛使用的数据集(Zheng等。包含清华大学6台摄像机拍摄的11,816个视频帧。34,304个盒子被手动注释。与CUHK-SYSU类似,所有人都被分为有标记身份和未标记身份。训练集包含5704张图像和482个不同的人,而测试集包含6112张图像和2057名查询人。对于每个查询,图库是整个测试集,即图库大小为6112。
Evaluation Protocol
遵循之前工作中的设置(Munjal等。2019年;陈等人。采用累积匹配特征(CMC)和平均平均精度(mAP)作为性能指标。形式被广泛应用于行人重新识别,后者受到对象检测任务的启发。这两个指标越高,性能就越好。
Implementation Details
我们用PyTorch实现了我们的模型(Paszke等人。并在tesla v100上进行所有的实验。我们采用ResNet50(He等人。在ImageNet上进行了预先训练(Deng等人。作为骨干网络。在训练期间,批大小为5,每张图像大小调整到900×1500像素。我们的模型通过随机梯度下降(SGD)对20个epochs(PRW为18个epochs)进行优化,初始学习率为0.003,在第一个阶段升温,在第16阶段减少了10%。SGD的动量和重量衰减分别设置为0.9和5×10−4。对于CUHK-SYSU/PRW,OIM的循环队列大小设置为5000/500。在测试时,使用具有0.4/0.5阈值的NMS去除第一/第二头检测到的冗余框。
Ablation Study
在本节中,我们对CUHK-SYSU进行了几个分析实验,以更好地理解我们所提出的方法。

表2:在CUHK-SYSU上使用不同检测器和重新标识符的分析实验结果。
Different detectors and re-identififiers
我们首先探讨了SeqNet所带来的提升是否来自更好的检测还是更有区别的特征。我们将人员搜索任务分为两个阶段:具有不同检测器的检测阶段和具有不同重标识符的reid阶段。当使用NAE重新标识符时,我们删除其RPN模块,并手动将建议设置为由指定检测器检测到的盒子(例如SeqNet)。特别是,NAE检测器+NAE重标识符等价于上一节中提到的序列化。结果汇总见表2,从中我们可以得出以下结论:
SeqNet的检测效果更好,从第二列我们可以看出,SeqNet(Recall:92.1,AP:89.2)总体上比NAE(Recall:92.6,AP:86.6)的检测效果更好。这主要是因为SeqNet的每个头部(RPN头/更快的R-CNN头/基线头)都会回归到bbox,这使得我们的模型对假阳性更有选择性。
SeqNet对重新id更具鉴别性,当使用NAE检测器时,SeqNet的mAP和rank-1精度分别比NAE高0.6%和0.3%。当使用SeqNet检测器时,也可以观察到类似的改进(mAP↑0.5%,前1位↑0.7%)。这说明我们的SeqNet可以以相同的检测能力提取更多的鉴别特征。这是由于NAE的不一致造成的,即通过低质量的提案进行训练,但通过高质量的bboxes进行测试。相比之下,SeqNet的基线头是用检测到的bboxes进行训练的,这使它更适合测试场景。
检测不是性能上的瓶颈,如果采用 ground truth BBoxes作为检测结果,NAE的mAP可以提高2.4%,而SeqNet只能提高0.8%。这表明SeqNet从更好的检测中得到的收益很少,未来的研究应该集中在如何实现更好的re-id上。
FCS and NMS
SeqNet有两个关键组成部分:FCS提高分类能力,NMS加速推理速度。表3的上块显示,FCS大大提高了检测效果(召回率:91.5→92.7,AP:86.7→89.7),得到了更好的重新识别效果(mAP:93.1→93.8,前1:94.0→94.5)。此外,尽管NMS略微降低了检测性能(召回:92.7→92.7→92.1,AP:89.7→89.2),但它不影响re-ID,并将FPS(每秒处理帧)从7.4增加到11.5。
The multi-task framework of baseline head
表3的下部分报告了对于基线头的每个任务的影响。由于faster R-CNN头的检测足够强,基线头的回归和分类分支对整体检测影响不大,但有助于re-ID分支学习更多的鉴别特征。我们可以观察到,无论是回归还是分类分支都不能单独获得最好的性能,这表明两者是互补的。

表3:不同部件对精度和速度的影响。关于FCS和NMS的消融研究位于上半部分。在下面的区域中讨论了基线头的多任务框架。
Different k1 and k2 of CBGM
我们评估了CBGM中不同的k1和k2的性能。图4显示了CBGM对这两个参数具有鲁棒性。在cuhksysu上,k1/k2=10/3获得了最佳的性能,而在PRW上,k1/k2=30/4是最佳的选择。这是因为PRW(6112)的总体图像大小比CUHK-SYSU(100)要大得多。因此,k1和k2需要更大,才能捕获更多的上下文信息以进行精确搜索。

表4:在CBGM的k1和k2不同的CUHK-SYSU(上块)和PRW(下块)数据集上的性能。我们通过mAP+top−1/2 来评估性能。
Effificiency of CBGM
表5报告了在不同图库大小下搜索查询人员的平均时间。对于CUHK-SYSU数据集,按SIM(q、G)对所有库图像进行降序排序后,应用CBGM处理前10个库图像。表5显示,CBGM带来的额外计算是固定的(约2ms)和轻的。图库大小越大,CBGM对速度的影响就越小。

表5:在CUHK-SYSU上搜索不同图库大小下的查询人员的平均时间。该单位为毫秒。
Integrated into another method
为了验证我们的方法的普遍性,我们将SeqNet集成到现有的端到端框架中。我们选择了被广泛研究的OIM(肖等人。作为基础网络,及其实现与在(Chen等。2020b)。如表6所示,SeqNet在CUHK-SYSU和PRW基准上将OIM的mAP分别提高了6.3%和11.8%,这表明我们的方法对基础网络不敏感。特别是,OIM+SeqNet+CBGM进一步实现了94.3的mAP和95.0的前1位精度,优于所有其他竞争对手。这表明了我们的方法具有巨大的潜力。

表6:mAP与CUHK-SYSU和PRW上最先进方法的mAP和前1位精度的比较。我们的模型用斜体表示。
Comparison with the State-of-the-art Methods
在本节中,我们将我们的方法与CUHK-SYSU和PRW上的最新模型进行了比较。
CUHK-SYSU
表6显示,我们的方法的mAP和前1名的精度都高于其他竞争对手。与最先进的两阶段模型TCTS相比,我们的NAE+SeqNet+CBGM的性能分别超过它0.9%、0.6%在map和top1精度上,尽管它采用了更多的技巧,如标签平滑、随机擦除(Zhong等。2020年)和triplet损失(赫尔曼斯、拜尔和莱贝,2017年)。这证明了联合求解检测和重新识别的有效性,可以避免次优求解。
我们还在不同图像库大小下比较了这些方法。从图5中可以看出,所有算法的mAP都随着图库大小的增加而单调减小,这表明了在较大的搜索范围内定位目标人的困难。我们可以观察到,我们的方法仍然在所有的画廊大小上排名最好。

图5:不同图库大小下的mAP。虚线表示两阶段的方法,实线表示端到端的方法。
PRW
表6的右列总结了PRW数据集的结果。我们的NAE+SeqNet+CBGM仍然超过了其他算法。PRW的训练数据比CUHK-SYSU少,这表明我们的方法对于相对较小的数据集具有鲁棒性和有效的性能。
Runtime Comparison
我们比较了不同模型的速度,并显示了每个GPU的浮点操作第二秒(TFLOPs)进行公平比较。我们的SeqNet是在PyTorch中实现的,图像的大小被调整到900×1500像素,这与MGTS和QEEPS相同。从表7中可以看出,我们的方法比QEEPS和MGTS快2倍左右。最后,我们的SeqNet在V100GPU上每帧花费86毫秒,只比NAE慢一点。快速的速度揭示了SeqNet在现实世界应用中的巨大潜力。

表7:在不同gpu上的运行时间的比较。该单位为毫秒。
Conclusion
在本文中,我们注意到以前的端到端框架的性能受到劣质特性的限制。为了解决这个问题,我们提出了一个顺序端到端网络来依次解决检测和重新识别的问题。此外,我们还设计了一种上下文二部图匹配算法,利用上下文信息作为对单个特征的补充。大量的实验表明,我们的方法可以在可接受的时间成本内显著提高以前的端到端模型的性能。

一些个人的不懂之处:
详细可以看甲哥知乎,我收藏了一下:
https://www.zhihu.com/people/zhang-qi-xian-31




论文阅读:AAAI 2021 SeqNet 行人搜索 SOTA论文相关推荐

  1. 16篇论文入选AAAI 2021,京东数科AI都在关注什么?(附论文下载)

    近日,国际人工智能领域顶级学术会议AAAI2021(第35届AAAI)论文收录结果出炉.在国内AI阵营前列的京东数科以高达16篇论文的入选量成为本届AAAI的一大黑马.其研究方向包含了联邦学习.对抗学 ...

  2. [论文阅读] (26) 基于Excel可视化分析的论文实验图表绘制总结——以电影市场为例

    <娜璋带你读论文>系列主要是督促自己阅读优秀论文及听取学术讲座,并分享给大家,希望您喜欢.由于作者的英文水平和学术能力不高,需要不断提升,所以还请大家批评指正,非常欢迎大家给我留言评论,学 ...

  3. 【多目标跟踪论文阅读笔记——2021年CVPR论文粗读记录】

    [阅读心得] 多目标跟踪经典论文--2021CVPR论文粗读记录 前言 一.学习策略类 QDTrack 二.Temporal-Spatial 类 TADAM Alpha-Refine TraDes C ...

  4. 论文笔记 AAAI 2021|what the role is vs. What plays the role: Semi-supervised Event Argument Extraction v

    文章目录 1 简介 1.1 动机 1.2 创新 2 方法 3 半监督双重训练策略 4 实验 1 简介 论文题目:What the role is vs. What plays the role: Se ...

  5. 【论文阅读】(2023.05.10-2023.06.03)论文阅读简单记录和汇总

    (2023.05.10-2023.06.08)论文阅读简单记录和汇总 2023/05/10:今天状态,复阳大残,下午淋了点雨吹了点风,直接躺了四个小时还是头晕- -应该是阳了没跑了. 2023/06/ ...

  6. 【论文阅读】吴恩达分享的论文阅读方法

    Reading research papers 整合这个领域内比较有代表性的论文(不仅仅是论文,也可以是分享出来的blog) 绘制一个资源表格,标记出自己阅读的进度,在阅读一篇论文的过程中如果发现这篇 ...

  7. 行人重识别论文阅读(2021.7.3-7.11)

    一 各种方法性能比较 Method Key Market  r1 Market mAP Duke r1 Duke mAP (1)BOT global+BNNeck 94.5 84.5 86.4 76. ...

  8. 【论文阅读】2021中国法研杯司法考试数据集研究(CAIL2021)

    英文标题:JEC-QA: A Legal-Domain Question Answering Dataset 中文标题:法律领域问答数据集 论文下载:arxiv@1911.12011 项目地址:Git ...

  9. 【论文阅读 - AAAI 2020】Order Matters:Semantic-Aware Neural Networks for Binary Code Similarity Detection

    Order Matters: Semantic-Aware Neural Networks for Binary Code Similarity Detection Authors: Zeping Y ...

最新文章

  1. 基于shiro的权限设计
  2. percona mysql安装_mysql 安装 (percona)
  3. python画代码-Python教程_Python画Mandelbrot集 代码
  4. mysql variables_通过什么命令能够改变mysql的variables的变量里的值?
  5. LFS-Git命令行向Github上传大文件
  6. poj3320 尺取法 挑战程序设计竞赛
  7. springboot thymeleaf模板使用
  8. 扩展 MongoDB.Driver 支持实体
  9. BGP线路机柜值得你考虑的几点因素-新乡BGP机柜
  10. mql 查询多结果_MQL入门到精通EA教程第六课MQL语言基础(五)
  11. AD模式下出现NetLogon 5781错误的对策
  12. 十天学会单片机Day4串行口通信
  13. 浏览器无法下载PDF文件怎么办
  14. Qt制作局域网即时通讯软件
  15. 地学计算方法/地统计学(第二章地理数据及其采集与预处理)
  16. 【数字信号处理】数字信号处理简介 ( 数字信号处理技术 | 傅里叶变换 )
  17. 谷歌浏览器清除dns缓存
  18. C语言 | C语言深度解剖 ——章节2 符号
  19. 数据结构与算法 — 约瑟夫问题(Josephu)
  20. memcached 源码分析

热门文章

  1. 分析非结构化数据和非结构化处理
  2. log4j2 支持彩色日志
  3. OpenCV处理视频的常用函数
  4. 东风畅行java_东风畅行召开2019年总结表彰大会暨2020年工作会
  5. Pycharm 小技巧 —— 列选择模式
  6. Ansible总结-基础部分(ansible-doc与常用模块)
  7. 莱特昂-布兰朵的诗-《不正常人类症候群》
  8. 为什么我建议大家将原创文章分发到多个平台?
  9. 设置鼠标形状——qml QtWidgets
  10. perfect-scrollbar 一个全浏览器适用的自定义scrollbar,使用方法 中文文档