网站的首页设计,坪山网站建设信息,win8风格网站模板,网站空间一般多大fastReID论文总结 fastReIDReID所面临的挑战提出的背景概念#xff1a;所谓ReID就是从视频中找出感兴趣的物体#xff08;人脸、人体、车辆等#xff09;应用场景#xff1a;存在的问题#xff1a;当前的很多ReID任务可复用性差#xff0c;无法快速落地使用解决方式… fastReID论文总结 fastReIDReID所面临的挑战提出的背景概念所谓ReID就是从视频中找出感兴趣的物体人脸、人体、车辆等应用场景存在的问题当前的很多ReID任务可复用性差无法快速落地使用解决方式发布了FastReID,可复用和快速落地 fastReID的亮点fastReID的成就训练策略learning rate warm-upBackbone Freezing 测试排序方法QEK-reciprocal 验证CMCmAPROCmINP fastReID
ReID所面临的挑战
摄像头位置的不同导致角度不一照片像素和色彩存在差异行人姿态不一检测框质量不一存在遮挡和不对齐
提出的背景
概念所谓ReID就是从视频中找出感兴趣的物体人脸、人体、车辆等
应用场景
搜索电视中演员的镜头从视频监控中寻找走失的孩子、嫌疑犯商品追踪、保护野生动物
存在的问题当前的很多ReID任务可复用性差无法快速落地使用
解决方式发布了FastReID,可复用和快速落地
fastReID的亮点
模块化和可扩展设计方便研究人员快速地将新设计的模块插入到系统的任意部分而且能够帮助研究员和工程师快速地实验新的想法。配置化可统一配置模型结构、模型训练、模型评价、模型部署到YAML文件中。可自定义模型结构的主干网络、训练测试、损失函数等。评估体系丰富ROC、mINP工程部署提供知识蒸馏来获取轻量级模型同时提供了不同框架的模型转换工具。提供了最先进的预训练模型提供多个任务包括行人重识别、遮挡/部分行人重识别、跨域行人重识别和车辆行人重识别的模型和配置。
fastReID的成就
- 图像预处理调整到同一个尺寸128,256翻转随机擦除自动增强自动搜索图像增强的最佳策略
- backbone使用了3种主干网络ResNet,ResNeXt,ResNetSt,并且加入了注意力机制和IBN
- 聚合层使用了四种池化方式最大池化、平均池化、GeM池化、注意力池化
- head三种head BN head、linear head、Reduction head降低维度
- Loss: CEloss、Arcface、Circle loss、Triplet loss训练策略
learning rate warm-up 使用较小学习率训练几个epoch因为模型初始的权重是随机的直接训练会导致震荡和不稳定 改进为了避免从较小学习率到大学习率引起的误差让学习率随着每个step增大之道和预设的一致。 Backbone Freezing
即微调
测试 采用了DSR计算距离 把qure分成N个小部分xigallery也分成N个小部分yixi从Y中找到最相似的yi得到匹配分数加上所有匹配分数 排序方法
QE 对前top_k的结果对它们计算特征求和取平均再计算一次查询目的是为了提高召回率 K-reciprocal
验证
CMC top_k的击中概率[top1,top2,top3] mAP 平均精度 ROC 模型能力 mINP
mAP存在缺陷 上图中展示了两个匹配列表其中共10个目标并仅有三个正确结果绿色表示正确的匹配。根据平均查准率(Average Precision, AP)第一个匹配列表的AP为0.77第二个匹配列表的AP为0.7按照的AP的评价标准AP值越大的性能越好因此第二个匹配的性能要优于第一个。 但是第一个列表中虽然在最靠前的两个结果均正确但是直到第十个才找到了第三个结果第二个列表在排序第五的位置就找到了全部的正确结果因此直观来讲第二个匹配的性能应该要优于第一个。 R为最后找到的样本G为找到了多少样本。这个公式的含义就是截止到最后一个正确的结果时已经查出的样本中错误的样本所占的比例因此NP的值越小性能应该越好。当所有的正确结果都在最前面时NP的值应该为0。