0%

Action Spotting Experiments 行为检测实验

发表于 2021-06-05 更新于 2022-03-18 分类于计算机，计算机视觉阅读次数：
本文字数： 1.4k 阅读时长 ≈ 1 分钟

最近在做本科的毕业设计，题目是足球视频中的行为关键帧检测算法设计。在实验过程中，发现有很多细小的想法，但有时一晃而过，可能是一些小的尝试，但很少会做对比试验，因此将这些想法记录下来，方便之后再做改进。

对比试验一：判断skip connection在TMM中是否有用

modify3_10 vs modify3_11: 在baseline的基础上加入TMM结构（12 3, 27 3, 40 3, 80 3）

modify3_10：两个TMB都有跳连操作
modify3_11：两个TMB都没有跳连操作

对比试验二：TAM模块的作用

目前全部加TAM的效果最好

实验	设置	screen	nvidia	参数量（万）	s/epoch	ave-mAP on V	ave-mAP on T
modify4_1	全部卷积后面都加入TAM	1	0	32	43	55.97	54.74
modify4_2	只在TMM中加入TAM	2	1	27	36	57.92	54.11
modify4_3	只在分类网络内加入TAM	3	2	15	32	55.96	53.52
modify4_4	所有卷积后都不加TAM	4	3	15	32	57.05	54.98

对比实验三：Model3_5基础上修改

实验	设置	screen	nvidia	参数量（万）	s/epoch	ave-mAP on V	ave-mAP on T
model3_5	无TAM结构，TMM：（33，53，73）					60.44	59.37
model3_12	TMM中加入TAM结构	5	4	32	34	57.83	56.32
model3_13	无TAM结构，TMM(33, 53, 73, 93)	1	0	26	36	58.48
model3_14	无TAM结构，TMM(33, 55, 77, 99)	2	1			59.97

对比实验四：baseline基础上实验TAM

序号	实验	设置	epoch	screen	nvidia	参数量（万）	s/epoch	ave-mAP on V	ave-mAP on T
0	modify5_0	Baseline	600	8	7	33	16	64.85	61.15
1	model5_1	只在conv1后加入	600	3	2	35	16	65.55	62.49
2	model5_2	只在conv2后加入	600	4	3	35	16	61.52	60.94
3	model5_3	只在conv3_后加入	600	5	4	39	20	64.30	62.95
4	model5_4	在conv1&2后加入	600	6	5	36	17	63.70	61.24
5	model5_5	在conv1&2&3都加入	600	7	6	42	19	64.61	61.45
6	5_6	同5_1	1000	3	2	35	16	63.28	62.20
7	5_7	5_2	1000	4	3			63.97	62.48
8	5_8	5_3	1000	5	4			65.04	61.94
9	5_9	5_4	1000	6	5			65.09	62.14
10	5_10	5_5	1000	7	6			61.03
13	5_11	5_0	1000	8	7			64.42	62.39
14	5_12	5_3 加入BN	600	1	1

对比试验五：在baseline的基础上实验TMM

序号	实验	设置	epoch	screen	nvidia	参数量（万）	s/epoch	ave-mAP on V	ave-mAP on T
1	6_1	baseline TMM(33, 53, 73)	600	2	2	√
2	6_2	36+TMM(53, 73, 93)+add	600	3	3	√


5	6_5	36+TMM(33, 93, 27 3)+add	600	6	6	√
6	6_6	36+TMM(73, 14 3, 21 3)+add	600	7	7

3	6_3	36+TMM(33, 73, 11 3)+add	600	4	4
4	6_4	36+TMM(53, 10 3, 15 3)+add	600	5	5

欲戴皇冠，必承其重，加油！

本文作者： J球星
本文链接： https://weiren1998.github.io/archives/e7d645d1.html
版权声明： 本博客所有文章除特别声明外，均采用 BY-NC-SA 许可协议。转载请注明出处！