0%

Action Spotting Experiments 行为检测实验

最近在做本科的毕业设计,题目是足球视频中的行为关键帧检测算法设计。在实验过程中,发现有很多细小的想法,但有时一晃而过,可能是一些小的尝试,但很少会做对比试验,因此将这些想法记录下来,方便之后再做改进。

对比试验一:判断skip connection在TMM中是否有用

modify3_10 vs modify3_11: 在baseline的基础上加入TMM结构(12 3, 27 3, 40 3, 80 3)

  1. modify3_10:两个TMB都有跳连操作
  2. modify3_11:两个TMB都没有跳连操作

对比试验二:TAM模块的作用

目前全部加TAM的效果最好

实验 设置 screen nvidia 参数量(万) s/epoch ave-mAP on V ave-mAP on T
modify4_1 全部卷积后面都加入TAM 1 0 32 43 55.97 54.74
modify4_2 只在TMM中加入TAM 2 1 27 36 57.92 54.11
modify4_3 只在分类网络内加入TAM 3 2 15 32 55.96 53.52
modify4_4 所有卷积后都不加TAM 4 3 15 32 57.05 54.98

对比实验三:Model3_5基础上修改

实验 设置 screen nvidia 参数量(万) s/epoch ave-mAP on V ave-mAP on T
model3_5 无TAM结构,TMM:(33,53,73) 60.44 59.37
model3_12 TMM中加入TAM结构 5 4 32 34 57.83 56.32
model3_13 无TAM结构,TMM(33, 53, 73, 93) 1 0 26 36 58.48
model3_14 无TAM结构,TMM(33, 55, 77, 99) 2 1 59.97

对比实验四:baseline基础上实验TAM

序号 实验 设置 epoch screen nvidia 参数量(万) s/epoch ave-mAP on V ave-mAP on T
0 modify5_0 Baseline 600 8 7 33 16 64.85 61.15
1 model5_1 只在conv1后加入 600 3 2 35 16 65.55 62.49
2 model5_2 只在conv2后加入 600 4 3 35 16 61.52 60.94
3 model5_3 只在conv3_后加入 600 5 4 39 20 64.30 62.95
4 model5_4 在conv1&2后加入 600 6 5 36 17 63.70 61.24
5 model5_5 在conv1&2&3都加入 600 7 6 42 19 64.61 61.45
6 5_6 同5_1 1000 3 2 35 16 63.28 62.20
7 5_7 5_2 1000 4 3 63.97 62.48
8 5_8 5_3 1000 5 4 65.04 61.94
9 5_9 5_4 1000 6 5 65.09 62.14
10 5_10 5_5 1000 7 6 61.03
13 5_11 5_0 1000 8 7 64.42 62.39
14 5_12 5_3 加入BN 600 1 1

对比试验五:在baseline的基础上实验TMM

序号 实验 设置 epoch screen nvidia 参数量(万) s/epoch ave-mAP on V ave-mAP on T
1 6_1 baseline TMM(33, 53, 73) 600 2 2
2 6_2 36+TMM(53, 73, 93)+add 600 3 3
5 6_5 36+TMM(33, 93, 27 3)+add 600 6 6
6 6_6 36+TMM(73, 14 3, 21 3)+add 600 7 7
3 6_3 36+TMM(33, 73, 11 3)+add 600 4 4
4 6_4 36+TMM(53, 10 3, 15 3)+add 600 5 5
欲戴皇冠,必承其重,加油!