最近一段时间都在研究ViT相关的工作,需要多读论文多多总结
OCR实验
在探索网络架构的过程中,需要做很多尝试和思考,同时也需要把实验数据和对于结果的思考等记录下来,从而一点点积累感觉
Transformer实验
在探索网络架构的过程中,需要做很多尝试和思考,同时也需要把实验数据和对于结果的思考等记录下来,从而一点点积累感觉
最近在做本科的毕业设计,题目是足球视频中的行为关键帧检测算法设计。在实验过程中,发现有很多细小的想法,但有时一晃而过,可能是一些小的尝试,但很少会做对比试验,因此将这些想法记录下来,方便之后再做改进。
ViT:视觉Transformer开创者(论文+代码详解)
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale
Alexey Dosovitskiy (Google, Brain Team)
论文地址: ViT, arxiv
Pytorch炼丹
- 最近实习中遇到了很多问题,需要慢慢总结下来,彻底记住