- pytorchの勉強
- 論文を読む
ECO: Efficient Convolutional Network for Online Video Understanding
https://arxiv.org/pdf/1804.09066.pdf
2D Netモジュール (Inception-v2) + 3D Netモジュール (3DCNN)
普通の3DCNNよりも少ないデータで学習することができ、計算速度も速い
精度はそれほど下がらない
Kaggleのハンドジェスチャーのデータセットで使えるかどうか試してみる