ViT
ViT(Vision Transformer)を使用して学習したモデルをロードしようとしたところ、(ValueError: Unknown layer: ClassToken)というエラーが出ました。本記事ではこのエラーに対する対処方法についてまとめました。
ViT(Vision Transformer)とEfficientnetをCIFAR-10で試してみて、分類精度や処理速度の違い等を比較しました。
CNNに取って代わると言われている画像分析手法、ViT(Vision Transformer)の実装方法についてまとめました。vit-kerasを使用しています。また、ViTモデルの種類等もまとめました。