画像分析
前々から気になってたGrad-CAMを実装してみました。実装に当たって以下を参考としてます。 EfficientNet-Keras-GradCam-Visualization/inference_example.ipynb at master · lvisdd/EfficientNet-Keras-GradCam-Visualization · GitHub上記は訓練済みのEffic…
ImageDataGeneratorを使って画像拡張を色々試してみます。使う画像は実家のワンコ(小次郎君)の写真です。 1.画像の水増し ① 回転(rotation_range) ② 横にずらす(width_shift_range) ③ 縦にずらす(height_shift_range) ④ 明るさを変える(brightnes…
tensorflow.kerasの画像拡張用モジュールImageDataGeneratorを使ってデータ拡張する際に、featurewise系のオプションの使用方法で躓いていたのですが、解決策が分かったのでまとめます。結論は至極シンプルで、しかも公式ドキュメントにちゃんと書かれている…
本記事では以下についてまとめます。 TensorFlowとPytorchにおける画像のデータ構造の違いについて解説 データ構造の相互に変換する方法について解説 1.TensorFlowとPytorchの画像のデータ構造の違い 1.1.概要 1.2.具体例を使ってデータ構造の違い…
2019年にGoogle Brainから発表された画像認識モデルBiT(Big Transfer)をファインチューニングする方法についてまとめます。BiTにかかわる解説は以下が良くまとまっていました。 パラメータ数10億!最新の巨大画像認識モデル「BiT」爆誕 & 解説 - Qiita簡単…
ViT(Vision Transformer)を使用して学習したモデルをロードしようとしたところ、(ValueError: Unknown layer: ClassToken)というエラーが出ました。本記事ではこのエラーに対する対処方法についてまとめました。
ViT(Vision Transformer)とEfficientnetをCIFAR-10で試してみて、分類精度や処理速度の違い等を比較しました。
EfficientNetの概要を紹介するとともに、TensorflowによるEfficientNetの実装方法についてまとめました。qubvel/efficientnet(tfkeras)を使用しています。
CNNに取って代わると言われている画像分析手法、ViT(Vision Transformer)の実装方法についてまとめました。vit-kerasを使用しています。また、ViTモデルの種類等もまとめました。