よっしーの私的空間

機械学習を中心に興味のあることについて更新します

画像分析

Tensorflow-EfficientnetでGradCAMを実装してみた

前々から気になってたGrad-CAMを実装してみました。実装に当たって以下を参考としてます。 EfficientNet-Keras-GradCam-Visualization/inference_example.ipynb at master · lvisdd/EfficientNet-Keras-GradCam-Visualization · GitHub上記は訓練済みのEffic…

ImageDataGeneratorでデータ拡張してみた

ImageDataGeneratorを使って画像拡張を色々試してみます。使う画像は実家のワンコ(小次郎君)の写真です。 1.画像の水増し ① 回転(rotation_range) ② 横にずらす(width_shift_range) ③ 縦にずらす(height_shift_range) ④ 明るさを変える(brightnes…

ImageDataGeneratorにおいてfeaturewise系のオプションがうまく機能しない問題

tensorflow.kerasの画像拡張用モジュールImageDataGeneratorを使ってデータ拡張する際に、featurewise系のオプションの使用方法で躓いていたのですが、解決策が分かったのでまとめます。結論は至極シンプルで、しかも公式ドキュメントにちゃんと書かれている…

TensorFlowとPytorchにおける画像のデータ構造の違いと変換方法について

本記事では以下についてまとめます。 TensorFlowとPytorchにおける画像のデータ構造の違いについて解説 データ構造の相互に変換する方法について解説 1.TensorFlowとPytorchの画像のデータ構造の違い 1.1.概要 1.2.具体例を使ってデータ構造の違い…

TensorflowによるBiT(Big Transfer)の実装

2019年にGoogle Brainから発表された画像認識モデルBiT(Big Transfer)をファインチューニングする方法についてまとめます。BiTにかかわる解説は以下が良くまとまっていました。 パラメータ数10億!最新の巨大画像認識モデル「BiT」爆誕 & 解説 - Qiita簡単…

ViTモデルロード時のエラー(ValueError: Unknown layer: ClassToken)について

ViT(Vision Transformer)を使用して学習したモデルをロードしようとしたところ、(ValueError: Unknown layer: ClassToken)というエラーが出ました。本記事ではこのエラーに対する対処方法についてまとめました。

ViTとEfficientnetをCIFAR-10で試してみた

ViT(Vision Transformer)とEfficientnetをCIFAR-10で試してみて、分類精度や処理速度の違い等を比較しました。

TensorflowによるEfficientNetの実装

EfficientNetの概要を紹介するとともに、TensorflowによるEfficientNetの実装方法についてまとめました。qubvel/efficientnet(tfkeras)を使用しています。

TensorflowによるViT(Vision Transformer)の実装

CNNに取って代わると言われている画像分析手法、ViT(Vision Transformer)の実装方法についてまとめました。vit-kerasを使用しています。また、ViTモデルの種類等もまとめました。