Pythonのf-stringsを使ったPandas.DataFrameの列名の動的設定

前処理

変数を使用してPandas.DataFrameの列名を動的に設定する方法についてまとめます。 Pythonにはフォーマット済み文字列リテラル（f-strings）という記法が存在するのですが、今回はそれを使用します。１．フォーマット済み文字列リテラル（f-strings）とは文…

#pandas #動的変数名 #python #f-string

2023-11-14

pandasでデータ抽出する際の速度の比較（loc対query）

前処理

Pandas Dataframeに対して、locで抽出した方が良いのか、queryで抽出した方が良いのか。可読性はqueryの方が良さそうですが、今回は性能面で比較してみようと思います。 1．データダウンロードデータはsklearnの「カリフォルニア住宅価格」を使用しました…

#python #pandas #データ抽出

2023-10-29

foliumを使ってハザードマップを重ねる

folium

１．概要 Pythonの地図ライブラリ「folium」を使ってハザードマップを重ね合わせたいと思います。ハザードマップは国土交通省国土地理院が公開しているのですが、APIも公開しているので、色々自分でカスタマイズすることもできます。ハザードマップAPIにつ…

#python #folium #地図

2023-07-11

Pythonで株価データや金融データを取得する方法（pandas_datareader）

株価予測

pandas-datareaderというpythonライブラリを使用して株価データや金融データを取得する方法についてまとめます。pandas-datareaderとはウェブ上の様々なデータソースにアクセスするライブラリです。今回は以下にアクセスします。アクセス先概要 Stooq ポー…

#pandas_datareader #株価取得 #python #経済統計取得

2023-07-08

Seleniumエラー：Element is not clickable at point (xxx, xxx)について

スクレイピング

Selenium使用時に「Element is not clickable at point (xxx, xxx)」というエラーが出て色々調べたので、その内容についてまとめます。１．結論２．事象再現３．解決方法４．ソース一式１．結論最初に結論だけ述べると、、エラー原因：画面外のelemen…

#selenium #エラー #element is not clickable

2023-06-09

タスクスケジューラで陥りやすいトラブル集

タスクスケジューラ

タスクスケジューラ関連で個人的に躓いたポイントとその解決策についてまとめておきたいと思います。１．予定時刻になってもタスクが実行されない問題 ① 事象以下のように繰り返し実行のタスクを作成するが、予定時刻になってもタスクが実行されないという…

#タスクスケジューラ

2023-06-02

競馬データのスクレイピング

競馬スクレイピング

netkeibaから競馬データをスクレイピングする方法についてまとめます。既に同様の記事は世にたくさん出回ってますが、少し改良して効率化してみました。１．既出のスクレイピング方法の問題点２．どうやって効率化するか２．１．開催レース一覧ページから…

#競馬 #スクレイピング #競馬データ

2023-05-04

SHAPを使用した回帰問題の機械学習モデルの局所解釈方法

XAI 機械学習

shapライブラリを使用して、回帰問題を解いた機械学習モデルの大局的解釈を行う。１．SHAPとは SHAP（SHapley Additive exPlanations）は、機械学習モデルの局所的な解釈可能性を提供するためのフレームワークです。SHAPは、個々の特徴量が予測にどのように…

2023-05-02

PDP／ICEを使用した回帰問題の機械学習モデルの大局的解釈方法

機械学習 XAI pdpbox

pdpboxライブラリを使用して、回帰問題を解いた機械学習モデルの大局的解釈を行う。１．データセット今回はsklearnのボストン住宅価格データセットを例に実装してみる。データセットの概要は以下の通り。目的変数：ボストンの地域別住宅価格説明変数：以…

2023-05-01

Pandasでグループ毎に過去データを集約する方法

前処理

PythonのPandasを用いて、任意のカラム毎にグルーピングして、過去データを集約する方法についてまとめます。調べても意外と情報が少なくて苦戦しました。見つけても、複数カラムでグルーピングできなかったり、自信のデータを除外できなかったりと。これら…

2022-03-01

競馬のレーティングをしてみた（Elo Rating）

競馬レーティング

前回はGlicko2 Rating Systemを使用してレーティングを行いましたが、今回はElo Ratingを使用してみました。今回は競走馬だけではなくジョッキーやトレイナーについてもレーティングを行っています。Elo Ratingは通常チェス等の1対1の対戦において使用される…

#複数人対戦 #イロレーティング #競馬

2022-02-26

競走馬をレーティングしてみた（Glicko2 Rating System）

競馬レーティング

競走馬の強さを評価するために競走馬のレーティングをしてみました。レーティングはGlicko2 Rating Systemというのを使用してみました。Glicko2の概要やPythonでの実装方法については以下の記事にまとめたので、良ければ見てください。 book-read-yoshi.hate…

#競馬 #レーティング

2022-02-13

多人数対戦におけるレーティング方法（glicko2 rating systemを用いて）

レーティング競馬

競走馬の強さをレーティングをしたくて、レーティングシステムについて調べたところ、glicko-2 rating systemというのが良さそうでした。本記事ではこれの直感的な理解やPythonによる実装方法についてまとめます。Glicko-2 rating systemの計算式について知…

#競馬 #glicko2 #rating #レーティング #複数人レーティング

2021-09-23

Tensorflow-EfficientnetでGradCAMを実装してみた

EfficientNet 機械学習画像分析 Grad-CAM

前々から気になってたGrad-CAMを実装してみました。実装に当たって以下を参考としてます。 EfficientNet-Keras-GradCam-Visualization/inference_example.ipynb at master · lvisdd/EfficientNet-Keras-GradCam-Visualization · GitHub上記は訓練済みのEffic…

#Grad-CAM #tensorflow #efficientnet #画像分類

2021-09-17

ImageDataGeneratorでデータ拡張してみた

前処理機械学習画像分析 ImageDataGenerator

ImageDataGeneratorを使って画像拡張を色々試してみます。使う画像は実家のワンコ（小次郎君）の写真です。１．画像の水増し ① 回転（rotation_range） ② 横にずらす（width_shift_range） ③ 縦にずらす（height_shift_range） ④ 明るさを変える（brightnes…