今回は確率で予測する内容となります。

ロジスティック回帰(Logistic Regression)

ロジスティック回帰(Logistic Regression)は、**分類問題(特に2値分類)**に用いられる統計的手法・機械学習アルゴリズムの一種。
主な目的

  • 確率として解釈可能な出力を得る(例:ある商品を買う確率が 70%)
  • 目的変数(Y)が「0 or 1」などの2値を取る場合の予測(例:病気の有無、購買するかしないか)


線形回帰との違い

線形回帰とロジスティック回帰はどちらも説明変数(特徴量)を使って目的変数を予測するが、以下の違いがある:


ロジスティック回帰の数式



オッズ(Odds)と対数オッズ(Log-Odds)

ロジスティック回帰では、「オッズ」と「対数オッズ(log odds)」を使ってモデルを解釈する。




ロジスティック回帰の解釈



ロジスティック回帰の評価

ロジスティック回帰モデルの性能を評価するためには、以下の指標を使用する。

指標説明
正答率(Accuracy)正しく分類できた割合
対数尤度(Log-Likelihood)モデルの適合度を表す(大きいほど良い)
ROC曲線 / AUC分類の性能を可視化
F1スコアPrecision(適合率)と Recall(再現率)の調和平




ロジスティック回帰の応用例

ロジスティック回帰は、以下のような2値分類問題で広く使われる。





まとめ


演習

問1: ロジスティック回帰の出力はどのように解釈されるか?

A. クラスラベル(0または1)を直接出力する
B. クラスに属する確率を出力する
C. オッズ比をそのまま出力する
D. 入力データの重み付き和を出力する


問2:オッズとは何か?正しい定義を選べ

A. 予測確率そのもの
B. 1 から予測確率を引いたもの
C. 予測確率とその逆数の差
D. 予測確率を(1から予測確率を引いた値)で割ったもの


問3:ロジスティック回帰の目的変数の特徴として正しいものは?

A. 連続値である
B. 多クラス分類のラベル
C. 離散的な2値(0または1)
D. 時系列データ


問4:シグモイド関数を使って次の確率を求めよ。



5:確率 P(y=1)=0.8のとき、オッズと対数オッズをそれぞれ求めよ。






(解答)





問4


問5





参考資料
データサイエンス数学ストラテジス

投稿者 takapi

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA