今回は確率で予測する内容となります。
ロジスティック回帰(Logistic Regression)
ロジスティック回帰(Logistic Regression)は、**分類問題(特に2値分類)**に用いられる統計的手法・機械学習アルゴリズムの一種。
主な目的:
- 確率として解釈可能な出力を得る(例:ある商品を買う確率が 70%)
- 目的変数(Y)が「0 or 1」などの2値を取る場合の予測(例:病気の有無、購買するかしないか)
線形回帰との違い
線形回帰とロジスティック回帰はどちらも説明変数(特徴量)を使って目的変数を予測するが、以下の違いがある:

ロジスティック回帰の数式

オッズ(Odds)と対数オッズ(Log-Odds)
ロジスティック回帰では、「オッズ」と「対数オッズ(log odds)」を使ってモデルを解釈する。

ロジスティック回帰の解釈

ロジスティック回帰の評価
ロジスティック回帰モデルの性能を評価するためには、以下の指標を使用する。
指標 | 説明 |
---|---|
正答率(Accuracy) | 正しく分類できた割合 |
対数尤度(Log-Likelihood) | モデルの適合度を表す(大きいほど良い) |
ROC曲線 / AUC | 分類の性能を可視化 |
F1スコア | Precision(適合率)と Recall(再現率)の調和平 |
ロジスティック回帰の応用例
ロジスティック回帰は、以下のような2値分類問題で広く使われる。

まとめ

演習
問1: ロジスティック回帰の出力はどのように解釈されるか?
A. クラスラベル(0または1)を直接出力する
B. クラスに属する確率を出力する
C. オッズ比をそのまま出力する
D. 入力データの重み付き和を出力する
問2:オッズとは何か?正しい定義を選べ
A. 予測確率そのもの
B. 1 から予測確率を引いたもの
C. 予測確率とその逆数の差
D. 予測確率を(1から予測確率を引いた値)で割ったもの
問3:ロジスティック回帰の目的変数の特徴として正しいものは?
A. 連続値である
B. 多クラス分類のラベル
C. 離散的な2値(0または1)
D. 時系列データ
問4:シグモイド関数を使って次の確率を求めよ。

問5:確率 P(y=1)=0.8のとき、オッズと対数オッズをそれぞれ求めよ。
↓
↓
↓
(解答)


問4

問5

参考資料
・データサイエンス数学ストラテジス