ロジスティック回帰
ロジスティック回帰(Logistic regression)とは統計的回帰モデルの一種であり、機械学習のアルゴリズムの一つです。
ロジスティック回帰の手法はよくデータ分析と予測に活用しています。
- ~目次~
- 1.ロジスティック回帰とは
- 2.メリットとデメリット
- 3.ロジスティック回帰の活用例
1.ロジスティック回帰とは
ロジスティック回帰は線形回帰(generalized linear model)に所属することで、よく知られている多重線形回帰にもよく似ています。
数式はほぼ同じですが、被説明変数が二つであることはロジスティック回帰の特徴でもあります。
被説明変数が二つであることとは、「はい」と「いいえ」この二つのイメージです。
例えばデータ分析のところで、「お客様が商品を購入した」と「お客様が商品を購入しなかった」の二つの結果に対して、それぞれの影響因子を分析する際に、お客様は商品を購入することに対して、何か重要なのかを分析できます。
あるいは予測の際に、複数の要因データがあり、その要因(例えば年齢層、年収など)から最終的にお客様の購入結果を決定することで、最終的にお客様が購買行動をするかどうかを予測できるようになります。
2.メリットとデメリット
- メリット:
- 1.ダミー変数(0または1)に対する分析と予測は可能となります。
- 2.ダミー変数に対して、0また1になった原因(説明変数)の把握が可能になります。
- デメリット:
- 1.被説明変数は二つ以上の場合は他の分析方法をおすすめします。
3.ロジスティック回帰の活用例
先程述べたようにビジネスでの運用以外にも、病気に関しての分析もできます。
例えば今ある病気の患者のデータが揃えているとするとしたら、今病気かかっている人とかかっていない人に対して、それぞれの生活習慣や健診データなどに従って、病気にかかりやすい人の傾向性が出せます。
またこの傾向性の結果を運用して、ある人の生活習慣と健診データに従って、この人は病気にかかるかどうかが予測できるようになります。前に例を挙げた以外の分野でも運用されています。
ロジスティック回帰分析に最適なのはTrueあるいはFalseを分析と予測で、被説明変数が多い場合は例えば多重線形回帰などのモデルにも活用できます。
▼レポート無料ダウンロード お申し込みはこちら▼