機械学習の精度
機械学習に取り組むにあたり、精度を気にされるかと思います。
今回は、精度の種類や精度を上げるための方法、そして精度に関する注意点をご紹介します。
- ~目次~
- 1.精度の種類
- 2.予測精度を上げるには
- 3.精度に関する注意点
1.精度の種類
今回は、多数の製品のとある特徴量を正か負で記述するものとします。
機械学習モデルに、一つ一つの製品に対して正か負かを予測させます。
そこで実際の正解データと予測データを見比べる際の指標を3つご紹介します。
- 正解率:すべての予測の中でどれだけ正しい予測ができていたかを示す指標。
- 適合率:正と予測した製品の中で実際にどれだけ正解していたかを示す指標。
- 再現率:実際に正解が正の製品に対し、どれだけ正と予測できたかを示す指標。
2.予測精度を上げるには
予測モデルの精度を改善する方法は以下の通りです。
- 学習用データのデータ数を増やし、製品の正負と製品の他の特徴の関係性をより正確に捉えさせる。
- 欠損値の補填や異常データの除去を行うなどして、学習用データを整備する。
- 新しい説明変数を追加することで精度を向上させる。
これらの手法を用いることで、予測モデルの精度を高めることが可能です。
3.精度に関する注意点
データ数を増やしても、偏ったデータだけを学習に使うと、偏った結果や予測が出てしまいます。
高精度な予測を得るためには、さまざまなデータを豊富に用意して学習させることが重要です。
関連記事:過学習