データドリフト/概念ドリフト
データを学習させて精度を高めていくと広く認識されているAIや機械学習ですが、時代や状況の変化、データの収集の変化など、モデル作成時に予測していなかった変化によって、モデルの精度は大きく上下します。
今回は、ドリフトと呼ばれるモデルの精度の推移について、説明いたします。
- ~目次~
- 1.AIや機械学習におけるドリフトとは
- 2.データドリフト/概念ドリフトとは
- 3.ドリフトとの付き合い方
1.AIや機械学習におけるドリフトとは
学習データから学習させたモデルを運用していく際、その運用によって取得されたデータもモデルへ学習させることが多くあります。
このループを何度も繰り返すことでモデルの精度が向上していくという認識が一般的ですが、データを取り巻く環境が変化していく際にモデルが対応することができずに精度が低下してしまう、劣化してしまうことをドリフトと呼びます。
2.データドリフト/概念ドリフトとは
データドリフトとは、データの変化にモデルが対応しきれずに精度が劣化してしまうことを指します。具体的には、学習時に想定していたデータ分布に対して、運用段階におけるデータ分布が異なる場合が挙げられます。
スマートフォンに関連するモデルを作成するとしたとき、数年前における使用者の割合と近年における使用者の割合は全く異なるため、当時作成したモデルはデータドリフトによって精度が劣化してしまう。というものです。
概念ドリフトとは、当初設定していた予測結果(目的変数)が変化することで、モデル作成時に設定していた入力データ(説明変数)では過不足が発生してしまい、精度が低下してしまうことを指します。具体的には、画像検査において、当初想定していた検査基準に対して、運用時における検査基準が異なることが挙げられます。
3.ドリフトとの付き合い方
ドリフトの現象は、学習時の想定とは異なる環境にモデルがおかれたときに発生します。
AIや機械学習を使っていくなかでドリフトの現象に遭遇しないためには、「今後大きく環境が変わらないと想定される業務」に対してAI活用していくことが必要です。
具体的な例として、類似案件検索システムなどはそれにあたります。過去のデータを検索するものですので、類似案件検索システムを取り巻く環境の変化は考えにくいです。
AIや機械学習のモデルの精度や学習能力は今後さらに向上していくと考えられますが、コストを低く、効果のあるAI活用を目指すには、ドリフトという現象に遭遇しないことが大切です。
▼『AIを活用した類似案件検索システム導入事例』 無料ダウンロードはこちら