DX GLOSSARY DX用語集

デジタルやAI、ロボットに関する技術用語集

クラスタリング

クラスタリング(Clustering)とは機械学習の手法の一つです。
このアルゴリズムは主に類似しているデータ群をグループごとに分けるという手法です。

~目次~
1.クラスタリングとは
2.メリットとデメリット
3.クラスタリングが活用できるところ

1.クラスタリングとは

クラスタリングは機械学習の中で教師なし学習の一種です。
つまりデータを分類する傾向性は指定されていないことで、勝手にデータの特徴に従って分類を行います。
例えばたくさんのデータを3、4種類に分けると、グループごとのデータは何らかの特徴が見える可能性もあります。
クラスタリングの際に、まずデータの中の特徴を選択、抽出し、その後は数学的な方法でデータの間の距離(距離が近いデータは一グループになり、特徴が似ているというイメージ)を計算することで、グループを分けます。
データ間の距離を計算してグループ分けをする手法は複数あります。
具体的にはk-means法、最長・最短距離法、最小分散法などの方法が挙げられます。
それぞれの手法には特徴があり、出力される結果も異なる可能性があります。

2.メリットとデメリット

メリット:
1.基本的な機械学習の手法の一つであることで、理解されやすく簡単にデータ分析の試みを始めることができます。
2.データをいくつかのグループに分類すると、データの傾向性と特徴が見えるようになります。そのため各分野におけるデータ分析の応用も可能となります。
デメリット:
1.データ数が極めて少ない場合にはうまくクラスタリングできない可能性があります。

3.クラスタリングが活用できるところ

クラスタリングというデータ分析の手法は幅広い分野で活用できます。
ビジネス上の例を挙げますと、顧客データの分析とセグメント分けができます。
お客様のデータで、年齢層、性別、住所などのデータをクラスタリングで分析すると、お客様のデータはいくつかのグループに分けられます。
それぞれのグループでの傾向性や、商品の購入状況と結合し、各セグメントのお客様は商品の購入率が把握できるようになって、購入率の低いセグメントに対して、特徴と結合し対策を打つことが可能となります。

▼レポート無料ダウンロード お申し込みはこちら▼

AIを活用した類似案件検索システム導入事例

今すぐダウンロードする
用語集一覧