DCGAN
DCGANとは畳み込みニューラルネットワークによる敵対生成ネットワーク(Deep Convolutional Generative adversarial networks)の略語です。
教師なし学習で使われるAIアルゴリズムの一つです。
このアルゴリズムはよく画像データの処理に使われています。
- ~目次~
- 1.DCGANとは
- 2.メリットとデメリット
- 3.DCGANモデルが活用できるところ
1.DCGANとは
DCGANモデルは2014年にイアン・グッドフェローらによって発表されたGANモデルに基づいて、畳み込みニューラルネットワーク(CNN)の技術を加えて、より改善されたモデルです。
GANモデルと同じく主に画像生成の分野において活躍しています。詳しく紹介しますと、GANモデルは敵対的なモジュールを二つ実装されているというイメージです。
その二つのモジュールはそれぞれG(Generator)とD(Discriminator)です。Gとは画像データ生成のネットワークです。Dとは画像データ判別のネットワークです。
アルゴリズムの中で、Gから生成された本物の写真データと似ているデータをDで本物の画像データであるかどうかを判断します。
このようにDから判断することで、生成の画像データをだんだん本物の画像データに近寄っています。
そしてCNNモデルはかなり複雑で、多層構造にはなっていますが、多層の構造により、一層ずつにデータを分析することで、生物の脳の視覚を模擬しているアルゴリズムです。
そのためにDCGANモデルはGANモデルのアルゴリズムより、画像処理の精度が向上できました。
2.メリットとデメリット
- メリット:
-
1.生成と判断のアルゴリズムを備えているので、自ら生成された画像を判断でき、生成の精度が高いです
2.CNNモデルと併用し、GANモデルより精度を更に向上することができました - デメリット:
- 1.他のAIと同じく、精度の高い生成結果を求めている場合は大量なデータが必要となります
3.DCGANモデルが活用できるところ
DCGANモデルはGANモデルと同じく画像生成のアルゴリズムでよく使われています。
また精度高いということで、顔認識技術でも使われています。AI導入後間もない段階では、データが少ないため精度の高い結果が出せることは難しいです。
例えば工場におけるAIカメラで不良検出の装置を導入する場合、始まりの段階はデータが少ないために検出の精度は低い場合があります。
そのためにデータを増やさないといけません。DCGANモデルでは、少量のデータ基づいて、大量の本物データとほぼ同じのサンプルデータが生成することができます。
実際のデータと生成されたデータを一緒にトレーニングすることで、AIの精度が向上することができます。
同じくAIカメラの例ですが、AIカメラを使って、製品の検査について、DCGANモデルもかなり認識の精度が高く、より正しく製品の傷など不良品の識別可能性が高くなります。
▼レポート無料ダウンロード お申し込みはこちら▼