潜在空間
潜在空間とは、機械学習モデル、特に深層学習モデルがデータを抽象化し、圧縮された形で表現する空間のこと。画像、テキスト、音声といった高次元のデータは、潜在空間においてはモデルが意味的に整理した数値ベクトルとして表現される。
例えば、画像生成の例で考えると、象やキリンの画像は、人間が理解できる形でそのまま存在するのではなく、それぞれの特徴が抽象化された多次元ベクトルとして表現される。象の特徴をもつベクトルは潜在空間内で互いに近い位置に分布し、キリンの特徴をもつベクトルは別の領域に集まる。この潜在空間内での距離や配置関係をモデルが学習することで、意味や特徴を反映したデータの生成を可能にする。
潜在空間を活用する代表的な生成モデルには、オートエンコーダーやVAE(変分オートエンコーダー)、GAN(敵対的生成ネットワーク)などがある。これらのモデルは、いずれも潜在空間の構造を学習し、新たなデータを生成するために利用される。
さらに、潜在空間の構造を理解することは、類似データの検索や効率的な圧縮といった幅広い応用にもつながる。潜在空間の可視化や、その中で補間・操作を行うことで、生成対象や意味の変化を直感的に理解できるようになる。
この記事を社内で共有し、課題解決のヒントにお役立てください
お客様マイページの「連絡ボード」機能を使って、同じ会社のメンバーと簡単にこのページを共有できます。社内で情報を共有し、組織全体の課題解決や業務効率の向上にお役立てください。
社内のメンバーに共有する(企業で共有する)
- (注)連絡ボードを利用するには企業設定が必要です。