[Variational Autoencoder徹底解説 - Qiita](https://qiita.com/kenmatsu4/items/b029d697e9995d93aa24)
> 入力データXから潜在変数zに変換するニューラルネットワークをEncoderといいます。
> VAEは[[深層学習|ディープラーニング]]による[[生成モデル]]の1つで、訓練データを元にその特徴を捉えて訓練データセットに似たデータを生成することができます
> VAEはこの潜在変数zに確率分布、通常z∼N(0,1)を仮定したところが大きな違いです。通常のオートエンコーダーだと、何かしら潜在変数zzにデータを押し込めているものの、その構造がどうなっているかはよくわかりません。VAEは、潜在変数zzを確率分布という構造に押し込めることを可能にします。
> VAEはzが正規分布に従うように設計されており、正規分布に従う乱数を学習時に取り入れているので、この乱数によるブレによって似た形状のものを近くに寄せる効果があるためです。
> 画像などの高次元のデータは、実はその高次元の中でごく一部にしかデータが分布しておらず、意味のあるデータ(訓練データの本質を捉えたデータ)はその高次元の中で局所的に固まっていると考える[[多様体仮説]](Manifold Hypothesis)というものがあります。