[Convolutional Neural Networkとは何なのか - Qiita](https://qiita.com/icoxfog417/items/5fd55fad152231d706c2) - 通常のNNでは、入力を一次元に展開するため、特徴量の空間的な関係性が失われる。 - そこで、画像上にフィルタと呼ばれる小領域をとり、これを1つの特徴量として圧縮する(=畳み込む)。 --- [【AI入門】 Pytorchを用いた深層学習入門講座 【Part5】CNNの理論 - YouTube](https://www.youtube.com/watch?v=8ndFPcujCqQ&list=PLBab1cAR4F4yws1lbPkjJCKza6rzE5LwG&index=6&ab_channel=KCS%3A%3AKeioComputerSociety) ### CNNの全体像 - CNNの一般的な模式図 - [[AlexNet]] - 入力 -> 畳み込み層 -> プーリング層 -> 全結合層(ふつうのNN) - 畳み込み層とプーリング層を繰り返し処理 - 畳み込み処理 - ![[Pasted image 20221201170700.png]] - CNNではフィルター(カーネル)が学習する重みに相当する - パディング:畳み込みの処理の前に入力の周囲に固定のデータを埋める - 出力データのサイズを維持できる - ![[Pasted image 20221201171446.png]] - ストライド:フィルターを適用する位置の間隔。 - プーリング - 画像の一部を一つの領域に集約する操作。 - ![[Pasted image 20221201171859.png]] - ![[Pasted image 20221201172107.png]] - チャネル - 画像の奥行きにあたるインデックス - ![[Pasted image 20221201180414.png]] - 出力データも一般に複数のチャネルになる [【AI入門】 Pytorchを用いた深層学習入門講座 【Part6】CNNの実装 - YouTube](https://www.youtube.com/watch?v=6roIEgXy7wA&list=PLBab1cAR4F4yws1lbPkjJCKza6rzE5LwG&index=5&ab_channel=KCS%3A%3AKeioComputerSociety)