[Convolutional Neural Networkとは何なのか - Qiita](https://qiita.com/icoxfog417/items/5fd55fad152231d706c2)
- 通常のNNでは、入力を一次元に展開するため、特徴量の空間的な関係性が失われる。
- そこで、画像上にフィルタと呼ばれる小領域をとり、これを1つの特徴量として圧縮する(=畳み込む)。
---
[【AI入門】 Pytorchを用いた深層学習入門講座 【Part5】CNNの理論 - YouTube](https://www.youtube.com/watch?v=8ndFPcujCqQ&list=PLBab1cAR4F4yws1lbPkjJCKza6rzE5LwG&index=6&ab_channel=KCS%3A%3AKeioComputerSociety)
### CNNの全体像
- CNNの一般的な模式図
- [[AlexNet]]
- 入力 -> 畳み込み層 -> プーリング層 -> 全結合層(ふつうのNN)
- 畳み込み層とプーリング層を繰り返し処理
- 畳み込み処理
- ![[Pasted image 20221201170700.png]]
- CNNではフィルター(カーネル)が学習する重みに相当する
- パディング:畳み込みの処理の前に入力の周囲に固定のデータを埋める
- 出力データのサイズを維持できる
- ![[Pasted image 20221201171446.png]]
- ストライド:フィルターを適用する位置の間隔。
- プーリング
- 画像の一部を一つの領域に集約する操作。
- ![[Pasted image 20221201171859.png]]
- ![[Pasted image 20221201172107.png]]
- チャネル
- 画像の奥行きにあたるインデックス
- ![[Pasted image 20221201180414.png]]
- 出力データも一般に複数のチャネルになる
[【AI入門】 Pytorchを用いた深層学習入門講座 【Part6】CNNの実装 - YouTube](https://www.youtube.com/watch?v=6roIEgXy7wA&list=PLBab1cAR4F4yws1lbPkjJCKza6rzE5LwG&index=5&ab_channel=KCS%3A%3AKeioComputerSociety)