書籍「GANディープラーニング実装ハンドブック」のサポートサイトです。本書籍で使用するサンプルコードがまとめてあります。
- 第1章:生成モデル
- 第2章:変分オートエンコーダ(VAE)
- 第3章:GANの基本モデル(DCGAN、CGAN、LSGAN)
- 第4章:超解像(ESRGAN)
- 第5章:ドメイン変換(pix2pix、CycleGAN)
- 第6章:動画変換(Recycle-GAN)
- 第7章:StyleGAN、StyleGAN2
- 第8章:異常検知(AnoGAN、EfficientGAN)
- 第9章:3Dデータの生成(3D-α-WGAN-GP)
- Appendix:理論の補足
ライブラリは執筆時点のColabの最新バージョンになります。Colabのライブラリは定期的に更新するので、プログラム実行時にエラーが発生する場合はバージョンを戻して実行してください。
- torch:1.7.0
- torchvision:0.8.1
- pandas:1.1.5
- numpy:1.19.5
- matplotlib:3.2.2
章 | モデル | データセット | ライセンス | 取得元リンク |
---|---|---|---|---|
2 | AE、VAE | MNIST | Creative Commons | https://pytorch.org/vision/0.8/datasets.html |
3 | DCGAN、CGAN | MNIST | Creative Commons | https://pytorch.org/vision/0.8/datasets.html |
3 | LSGAN、DCGAN | Pet Dataset | Creative Commons | https://www.robots.ox.ac.uk/~vgg/data/pets/ |
4 | ESRGAN | Pet Dataset | Creative Commons | https://www.robots.ox.ac.uk/~vgg/data/pets/ |
5 | pix2pix、CycleGAN | photo2portrait | データセットの画像をインターネット等で公開したり、販売するのは禁止です。 | https://drive.google.com/file/d/13qICIuYxV4babtPLjkmg-Y4DzU8_D5wN/view?usp=sharing |
6 | Cycle GAN、Recycle-GAN | VidTIMIT Audio-Video Dataset | リンク先のLICENSEに利用時の注事事項の記載あり | https://conradsanderson.id.au/vidtimit/ |
7 | StyleGAN、StyleGAN2 | Endless Summer Dataset | データセットの画像をインターネット等で公開したり、販売するのは禁止です。 | https://drive.google.com/file/d/1LM4FtUltzS45PuFyfuSp3I8QdTD8Cu0F/view?usp=sharing |
8 | AnoGAN、EfficientGAN | Fruits 360 Dataset | Creative Commons | https://data.mendeley.com/datasets/rp73yg93n8/1 |
9 | 3D-α-WGAN-GP | IXI Dataset | Creative Commons | http://brain-development.org/ixi-dataset/ |
章 | モデル | 注意点 | 学習の目安時間 |
---|---|---|---|
3 | LSGAN、DCGAN | LSGANよりDCGANの方が猫っぽい画像を生成します。 | 5~6時間程度 |
4 | ESRGAN | デフォルト設定だとファイルはColabに保存されるので、Google Driveに保存したい場合は出力ファイルのパスの定義(output_dir)をGoogle Driveに変更してください。 | 5~6時間程 |
5 | pix2pix, CycleGAN | 特になし | 5〜8時間程度 |
6 | CycleGAN 、Recycle-GAN | 特になし | 半日から数日 |
7 | StyleGAN、StyleGAN2 | GPUは執筆時点で最速のP100を推奨(理想はV100)。 | P100で2週間程度 |
8 | AnoGAN、EfficientGAN、 EfficientGAN_L1 |
AnoGAN, EfficientGANで生成精度が悪い場合、EfficientGAN_L1を使用してください。 | 2 ~ 3時間程度 |
9 | 3D-α-WGAN-GP | 特になし | 8時間程度 |
サンプルコードの間違いや動作不具合は本リポジトリのIssuesに投稿ください。
動作不具合についての投稿では、以下を記載ください。
- 実行プログラム名
- エラーメッセージ
- Python、PyTorchなどののライブラリバージョン
ページ | 誤 | 正 | 補足 |
---|---|---|---|
3章 p52 1行目 | パラメータを待つモデル分布 | パラメータを持つモデル分布 | |
7章 p281 活用メモ | 左の方が、よりハイスペックになります。 | 右の方が、よりハイスペックになります。 | |
7章 p281 活用メモ | Colabo pro | Colab pro |
日付 | 変更内容 |
---|---|
2021/02/13 | 初版 |
2023/01/23 | 8 章データダウンロードurlをアップデート(データの中身は同じです) |