复现 & 思考

源文件 Readme-raw.md

目的：复现实现，感受效果；理解算法过程，分析算法瓶颈；借鉴思路，尝试改进方法；

1. 环境 & 配置

环境

$ pip list | grep torch
torch               1.1.0
torchvision         0.3.0

$ pip install tensorboardX

修改代码 cp_dataset.py

源代码中对单通道图做transform变换，需要修改。

Traceback (most recent call last):
  File "train.py", line 191, in <module>
    main()
  File "train.py", line 176, in main
    train_gmm(opt, train_loader, model, board)
  File "train.py", line 58, in train_gmm
    inputs = train_loader.next_batch()
  File "/vton/cinastanbean-cp-vton/cp_dataset.py", line 166, in next_batch
...
    tensor.sub_(mean[:, None, None]).div_(std[:, None, None])
RuntimeError: output with shape [1, 256, 192] doesn't match the broadcast shape [3, 256, 192]

self.transform = transforms.Compose([  \
        transforms.ToTensor(),   \
        transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
self.transform_1d = transforms.Compose([ \
        transforms.ToTensor(), \
        transforms.Normalize((0.5,), (0.5,))])

--workers 4 --> --workers 0

ERROR: Unexpected bus error encountered in worker. This might be caused by insufficient shared memory (shm).
...
RuntimeError: DataLoader worker (pid 2841) is killed by signal: Bus error.

2. Train

STEPs

step1-train-gmm.sh
step2-test-gmm.sh
step3-generate-tom-data.sh
$ mv result/gmm_final.pth/train/* data/train/
step4-train-tom.sh
step5-test-tom.sh

显卡内存使用2647MiB(Memory-Usage), 限于生成图像尺寸256x192；训练时长，普通单卡机器1-2天可以完成。

按原作者默认参数训练模型，训练模型存放于百度网盘（链接: https://pan.baidu.com/s/1gJqjGvXQgdoGkCF_YpNAUQ 提取码: b3fk），供下载测试。tensorboard文件大约19G，如果需要有限时间内可联系索取。

嗨，按原作者默认参数，我复现了一把实验。
训练模型存放于百度网盘（链接: https://pan.baidu.com/s/1h6h9MYswltN4mcp5dfYycg 提取码: uwgg），供下载测试。
部分分析和拙见写在 Github: https://github.com/cinastanbean/cp-vton ，欢迎同行拍砖讨论。

$ tree checkpoints/
checkpoints/
├── gmm_train_new
│   ├── gmm_final.pth
│   ├── step_005000.pth
│   ├── ...
│   └── step_200000.pth
└── tom_train_new
    ├── step_005000.pth
    ├── ...
    ├── step_200000.pth
    └── tom_final.pth

TensorBoard

tensorboard/
├── gmm_train_new
│   └── events.out.tfevents.1568110598.tplustf-imagealgo-50529-ever-chief-0
├── gmm_traintest_new
│   └── events.out.tfevents.1568185067.tplustf-imagealgo-50529-ever-chief-0
├── tom_test_new
│   └── events.out.tfevents.1568473618.tplustf-imagealgo-50529-ever-chief-0
└── tom_train_new
    └── events.out.tfevents.1568188644.tplustf-imagealgo-50529-ever-chief-0
    
$ tensorboard --logdir tensorboard/gmm_train_new/
$ tensorboard --logdir tensorboard/gmm_traintest_new/
$ tensorboard --logdir tensorboard/tom_train_new/
$ tensorboard --logdir tensorboard/tom_test_new/

web:

http://everdemacbook-pro.local:6006/#scalars
http://everdemacbook-pro.local:6006/#images

scalars / images :

gmm_train_new

gmm_traintest_new

tom_train__new

tom_test_new

3. Test

执行前STEPs中所列步骤，后执行python smart_show_test_result.py，可以在result_simple文件夹下查看生成结果，示例图片如下，从左到右每列图片意思是：

[cloth, cloth-mask, model-image, model-image-parse, cloth-warp, cloth-warp-mask, try-on-result]

4. Virtual Try-On 技术路线的瓶颈

虚拟模特图像生成，技术上大致有三条路实现。

“Virtual Try-On”（VTON）是其中一种方式。

VTON技术有如下考虑：

规避模特生成问题，模特生成本身比较难以做到，难以做到对模特面孔头发、身材真实性等方面的保真度，VTON技术路线规避该问题；
默认模特已经穿着了和待合成服饰尺寸形状大体一致的服饰，通过对服饰做Warping进而“贴图”，实现Try-On的效果。

技术产品化VTON思路还有些问题：

对指定模特，给他换上另外一套衣服，需要妥善处理版权问题；
服装和人的搭配问题，如何保持视觉协调；
服装穿着在人身上产生的自然形变，因为对服饰做Warping没有根本解决对服饰的理解问题；（如下图条纹状服饰）
模特摆拍姿势多样，肢体和服装之间的遮挡问题;（如下图手臂遮挡服饰）
当前数据和实验，数据限于上衣短袖类目，图像尺寸256x192, 还属于Toy级别实验；

条纹状服饰

手臂遮挡服饰

5. 算法演进方向

Virtual Try-on

致敬诸位的创意，这条路还有很多技术点要解决。

.
├── 2017-VITON-MalongTech
│   ├── 1705.09368.Pose Guided Person Image Generation.pdf
│   ├── 1711.08447.VITON- An Image-based Virtual Try-on Network.pdf
│   ├── 1902.01096.Compatible and Diverse Fashion Image Inpainting.pdf
│   └── 2002-TPAMI-Shape matching and object recognition using shape contexts.pdf
├── 2018-CP-VTON-SenseTime
│   └── 1807.07688.Toward Characteristic-Preserving Image-based Virtual Try-On Network.pdf
├── 2019-Multi-pose Guided Virtual Try-on Network (MG-VTON)
│   └── 1902.11026.Towards Multi-pose Guided Virtual Try-on Network.pdf
├── 2019-WUTON
│   └── 1906.01347.End-to-End Learning of Geometric Deformations of Feature Maps for Virtual Try-On.pdf

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
data		data
pics		pics
result		result
LICENSE		LICENSE
README-raw.md		README-raw.md
README.md		README.md
convert_data.m		convert_data.m
cp_dataset.py		cp_dataset.py
data_download.py		data_download.py
environment.yml		environment.yml
grid.png		grid.png
human_colormap.mat		human_colormap.mat
networks.py		networks.py
nvidia-smi-info		nvidia-smi-info
smart_show_test_result.py		smart_show_test_result.py
step1-train-gmm.sh		step1-train-gmm.sh
step2-test-gmm.sh		step2-test-gmm.sh
step3-generate-tom-data.sh		step3-generate-tom-data.sh
step4-train-tom.sh		step4-train-tom.sh
step5-test-tom.sh		step5-test-tom.sh
test.py		test.py
train.py		train.py
train_20190910_181637_step1-train-gmm.log		train_20190910_181637_step1-train-gmm.log
train_20190911_155724_step4-train-tom.log		train_20190911_155724_step4-train-tom.log
val_20190911_123203_step2-test-gmm.log		val_20190911_123203_step2-test-gmm.log
val_20190911_145747_step3-generate-tom-data.log		val_20190911_145747_step3-generate-tom-data.log
val_20190914_230657_step5-test-tom.log		val_20190914_230657_step5-test-tom.log
visualization.py		visualization.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

复现 & 思考

1. 环境 & 配置

2. Train

3. Test

4. Virtual Try-On 技术路线的瓶颈

5. 算法演进方向

About

Releases

Packages

Languages

License

cinastanbean/cp-vton

Folders and files

Latest commit

History

Repository files navigation

复现 & 思考

1. 环境 & 配置

2. Train

3. Test

4. Virtual Try-On 技术路线的瓶颈

5. 算法演进方向

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages