-
Notifications
You must be signed in to change notification settings - Fork 81
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
没有提升issue #11
Comments
感觉你需要先观察一下,是不是训练加速了,但是测试准确率下降了。如果是这种情况,可能是用了GC之后训练过快导致了overfitting,因为小网络太好优化了。你可以增大weight_decay, 或者尝试用一下SGD_GCC,只在卷积层使用。 |
首先感谢作者这么快的回复!没有overfitting的情况出现,我的total epoch是250,很巧合的是,用SGD_GC前后,都是第57个epoch训练准确率到达90,第85个到达95,最后training accuracy同样都到达了99.7,所以好像是没有加速的,应该也不算overfitting。 |
哦对了,我看post的code是在imagenet数据集上implement的,weight decay是1e-4;我的数据集大概29000训练集,测试集4000,weight decay设置的5e-4,这样够吗?还是需要再设置大点? |
也可能是网络太小,还没有过参数化的缘故。SGD_GC和SGD_GCC的区别是后者只在卷积层加GC,前者卷积和FC都加GC。有时候可能是需要调调weight decay 和 lr。 |
@ZangHuanyu 您好,我遇到了和您一样的问题,应用SGD_GC后,测试精度基本一样,甚至还低了,weight decay设置的5e-4,您后面有做什么修改解决了这个问题吗 |
抛开任务谈参数是没有意义的,大概讲一下我的任务和参数 |
嗯嗯,好的,感谢您地回复和耐心指导 |
求问作者,是不是深度越浅就越没有提升啊?我在ResNet上apply,用的FER2013表情database,用SGD大概72% accuracy左右,改用SGD_GC后基本一样,甚至还低了...用的是Res18,要不我再用Res34对比一下?
The text was updated successfully, but these errors were encountered: