Skip to content

Joeland4/DeepLearning-Note

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

9 Commits
 
 

Repository files navigation

常见知识点

【个人理解】神经网路每一层都是进化着的分布
【L1&L2正则化】:为什么减少过拟合?加入正则化项,在最小化经验误差的情况下,可以让我们选择解更简单(趋向于0)的解。详见:https://zhuanlan.zhihu.com/p/35356992
【Scaler】:MinMax还是Standard?Standard能够避免异常值带来影响。详见:https://www.zhihu.com/question/20467170/answer/839255695
【Norm】:BatchNorm,layerNorm,InstanceNorm,groupNorm 深层网络训练的过程中,由于网络中参数变化而引起内部结点数据分布发生变化的这一过程被称作Internal Covariate Shift。 详见:https://zhuanlan.zhihu.com/p/87117010 | https://zhuanlan.zhihu.com/p/152232203
【Activation function】:增加模型非线性详见:https://zhuanlan.zhihu.com/p/172254089 | https://zhuanlan.zhihu.com/p/98863801
【Learning rate】:如何选择学习率。详见:https://zhuanlan.zhihu.com/p/390261440
【Optimizer】:GD,SGD,Adam,lookahead,Lion。详见:https://zhuanlan.zhihu.com/p/614133329
【Position embedding】:Sinusoidal,RoPE。详见:https://kexue.fm/archives/8265

About

深度学习常见问题小笔记

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published