总结一下自己学到的知识点
** Layer Normaliztion
相比于batch normalization
batch是“竖”着来的,各个维度做归一化,所以与batch size有关系。
layer是“横”着来的,对一个样本,不同的神经元neuron间做归一化。

总结一下自己学到的知识点
** Layer Normaliztion
相比于batch normalization
batch是“竖”着来的,各个维度做归一化,所以与batch size有关系。
layer是“横”着来的,对一个样本,不同的神经元neuron间做归一化。
