Karpathy make more youtube video -> best ML lectures!

Hand craft nn (mlp3) vs. Torch.nn (mlp4)

自己要處理 train 和 evaluation 的不同
- BatchNormal 不一樣
- batch = 1 常常會有問題: 計算 var!!! batch = 1 計算 var 一定有問題！

分成 model.train() and model.eval() 爲了
- BatchNormal1d, BatchNormal2d 在 training and evaluation 的不同

Reference

[Build Better Deep Learning Models with Batch and Layer Normalization

Pinecone](https://www.pinecone.io/learn/batch-layer-normalization/)