4.3 模型验证【stanford-cs329p】
4.2 过拟合和欠拟合【stanford-cs329p】
GTC-2020 Megatron-LM:Training Multi-Billion Parameter Language Models Using Model Parallelism
NIPS-2019 GPipe:Efficient Training of Giant Neural Networks using Pipeline Parallelism
4.1 模型评估【stanford-cs329p】
3.7 循环神经网络【stanford-cs329p】
EMNLP-2021 Rethinking Data Augmentation for Low-Resource Neural Machine Translation:A Multi-Task Learning Approach
3.6 卷积神经网络【stanford-cs329p】
3.5 多层感知机【stanford-cs329p】
3.4 随机梯度下降【stanford-cs329p】
Archive
Total 255 articles