泛化测试是指模型很好地拟合以前未见过的新数据(从用于创建该模型的同一分布中抽取)的能力。

机器学习的目标是对从真实概率分布(已隐藏)中抽取的新数据做出良好预测。过拟合模型在训练过程中产生的损失很低,但在预测新数据方面的表现却非常糟糕。

模型只能从训练数据集中取样,无法查看整体情况。