最小二乘法
考虑一个输入向量 x, Affine 层的权重为 k 维向量 w, 偏置为标量 b, 则 :
假设我们有m个样本, 使用 X 表示 m 行 k 列的矩阵, 偏置为标量 b, 则一次仿射变换为 : 假设该样本 X 对应的已知目标值为 y, 使用均方差 (MSE) 作为损失函数来度量拟合效果:
我们希望 cost 值越小越好, 即预测值 a 尽量接近于 y. 对于每一个 $a_i$ 是一个二次抛物线函数, 其最小值就是其极值点. 由于: 则:
最小二乘法
考虑一个输入向量 x, Affine 层的权重为 k 维向量 w, 偏置为标量 b, 则 :
假设我们有m个样本, 使用 X 表示 m 行 k 列的矩阵, 偏置为标量 b, 则一次仿射变换为 : 假设该样本 X 对应的已知目标值为 y, 使用均方差 (MSE) 作为损失函数来度量拟合效果:
我们希望 cost 值越小越好, 即预测值 a 尽量接近于 y. 对于每一个 $a_i$ 是一个二次抛物线函数, 其最小值就是其极值点. 由于: 则: