-
L1是模型各个参数的绝对值之和。L2是模型各个参数的平方和的开方值。L1会趋向于产生少量的特征,而其他的特征都是0,因为最优的参数值很大概率出现在坐标轴上,这样就会导致某一维的权重为0,产生稀疏权重矩阵。L2会选择更多的特征,这些特征都会接近于0。
-
L1是模型各个参数的绝对值之和。L2是模型各个参数的平方和的开方值。L1会趋向于产生少量的特征,而其他的特征都是0,因为最优的参数值很大概率出现在坐标轴上,这样就会导致某一维的权重为0,产生稀疏权重矩阵。L2会选择更多的特征,这些特征都会接近于0。
-
L1是模型各个参数的绝对值之和。L2是模型各个参数的平方和的开方值。L1会趋向于产生少量的特征,而其他的特征都是0,因为最优的参数值很大概率出现在坐标轴上,这样就会导致某一维的权重为0,产生稀疏权重矩阵。L2会选择更多的特征,这些特征都会接近于0。
-
L1是模型各个参数的绝对值之和。L2是模型各个参数的平方和的开方值。L1会趋向于产生少量的特征,而其他的特征都是0,因为最优的参数值很大概率出现在坐标轴上,这样就会导致某一维的权重为0,产生稀疏权重矩阵。L2会选择更多的特征,这些特征都会接近于0。
-
L1是模型各个参数的绝对值之和。L2是模型各个参数的平方和的开方值。L1会趋向于产生少量的特征,而其他的特征都是0,因为最优的参数值很大概率出现在坐标轴上,这样就会导致某一维的权重为0,产生稀疏权重矩阵。L2会选择更多的特征,这些特征都会接近于0。