L1 L2正则化及贝叶斯解释
发布时间:2020-12-14 06:42:19 所属栏目:百科 来源:网络整理
导读:1 L1 正则化和 L2 正则化区别 L1 得到的是稀疏权值 ,可以用于特征选择,假设参数服从 Laplace 分布(贝叶斯角度理解) L2 得到的是平滑权值 ,因为所有权值都趋于最小,假设参数服从 Gauss 分布, ( 并趋于一致,因为一致时平方和,最小 ) 2 L1 正则化稀疏
1 L1正则化和L2正则化区别
2 L1正则化稀疏解理解2.1问题转化 2.2图形化解释
2.3其他理解
2.4 L1求导求导方法:近端梯度下降
参考: [1]机器学习中的范数规则化之(一)L0、L1与L2范数 http://blog.csdn.net/zouxy09/article/details/24971995/ [2]l1相比于 l2为什么容易获得稀疏解? https://www.zhihu.com/question/37096933?sort=created
3贝叶斯角度理解正则化http://www.52php.cn/blog/shenxiaoming77/article/p-5011766.html http://blog.csdn.net/zhuxiaodong030/article/details/54408786
3.1先验知识
3.2贝叶斯理解
3.3概率论角度解释平滑与稀疏
3.4极大似然与后验估计http://www.cnblogs.com/little-YTMM/p/5399532.html
(编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |