机器学习习题(6)
1.前言这一节关于正则化的题目比较多。 2. 习题2.1 习题1(信息增益)
正确答案:C 解析: 对于每一维特征,分别使用其候选值使用决策树的方法观察信息增益,可以看到使用学历特征可以使得分类后的熵为0,也就是信息增益最大。因此选C。 2.2 习题2(L1与L2范数)
正确答案:A 解析: 在代价函数后面加上正则项,L1即是Losso回归,L2是岭回归。L1范数是指向量中各个元素绝对值之和,用于特征选择。L2范数 是指向量各元素的平方和然后求平方根,用于 防止过拟合,提升模型的泛化能力。因此选择A。 对于机器学习中的范数规则化,也就是L0,L1,L2范数的详细解答,请参阅《范数规则化》。 2.3 习题3(正则化)
正确答案:AD 解析: L1正则化偏向于稀疏,它会自动进行特征选择,去掉一些没用的特征,也就是将这些特征对应的权重置为0. L2主要功能是为了防止过拟合,当要求参数越小时,说明模型越简单,而模型越简单则,越趋向于平滑,从而防止过拟合。 L1正则化/Lasso L2正则化/Ridge regression 可以看出,L2正则化对于特征选择来说一种稳定的模型,不像L1正则化那样,系数会因为细微的数据变化而波动。所以L2正则化和L1正则化提供的价值是不同的,L2正则化对于特征理解来说更加有用:表示能力强的特征对应的系数是非零。 因此,一句话总结就是:L1会趋向于产生少量的特征,而其他的特征都是0,而L2会选择更多的特征,这些特征都会接近于0。Lasso在特征选择时候非常有用,而Ridge就只是一种规则化而已。 具体的,可以参阅《机器学习之特征选择》与《机器学习范数正则化》。 2.4 习题4(势函数法)
正确答案:AD 解析: 事实上,AD说的是一回事。 2.5 习题5(隐马尔可夫)
正确答案:ABC 解析:评估问题,可以使用前向算法、后向算法、前向后向算法。 3. 小结本章主要描述了5个问题,分别是信息增益、范数、正则化、势函数法和隐马尔可夫模型,有熟悉的,也有陌生的,要好好学习,弥补不足。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |