你可能不知道的一些机器学习事儿
发布时间:2020-12-14 01:00:21 所属栏目:百科 来源:网络整理
导读:你可能不知道的一些机器学习事儿 最近零零碎碎地看了很多机器学习方法的东西,增长了不少新知识。有很多小技巧虽然不会出现在教科书中,但它们真的很实用。 (1)随机森林模型不适合用稀疏特征。 (2)测试集必须使用与训练集相同的方法进行预处理。 (3)L1
你可能不知道的一些机器学习事儿 最近零零碎碎地看了很多机器学习方法的东西,增长了不少新知识。有很多小技巧虽然不会出现在教科书中,但它们真的很实用。 (1)随机森林模型不适合用稀疏特征。 (2)测试集必须使用与训练集相同的方法进行预处理。 (3)L1正则(特征选择)最小样本数目m与特征n呈log关系,m = O(log n) ; L2正则(旋转不变)最小样本数目m与特征n呈线性关系,m = O(n) 。 (4)标准的PCA是一种线性转换技术。 (5)呈长尾分布的特征通常需要进行对数转换。 (6)线性SVM适合小样本。 (7)AUC适合作为类不平衡问题的衡量标准。 (8)在nested k-foldcross validation中,“外层循环”的目的是模型评估,“内层循环”的目的是模型选择。 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
推荐文章
站长推荐
热点阅读