加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

机器学习 – 如何处理C4.5(J48)决策树中缺少的属性值?

发布时间:2020-12-16 03:28:23 所属栏目:百科 来源:网络整理
导读:使用Weka的C4.5(J48)决策树处理缺失特征属性值的最佳方法是什么?在训练和分类期间都会出现缺失值的问题. 如果培训实例中缺少值,假设我放置’?’,我是否正确?功能的价值? 假设我能够成功构建决策树,然后从Weka的树结构中用C或Java创建自己的树代码.在分类
使用Weka的C4.5(J48)决策树处理缺失特征属性值的最佳方法是什么?在训练和分类期间都会出现缺失值的问题.

>如果培训实例中缺少值,假设我放置’?’,我是否正确?功能的价值?
>假设我能够成功构建决策树,然后从Weka的树结构中用C或Java创建自己的树代码.在分类时,如果我尝试对新实例进行分类,我会为具有缺失值的功能赋予什么价值?如何将树下降到我具有未知值的决策节点?

使用Naive Bayes会更好地处理缺失值吗?我只想为他们分配一个非常小的非零概率,对吗?

解决方法

来自佩德罗多明戈斯在华盛顿大学的ML课程:

以下是佩德罗建议的A缺失值的三种方法:

>在分配给节点n的其他示例中分配A的最常见值
>在具有相同目标值的其他示例中分配A的最常见值
>将概率p_i分配给A的每个可能值v_i;将示例的分数p_i分配给树中的每个后代.

幻灯片和视频现在可在here查看.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读