加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

用于对数字组的相似性进行评分的算法

发布时间:2020-12-14 04:32:05 所属栏目:大数据 来源:网络整理
导读:什么是比较多组数字与目标集合以确定哪些数字最“相似”的算法? 该算法的一个用途是将今天的每小时天气预报与历史天气记录进行比较,以找到具有相似天气的一天. 两组的相似性有点主观,因此算法实际上只需要在好匹配和坏匹配之间进行区分.我们有很多历史数据,
什么是比较多组数字与目标集合以确定哪些数字最“相似”的算法?

该算法的一个用途是将今天的每小时天气预报与历史天气记录进行比较,以找到具有相似天气的一天.

两组的相似性有点主观,因此算法实际上只需要在好匹配和坏匹配之间进行区分.我们有很多历史数据,因此我想尝试通过自动抛出不接近的集合并尝试将“最佳”匹配放在顶部来缩小用户需要查看的天数.列表.

编辑:
理想情况下,算法的结果与使用不同数据集的结果相当.例如,使用Niles建议的均方误差会产生相当好的结果,但是比较温度时生成的数字无法与其他数据(如风速或降水)生成的数字进行比较,因为数据的比例不同.一些非天气数据非常大,因此均方误差算法产生数十万的数字,而使用温度产生的数十或数百.

解决方法

我认为均方误差度量可能适用于天气比较等应用.它很容易计算并给出有意义的数字.

由于您希望随时间比较测量结果,因此可以忽略计算中的缺失值.

对于没有时间限制甚至未排序的值,多维散点数据更难一些.选择良好的距离度量成为分析此类数据的艺术的一部分.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读