加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 服务器 > Linux > 正文

linux – 为什么kmeans在高规格的Ubuntu机器上如此慢而不是Windo

发布时间:2020-12-14 01:40:02 所属栏目:Linux 来源:网络整理
导读:我的Ubuntu机器的性能对于R kmeans {stats}来说很糟糕,而 Windows 7没有出现任何问题. X是5000×5矩阵(数值变量). k = 6 我的台式机是Intel Xeon CPU W3530 @ 2.80GHz x 8(即8核)Dell Precision T3500,带Ubuntu 12.04.4 LTS(GNU / Linux 3.2.0-58通用x86_64)
我的Ubuntu机器的性能对于R kmeans {stats}来说很糟糕,而 Windows 7没有出现任何问题.

X是5000×5矩阵(数值变量).
k = 6

我的台式机是Intel Xeon CPU W3530 @ 2.80GHz x 8(即8核)Dell Precision T3500,带Ubuntu 12.04.4 LTS(GNU / Linux 3.2.0-58通用x86_64),内存为24 GB.

R version 3.0.2 (2013-09-25) — “Frisbee Sailing” Copyright (C) 2013
The R Foundation for Statistical Computing Platform:
x86_64-pc-linux-gnu (64-bit)

> system.time(X.km <- kmeans(X,centers=k,nstart=25))
   user  system elapsed
 49.763  52.347 103.426

与配备Intel Core i5-2430M @ 2.40GHz,2核,8 GB RAM,R 3.0.1和相同数据的Windows 7 64位笔记本电脑相比:

> system.time(X.km <- kmeans(X,nstart=25))

   user  system elapsed
   0.36    0.00    0.37

更快,更快.对于nstart = 1,问题仍然存在,我只是想放大执行时间.

有什么明显的东西我不见了吗?

亲自尝试一下,看看你取得的成就:

set.seed(101)
k <- 6
n <- as.integer(10)
el.time <- vector(length=n)
X <- matrix(rnorm(25000,mean=0.5,sd=1),ncol=5)
for (i in 1:n) {  # sorry,not clever enough to vectorise
    el.time[i] <- system.time(kmeans(X,nstart=i))[[3]]
}
print(el.time)
plot(el.time,type="b")

我的结果(ubuntu机器):

> print(el.time)  
  [1] 0.056 0.243 0.288 0.489 0.510 0.572 0.623 0.707 0.830 0.846

Windows机器:

> print(el.time)
 [1] 0.01 0.12 0.14 0.19 0.20 0.21 0.22 0.25 0.28 0.30

解决方法

你在虚拟机中运行Ubuntu吗?如果是这种情况,我可以看到结果慢得多 – 取决于为VM分配了多少内存,处理器和磁盘空间.如果它没有在VM中运行,那么结果令人费解.我想在运行它时看到两个系统上每个运行的性能计数器(cpu使用情况,内存使用情况等)?否则,我唯一可以链接的是代码“适合”在Windows系统的L1缓存中,但不适用于Linux系统. Xeon有8GB(L3?)缓存,其中Core i5只有3MB – 但我假设是L3.我不知道L1和L2缓存结构是什么样的.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读