加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > MsSql教程 > 正文

sql-server – R:使用RODBC和SQL Server来缓慢读取性能

发布时间:2020-12-12 16:51:54 所属栏目:MsSql教程 来源:网络整理
导读:我是R的新手,但有兴趣使用Shiny使用存储在SQL Server数据库中的数据创建动态图表.为了实现交互性,我想从数据库中引入原始数据,并在R中执行计算,而不是让数据库总结数据. 我可以使用RODBC连接到数据库,执行查询,并在data.frame中接收结果.但是,R中的读取时间比
我是R的新手,但有兴趣使用Shiny使用存储在SQL Server数据库中的数据创建动态图表.为了实现交互性,我想从数据库中引入原始数据,并在R中执行计算,而不是让数据库总结数据.

我可以使用RODBC连接到数据库,执行查询,并在data.frame中接收结果.但是,R中的读取时间比在SQL Server Management Studio(SSMS)中执行的相同查询长约12倍. SSMS需要大约600 ms,而R需要大约7.6秒.我的问题是我是否做错了事情,还是R数据库访问真的很慢?如果是,是否有更快的选择(例如将数据库输出写入文件并阅读文件)?

有关查询的一些信息可能有帮助:查询检索大约250K行与4列.第一列是日期,其他三个是数值.运行R和SSMS的机器是具有32GB内存的高端Win 7工作站.我正在运行的R命令是:

system.time(df <- sqlQuery(cn,query))

返回:

user  system elapsed
7.17   0.01   7.58

有趣的是,从SQL到我的机器的数据传输看起来很快,但是R在返回数据框之前在内部忙着做几秒钟.我看到这是因为网络利用率在第一秒钟尖峰,几乎立即返回到接近0.然后几秒钟后,R data.frame返回.

解决方法

我会尝试RJDBC
http://cran.r-project.org/web/packages/RJDBC/RJDBC.pdf

与这些驱动程序https://msdn.microsoft.com/en-us/sqlserver/aa937724.aspx

library(RJDBC)
drv <- JDBC("com.microsoft.sqlserver.jdbc.SQLServerDriver","/sqljdbc4.jar") 
con <- dbConnect(drv,"jdbc:sqlserver://server.location","username","password")
dbGetQuery(con,"select column_name from table")

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读