加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 百科 > 正文

我如何解析R中的XML文件并对数据进行基本的统计分析

发布时间:2020-12-16 07:58:12 所属栏目:百科 来源:网络整理
导读:我试图解析R中的XML文件,以便我可以分析数据.我试图得到价格的均值和标准差.此外,我希望能够在股价变动时获得变化率.我试过手动输入数据但是我遇到了日期结构问题(我尝试过以下方法: z - strptime ("HH:MM:SS.ms,"%H:%m:%S.%f") 但它无法工作).我知道XML文
我试图解析R中的XML文件,以便我可以分析数据.我试图得到价格的均值和标准差.此外,我希望能够在股价变动时获得变化率.我试过手动输入数据但是我遇到了日期结构问题(我尝试过以下方法:
z <- strptime ("HH:MM:SS.ms,"%H:%m:%S.%f")

但它无法工作).我知道XML文件只有少量数字,但它是一个可以自动化的过程,如果是这样,我需要哪些包? (我是R的新手).任何帮助将非常感激.

谢谢,
安东尼.

<?xml version = "1.0"?>
    <Company >
    <shareprice>
    <timeStamp> 12:00:00:01</timeStamp>
    <Price>  25.02</Price>
    </shareprice>



    <shareprice>
    <timeStamp> 12:00:00:02</timeStamp>
    <Price>  15</Price>
    </shareprice>



    <shareprice>
    <timeStamp> 12:00:00:025</timeStamp>
    <Price>  15.02</Price>
    </shareprice>



    <shareprice>
    <timeStamp> 12:00:00:031</timeStamp>
    <Price>  18.25</Price>
    </shareprice>



    <shareprice>
    <timeStamp> 12:00:00:039</timeStamp>
    <Price>  18.54</Price>
    </shareprice>



    <shareprice>
    <timeStamp> 12:00:00:050</timeStamp>
    <Price> 16.52</Price>
    </shareprice>


   <shareprice>
    <timeStamp> 12:00:01:01</timeStamp>
    <Price>  17.50</Price>
   </shareprice>
</Company>
z <- strptime ("HH:MM:SS.ms,"%H:%m:%S.%f")

你错过了一个结束“所以这是无效的语法.

接下来,数据是非标准的,因为我们将使用dot.subseconds的点,即12:23:34.567来表示时间戳.毫秒可以通过这种方式解析

> ts <- "12:00:00.050"
> strptime(ts,"%H:%M:%OS")
[1] "2010-07-09 12:00:00 CDT"
>

因此,您不仅需要首先从XML中获取它,还需要转换字符串.否则,您可以手动解析字符串填充POSIXlt时间结构.

Postscriptum:忘了提到你需要启用亚秒次打印:

> options("digits.secs"=3)         # shows milliseconds (three digits)
> strptime(ts,"%H:%M:%OS")
[1] "2010-07-09 12:00:00.05 CDT"   # suppresses trailing zero
>

后记2:由于XML包,你对文件也很满意:

> library(XML)
> xmlToDataFrame("c:/Temp/foo.xml")     # save your data as c:/Temp/foo.xml
      timeStamp   Price
1   12:00:00:01   25.02
2   12:00:00:02      15
3  12:00:00:025   15.02
4  12:00:00:031   18.25
5  12:00:00:039   18.54
6  12:00:00:050   16.52
7   12:00:01:01   17.50
>

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读