加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 资源网站 > 资源 > 正文

如何使用Rselenium读取html表?

发布时间:2020-12-14 18:28:25 所属栏目:资源 来源:网络整理
导读:我正在使用Rselenium导航到网页.以下代码正在这样做.我没有提供网址,因为我在需要vpn连接的公司中使用网址: RSelenium::startServer()require(RSelenium)remDr - remoteDriver()remDr$navigate("some url") 导航到网页后,在html源代码中,我有下表: font si
我正在使用Rselenium导航到网页.以下代码正在这样做.我没有提供网址,因为我在需要vpn连接的公司中使用网址:
RSelenium::startServer()
require(RSelenium)
remDr <- remoteDriver()
remDr$navigate("some url")

导航到网页后,在html源代码中,我有下表:

<font size="2">
<table border="1">
<tbody>
<tr>
<td> item1 </td>
<td> 0 </td>
<td> 0.05 </td>
<td> 2.43 </td>
<td align="center"> Pct </td>
<td align="center"> 1 </td>
</tr>
</tbody>
</table>

现在问题是如何提取此表的内容?请假设url不存在,否则我可以使用XML函数:readHTMLTable(remDr $getCurrentUrl()).但由于某种原因,这不起作用.我只需要使用remoteDriver句柄(remDr).
非常感谢你的时间

解决方法

就像是:
doc <- htmlParse(remDr$getPageSource()[[1]])
readHTMLTable(doc)

应该允许您访问html并处理包含的表.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读