php – 如何在XPath中仅返回第一个匹配结果?
发布时间:2020-12-13 16:58:28 所属栏目:PHP教程 来源:网络整理
导读:我尝试使用XPath string-after来获取Property ID之后的数据:但结果不是我想要的.它显示了与Property ID匹配的所有结果.我只想要P-000324.这是我的代码 ?php$getURL = file_get_contents('http://realestate.com.kh/residential-for-rent-in-phnom-penh-daun
我尝试使用XPath string-after来获取Property ID之后的数据:但结果不是我想要的.它显示了与Property ID匹配的所有结果.我只想要P-000324.这是我的代码
<?php $getURL = file_get_contents('http://realestate.com.kh/residential-for-rent-in-phnom-penh-daun-penh-phsar-chas-2-beds-apartment-1001192296/'); $dom = new DOMDocument(); @$dom->loadHTML($getURL); $xpath = new DOMXPath($dom); echo $xpath->evaluate("normalize-space(substring-after(.,'Property ID:'))"); 那么我怎样才能让它只得到一个第一个结果呢? 解决方法
您可以更改XPath表达式,以便仅在第一次出现包含Property ID的p后选择字符串:使用位置索引([1]).
例如,以下XPath表达式将仅选择直接包含字符串’Property ID:’的第一个段落: (//p[contains(text(),'Property ID:')])[1] 将此与您的请求放在一起,只返回“Property ID:”后面的字符串,但除了P-000324字符串之外没有任何内容: echo $xpath->evaluate("normalize-space(substring-before(substring-after((//p[contains(text(),'Property ID:')])[1],'Property ID:'),'–'))"); 将按要求回应P-000324. 更新:这解决了最初提供的原始页面的问题,但根据评论,目标似乎更广泛.更健壮的解决方案是仅使用第一个表达式来获取包含“Property ID”的第一个段落的字符串,然后在属性id的正常形式上的标签之后立即执行正则表达式模式匹配,或者围绕属性id的正常形式的分隔符.您将不得不使用托管语言的正则表达式工具,因为XPath 1.0的字符串处理功能非常有限; XPath 2.0更好,包括正则表达式功能. (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |