php – 如何在XPath中仅返回第一个匹配结果？

发布时间：2020-12-13 16:58:28 所属栏目：PHP教程来源：网络整理

导读：我尝试使用XPath string-after来获取Property ID之后的数据：但结果不是我想要的.它显示了与Property ID匹配的所有结果.我只想要P-000324.这是我的代码 ?php$getURL = file_get_contents('http://realestate.com.kh/residential-for-rent-in-phnom-penh-daun

我尝试使用XPath string-after来获取Property ID之后的数据：但结果不是我想要的.它显示了与Property ID匹配的所有结果.我只想要P-000324.这是我的代码

<?php
$getURL = file_get_contents('http://realestate.com.kh/residential-for-rent-in-phnom-penh-daun-penh-phsar-chas-2-beds-apartment-1001192296/');
$dom = new DOMDocument();
@$dom->loadHTML($getURL);
$xpath = new DOMXPath($dom);

echo $xpath->evaluate("normalize-space(substring-after(.,'Property ID:'))");

那么我怎样才能让它只得到一个第一个结果呢？

解决方法

您可以更改XPath表达式,以便仅在第一次出现包含Property ID的p后选择字符串：使用位置索引([1]).

例如,以下XPath表达式将仅选择直接包含字符串’Property ID：’的第一个段落：

(//p[contains(text(),'Property ID:')])[1]

将此与您的请求放在一起,只返回“Property ID：”后面的字符串,但除了P-000324字符串之外没有任何内容：

echo $xpath->evaluate("normalize-space(substring-before(substring-after((//p[contains(text(),'Property ID:')])[1],'Property ID:'),'–'))");

将按要求回应P-000324.

更新：这解决了最初提供的原始页面的问题,但根据评论,目标似乎更广泛.更健壮的解决方案是仅使用第一个表达式来获取包含“Property ID”的第一个段落的字符串,然后在属性id的正常形式上的标签之后立即执行正则表达式模式匹配,或者围绕属性id的正常形式的分隔符.您将不得不使用托管语言的正则表达式工具,因为XPath 1.0的字符串处理功能非常有限; XPath 2.0更好,包括正则表达式功能.

（编辑：李大同）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!