加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 资源网站 > 资源 > 正文

python – 仅在具有特定文本的标记之后查找某些类的所有标记

发布时间:2020-12-14 22:57:19 所属栏目:资源 来源:网络整理
导读:我在HTML中有一个很长的长表,因此标签不会彼此嵌套.它看起来像这样: 所以首先我要搜索树以找到“B”.然后我想在B之后使用类y获取每个td标记的文本,但是在下一行表以“C”开始之前. 我试过这个: results = soup.find_all('td')for result in results: if re

我在HTML中有一个很长的长表,因此标签不会彼此嵌套.它看起来像这样:

所以首先我要搜索树以找到“B”.然后我想在B之后使用类y获取每个td标记的文本,但是在下一行表以“C”开始之前.

我试过这个:

results = soup.find_all('td')
for result in results:
    if result.string == "B":
        print(result.string)

这让我得到了我想要的字符串B.但是现在我想在此之后找到所有这些并且我没有得到我想要的东西.

for results in soup.find_all('td'):
    if results.string == 'B':
        a = results.find_next('td',class_='y')

这给了我’B’之后的下一个td,这就是我想要的,但我似乎只能获得第一个td标签.我想抓住所有具有类y的标签,在’B’之后但在’C’之前(C没有在html中显示,但是遵循相同的模式),我想把它放到列表中.

我的结果列表是:

[['I want this'],['and this'],['and this']]
最佳答案
基本上,您需要找到包含B文本的元素.这是你的出发点.

然后,使用find_next_siblings()检查此元素的每个tr兄弟:

start = soup.find("td",text="B").parent
for tr in start.find_next_siblings("tr"):
    # exit if reached C
    if tr.find("td",text="C"):
        break

    # get all tds with a desired class
    tds = tr.find_all("td",class_="y")
    for td in tds:
        print(td.get_text())

测试您的示例数据,它打印:

I want this
and this
and this
and this

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读