加入收藏 | 设为首页 | 会员中心 | 我要投稿 李大同 (https://www.lidatong.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 综合聚焦 > 资源网站 > 资源 > 正文

Python模块BeautifulSoup提取锚点href

发布时间:2020-12-14 23:03:08 所属栏目:资源 来源:网络整理
导读:我正在使用BeautifulSoup模块以这种方式从html中选择所有href: def extract_links(html): soup = BeautifulSoup(html) anchors = soup.findAll('a') print anchors links = [] for a in anchors: links.append(a['href']) return links 但有时它失败了这个

我正在使用BeautifulSoup模块以这种方式从html中选择所有href:

def extract_links(html):
  soup = BeautifulSoup(html)
  anchors = soup.findAll('a')
  print anchors
  links = []
  for a in anchors:
    links.append(a['href'])
  return links

但有时它失败了这个错误信息:

Traceback (most recent call last):
File "C:pymain.py",line 33,in 
最佳答案
并非所有锚标签都具有href属性.在尝试访问该属性之前,应检查锚是否具有href.

if a.has_key('href')
  links.append(a['href'])

在这里查看了一些评论后,我认为这是处理这种情况的最pythonic方式.

(编辑:李大同)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读