天行健
君子以自强不息

python编程教程 如何使用beatuiful soup只去除指定标签tag节点而不影响子节点内容

    我在使用python的beatuiful soup的时候,遇到了这样一个需求,那就是如果只去除特定的标签节点,而不影响该tag节点的子节点内容,我们来举个例子吧,比如下面的内容中,我们需要将外层的div标签去掉,只保留内层的超链接子节点的时候,我们应该怎么办呢?通过我的寻找和测试发现,其实有一个beatuiful soup内部函数就是为了实现这个功能,那就是unwrap()函数,从字面意思上也很好理解,那就是解开包装,抽取其中的内容

<div class="cnt1">
    <a href="...">链接内容</a>
</div>

    具体的python实现代码如下所示,我们遍历所有类名为cnt1的div节点,然后将每一个节点进行抽取就可以了

[each_a.unwrap() for each_a in soup.find_all('a',class_='cnt1')]
赞(0) 打赏
未经允许不得转载:bituplink博客 » python编程教程 如何使用beatuiful soup只去除指定标签tag节点而不影响子节点内容
分享到: 更多 (0)

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏