使用正则 清除字符串中 指定标签 以外的所有 html 标签

发布时间:2022-06-20 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了使用正则 清除字符串中 指定标签 以外的所有 html 标签脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

Python 使用正则 清除字符串中除了 <sub>...</sub><sup>...</sup> 以外的所有 html 标签

指定标签内无其它标签

import re


def sub_replace(match_obj):
    # print(type(match_obj), match_obj)
    tag = match_obj.group()
    if 'sub>' in tag or 'sup>' in tag:
        return tag


text = "<a>测试</a><sub>--sub标签内容--</sub><div>测试</div><sup>--sup标签内容--</sup><div>测试测</div>"

# re.sub 可传入 一个可调用对象
regex = re wangt.cc pile(r'(<?[^>]+>)')
result = regex.sub(sub_replace, text)
print(result)  # <sub>--sub标签内容--</sub><sup>--sup标签内容--</sup>

指定标签内有其它标签

import re

text = '<a>1111111</a><sub>--sub标签内容--<div>aaaa</div></sub><img>2222222</img><sup>--sup标签内容--<div>aaaa</div></sup>'
result = re.sub(r'<(?!sup|sub)([^>]+)>.*?</1>', '', text)

print(result)  # <sub>--sub标签内容--</sub><sup>--sup标签内容--</sup>

脚本宝典总结

以上是脚本宝典为你收集整理的使用正则 清除字符串中 指定标签 以外的所有 html 标签全部内容,希望文章能够帮你解决使用正则 清除字符串中 指定标签 以外的所有 html 标签所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。
标签: