去除 html 的區塊
html code
<div class="nav">
<p> navbar </p>
</div>
<div class="content">
<p> content </p>
</div>
如果要去除 <div class=”nav”>…</div> 這個區塊
import re
html = """
<div class="nav">
<p> navbar </p>
</div>
<div class="content">
<p> content </p>
</div>
"""
result = re.sub("<div class=\"nav\">[\s\S]*?<\/div>", "", html)
print(result)
參考資料
給自己的Python小筆記 — 強大的數據處理工具 — 正則表達式 — Regular Expression — regex詳細教學
Comments