首页 > Python正则表达式问题

Python正则表达式问题

我要匹配html的一个<div class>这个标签,但是这个网页里有很多其他的div标签,比如<div class='article'>这样的标签。我不需要其他的div,我就要匹配div class,那么该如何匹配?


from bs4 import BeautifulSoup
soup = BeautifulSoup(html,"lxml")
art = soup.find("div",attrs={"class":"article"})
print art


BeautifulSoup指哪打哪.


额,你用的解析库是什么呢?不是直接用正则解析整个页面吧?把问题描述详细点


^\<div class\>$

利用行首、行尾限定符来精确匹配即可。


可以试试 beautifulsoup


建议使用XPath

【热门文章】
【热门文章】