我要匹配html的一个<div class>这个标签,但是这个网页里有很多其他的div标签,比如<div class='article'>这样的标签。我不需要其他的div,我就要匹配div class,那么该如何匹配?
from bs4 import BeautifulSoup
soup = BeautifulSoup(html,"lxml")
art = soup.find("div",attrs={"class":"article"})
print art
BeautifulSoup指哪打哪.
额,你用的解析库是什么呢?不是直接用正则解析整个页面吧?把问题描述详细点
^\<div class\>$
利用行首、行尾限定符来精确匹配即可。
可以试试 beautifulsoup
建议使用XPath