re模块的re.VERBOSE可以把正则表达式写成多行,并且自动忽略空格。
但是我想匹配一个html页面中的链接,类似
<a href=“/xxx”>abc</a>
我用
re.compile(r'''<a href="\/(\S+)">(\S+)<\/a>''')
但是用
re.compile(r'''<a href="\/(\S+)">(\S+)<\/a>''', re.X)
就不能找到链接了,请问这是怎么回事?
因为带 re.X
标志的正则里的空格被忽略了,也就是
re.compile(r'''<a href="\/(\S+)">(\S+)<\/a>''', re.X)
等同于
re.compile(r'''<ahref="/(\S+)">(\S+)</a>''')
你在 re.X
时可以用 \
来转义空格,或者使用 \s
。另外,正则中的 /
是不需要转义的。