<td style="border:0px;"><b>
注1:</b>
机械设计课程设计(本)[16-18周]</td>
<td style="border:0px;"><b>
注2:</b>
</td>
我只是想匹配到第一个</td>,但是我写的正则表达式把后几个</td>都匹配到了。
这是我写的正则表达式
notes = re.findall(r'<td style=\'border:0px;\'><b>(.+?)</b>(.+?)</td>', body)
请问怎么只匹配到离</b>
最近的那个</td>
?
update:
貌似我这样写的话,如果</b>
和</td>
有内容的话,就可以匹配到,没内容的话就匹配不到,然后去匹配后面的</td>
去了。怎么才能做到没内容就返回''
这个空字符串?
再更:
放弃用正则了,用别的方法了
(.+?)
变成(.*?)