首页 > python正则表达式

python正则表达式

刚学正则
很简单的获取jpg格式的图片
查看网页源码,jpg的URL就是
"thumbURL":"http://xxxxxxxxx.jpg",
"middleURL":"http://xxxxxxxx.jpg",
就是"XXXURL:"http://xxxx.jpg"
请问正则表达式怎么配?
我用这个r'".+?URL":"(.+?\.jpg)"'不行 // 没有控制URL前的字符数量
用这个r'"[a-z]+URL":"(.+?\.jpg)"'也不行 //这个URL前的字符只有一个,根本不能匹配


可以啊,怎么不行?

>>> import re
>>> res = re.match(r'".+?URL":"(.+?\.jpg)"', '"thumbURL":"http://xxxxxxxxx.jpg"')
>>> res.groups()
('http://xxxxxxxxx.jpg',)

用这个r'".+?URL":"(.+?\.jpg)"'发生如评论的结果是因为URL前的.+?没有限制匹配字符数量。
所以改用这个r'"[a-z]{5,8}URL":"(.+?\.jpg)"'将URL前的字符数量控制在5-8个字符,这样就能匹配出正确的了

【热门文章】
【热门文章】