刚学正则
很简单的获取jpg格式的图片
查看网页源码,jpg的URL就是
"thumbURL":"http://xxxxxxxxx.jpg",
"middleURL":"http://xxxxxxxx.jpg",
就是"XXXURL:"http://xxxx.jpg"
请问正则表达式怎么配?
我用这个r'".+?URL":"(.+?\.jpg)"'
不行 // 没有控制URL前的字符数量
用这个r'"[a-z]+URL":"(.+?\.jpg)"'
也不行 //这个URL前的字符只有一个,根本不能匹配
可以啊,怎么不行?
>>> import re
>>> res = re.match(r'".+?URL":"(.+?\.jpg)"', '"thumbURL":"http://xxxxxxxxx.jpg"')
>>> res.groups()
('http://xxxxxxxxx.jpg',)
用这个r'".+?URL":"(.+?\.jpg)"'
发生如评论的结果是因为URL前的.+?没有限制匹配字符数量。
所以改用这个r'"[a-z]{5,8}URL":"(.+?\.jpg)"'
将URL前的字符数量控制在5-8个字符,这样就能匹配出正确的了