在做一个爬虫,从前端的angular传过来一个路由,路由有一个参,是一个网站的url,
http://localhost:3000/newslist/http://news.neusoft.edu.cn/2015/0402/4710.shtml
newslist/ 后面的就是url参数,我希望能提取这个参数,于是我这么写:
app.get('/newslist/:url', function (req, res) {
console.log('3')
var url = req.params.path;
console.log(url);
superagent.get(url)
.end(function (err, data) {
if (err) console.log(err);
但是这样写的路由无法捕获前端传过来的值,提示:
GET http://localhost:3000/newslist/http://news.neusoft.edu.cn/2015/0402/4710.shtml 404
Cannot GET /newslist/http://news.neusoft.edu.cn/2015/0402/4710.shtml
不知正确的写法应该怎么写,望大神指点~
express中的path解析用的是https://github.com/component/path-to-regexp,path是以/来分割目录的,也就是说形如/newslist/:url
中的url是不能再包含单斜杠的,否则就无法匹配到这个path规则,那么多个path中的参数怎么匹配呢,形如"/newslist/:page/:id"
当然这个并不是你的需求。其实你这个完全可以不用path传参,而用query形如
app.get('/newslist',function(req,res){
var url = req.query.url;
//TODO:other logic
})
然后访问http://localhost:3000/newslist?url=http://news.neusoft.edu.cn/2015/0402/4710.shtml
应该就可以了
前一个答案已经被采纳了,不过还有一种方式是hash,例如hash可以构造同样的参数。
http://localhost:3000/newslist#url=http://news.neusoft.edu.cn/2015/0402/4710.shtml
//js获取参数的代码:
function getQuery(query) {
query = query.replace(/[\[]/, "\\\[").replace(/[\]]/, "\\\]");
var expr = "[\\?#&]" + query + "=([^&#]*)";
var regex = new RegExp(expr);
var results = regex.exec(window.location.href);
if (results !== null) {
return results[1];
} else {
return false;
}
}
//调用方法获取参数
var name = getQuery('name');
//设置hash的代码
location.hash = '#name=' + PAGE_USER + '&type=shared';
利用hash的好处是通用,在浏览器也比较好处理这个~(≧▽≦)/~啦啦啦