要抄一个站,想把上面的源代码图片什么的都下下来,有什么好的工具?
打到你要的网站,然后Ctrl+S
全静态的站是可以的,动态的话后台逻辑你抄不到。
F12 resources
python是个很适合爬虫的语言,爬网页代码什么的更是几行代码就解决了,他有个专门的模块 urllib.request,我这用的是3.5的版本,具体的就不说了,网上到处都是,就几行代码而已。
有扒网站的工具 仿站小工具 V3.0
wget -r -p -np -k http://xxx.com/xxx
可以用远洋整站下载工具
网上的一些爬站工具,也是发送http request , 得到response , 程序的业务逻辑代码是不可能获取的,除非获得了网站的shell
ctrl+s即可。。
WinHTTrack, 很好用,爬下后可以在本地访问镜像站,所有图片和链接的指向都已经自动修正为本地已爬下的网页。也可以用来研究源码和移植为模板。
但你只能看到前端的代码,后台的逻辑显然只能自己摸索实现。
不过我觉得这并不是一个好需求。
Teleport Pro
可以搜下网站小偷
wget -r -c -p
除非全部是静态的