首页 > java爬取成绩单格式问题

java爬取成绩单格式问题

已经把爬取到的成绩单存成html文件了,但是格式和在网页里显示的不一样,排版很乱,请问还要爬取什么类型的文件来调整格式呢?


notepad++ 搭配 Tidy2 插件

排版乱不是什么大问题,主要是只找到你想要的数据并抓取就可以了。


应该是没有爬去到css样式表,你可以拿到基本的数据之后,使用正则或者jsoup进行过滤,将数据保存到数据库或者缓存中,自己重新编写网页,从数据库中取出来数据。


缺少css吧

【热门文章】
【热门文章】