我昨天从 http://kfxx.info/ 下载了700M的csv文件,不知道怎么打开。
我从百度搜索,说是用excel电子表格可以打开,我下载安装了一个,但是,里面的汉字都是乱码。而且,打开的超级慢,有的时候会直接死机。
乱码是因为文件的字符编码和你使用的软件所认为的不一致,打开慢是因为你的文件太大了。
csv 即「逗号分隔的值」,是纯文本的,你可以用 Notepad++ 或者任意专业点的文本编辑器打开(并按需要变更字符编码)。如果想对这样的数据进行系统地处理,建议导入到数据库中处理,比如 PostgreSQL 或者 MariaDB(当然,你得会数据库)。
我对 http://kfxx.info 比较感兴趣。呵呵呵……
汉字乱码,其它不乱码,肯定是编码的问题。
Windows 下 excel 编码普遍是 gb2312 格式。可以将 csv 文件用记事本打开,然后另存为 ascii 就 OK 了。
将 csv 转换成 excel:
- java: https://github.com/daveti/excel2csv
- php: https://github.com/jacquesbh/phpCsv2excel
- ruby: https://github.com/anjlab/excel2csv-ruby
- c++: https://github.com/ferkulat/csv2xls
- ......
检查下编码。。。汉字一般是GBK或者UTF-8,推荐使用一些文本编辑器(ultraedit,notepad++,emeditor之类的)而非excel打开
用记事本打开,另存为ANSI编码格式保存。然后重新打开即可
第一、乱码
按照上面的解决方式,保存为 GB2312 格式就行。
第二、打开慢
因为文件太大,如果一次打开肯定慢。可以使用其它工具打开,比如 sublime 等。或者导入 mysql,主要就可以直接搜索了。
天涯妹妹,都好几天过去了,打开了吗?我已经帮你查完了: