首页 > python mysql 抓取入库乱码

python mysql 抓取入库乱码

试了很多办法都无法解决
requests 获取
BeautifulSoup 解析
MySQLdb 入库
页面编码是 ISO-8859-1
数据库 编码是统一使用 utf8
目标内容直接写到文本中,可以正常显示

但是入库后就是乱码


BeautifulSoup 解析的时候得utf-8


问题已经解决了,原因是requests 获取的response 编码有些情况下不准确,强制解码 可是作为unicode 使用,但是入库时会出现异常,跟其他组件没有关系。

办法就是使用 chardet 再次检测 reponse.content的编码,指定给response

【热门文章】
【热门文章】