如题
比如 xml.dom, json, bs4 这些解析库的原理谁能详细说说?
瞄了瞄bs4的源码,看得头大,谁能简洁的说一说?
我记得Python基本编程这本书里有提到过如何写一个文本解析器的。
Python的Lib中自带有html的解析,HTMLParser
我想读这个中能会更容易一点。
解析这些格式和编译原理的语法分析差不多吧。
先做成token,然后在进入状态机,生成解析树什么的。
如题
比如 xml.dom, json, bs4 这些解析库的原理谁能详细说说?
瞄了瞄bs4的源码,看得头大,谁能简洁的说一说?
我记得Python基本编程这本书里有提到过如何写一个文本解析器的。
Python的Lib中自带有html的解析,HTMLParser
我想读这个中能会更容易一点。
解析这些格式和编译原理的语法分析差不多吧。
先做成token,然后在进入状态机,生成解析树什么的。