HTML解析库 —— Request HTML 初体验

Request HTML

当我们做HTML解析的时候。我们通常用的是 BeautifulSoup 或者是 PyQuery。前一阵子request这个库的作者又写了一个html解析库。Github仓库上的描述写到:HTML Parsing for Humans。那么想必这个框架一定很人性化。本着试一试的态度,我尝试了一下用这个库去爬取 Gank.io 闲读 网页,的确非常好用。

优点

我们知道如果使用beautifulsoup去爬取网页的话,它会安装一个lxml依赖库。这个依赖库是为了做HTML解析的。而这次我们要介绍的request-html,是不需要这个依赖库。其次,它内部又与req......