爬虫学习(3)
使用正则表达式来提取信息不是非常方便,而通过html的节点可以方便的定位,通过XPath和CSS选择器可以方便的提取节点,然后调用相应方法来获取想获取的内容。这一过程可以通过解析库来完成。比较厉害的解析库有lxml、Beautiful Soup、pyquery。
XPthXML Path Langu
...
Book思议在划水