PHP, Python, Node.js 哪个比较适合写爬虫?
admin 9年前 (2014-06-03)
我在知乎关于《PHP, Python, Node.js 哪个比较适合写爬虫? 》做的回答 主要看你定义的“爬虫”干什么用。 1、如果是定向爬取几个页面,做一些简单的页面解析,爬取效率不是核心要求,那么用什么语言差异不大。 当然要是页面结构复杂,正则表...
admin 9年前 (2014-06-03)
我在知乎关于《PHP, Python, Node.js 哪个比较适合写爬虫? 》做的回答 主要看你定义的“爬虫”干什么用。 1、如果是定向爬取几个页面,做一些简单的页面解析,爬取效率不是核心要求,那么用什么语言差异不大。 当然要是页面结构复杂,正则表...
几个在python下用于处理模板文件或解析html页面的工具集合,也即所谓的“Screen Scraping”。比用python 基础包的robotparser及htmlparser方便多了,也比直接用正则表达式效率高多了...