最新消息:

标签:python

技术

PHP, Python, Node.js 哪个比较适合写爬虫?

admin 10年前 (2014-06-03)

我在知乎关于《PHP, Python, Node.js 哪个比较适合写爬虫? 》做的回答 主要看你定义的“爬虫”干什么用。 1、如果是定向爬取几个页面,做一些简单的页面解析,爬取效率不是核心要求,那么用什么语言差异不大。 当然要是页面结构复杂,正则表...

技术

几个Python下用于screen scraping的工具集

17年前 (2007-10-10)

几个在python下用于处理模板文件或解析html页面的工具集合,也即所谓的“Screen Scraping”。比用python 基础包的robotparser及htmlparser方便多了,也比直接用正则表达式效率高多了...