最新消息:

标签:scraping

技术

htmlparser使用指南

admin 16年前 (2008-05-19)

需要做一个垂直搜索引擎,比较了nekohtml和htmlparser 的功能,尽管nekohtml在容错性、性能等方面的口碑好像比htmlparser好(htmlunit也用的是nekohtml),但感觉 nekohtml的测试用例和文档都比html...

技术

几个Python下用于screen scraping的工具集

17年前 (2007-10-10)

几个在python下用于处理模板文件或解析html页面的工具集合,也即所谓的“Screen Scraping”。比用python 基础包的robotparser及htmlparser方便多了,也比直接用正则表达式效率高多了...