自己写的 python 爬虫,开源出来

2014-02-21 17:24:27 +08:00
 wangfengmadking
前段时间把自己写的爬虫程序整理了一下,希望能构建一个简单易用的爬虫框架。现在已经有了基本框架. 采用的是requests + beautifulsoup。

现在的代码量还比较少,都是一些基本功能。就是把request和bf封装了一下。

https://github.com/numb3r3/crawler-python
8920 次点击
所在节点    Python
21 条回复
wangfengmadking
2014-02-24 18:49:11 +08:00
@blond lxml要比pyquery快很多

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/101261

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX