事情是这样的,最近学校里有很多知识竞赛,在网络上答题,想想是很简单麻( ̄∀ ̄) 大家可能都发现了,搜出来的问题有很多一模一样的原题。。。但是排在百度头条的基本都是什么资料网,上学吧这样的需要付费才能看答案的网站Ծ‸Ծ(知识不是共享的麻)其余什么文库里找到的好多都没有答案。。。于是萌生了这样的想法,买个一个月的会员,把这样网站上的题和答案爬下来。
目前会的东西: python requests,xpath
就是说我希望能够提高爬虫的性能,各位 v 友能不能知道一下进阶方法,推荐一些合适额爬虫 demo 或者推荐框架。 还有就是关于数据储存,有没有第三方网站适合来存储这样的数据呢?感谢各位(>ω<)
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.