爬虫抓取高校官网公开信息

2017-12-14 11:31:51 +08:00
 sweetcali
教师的邮箱,姓名,职称,学院,系或学科,联系方式。
要求就是官方公开的信息即可,扒下来统计到 EXCEL 即可
北京,上海,广州,深圳,南京,苏州,武汉,成都
这 8 个城市的重点高校,一本二本即可。
一毛一条,按照上面规范的话,给多少要多少,数据我们会作验收审核,所以要在 excel 里体现抓取来源,抓取日期等。
这个很没水平,但是如果有愿意的话,可以联系我一下
1482 次点击
所在节点    外包
36 条回复
jatesun
2017-12-14 20:33:52 +08:00
按学校来还差不多,一个学校 1000。→_→
xingzheduan
2017-12-14 21:27:11 +08:00
我感觉一毛一条太便宜了因为每个学校的网页是不同的,意味着可能要根据不同的网页写相对应的爬取规则
402124773
2017-12-14 21:33:46 +08:00
最近在家闲着,wx:13267223917
juedi998
2017-12-14 21:44:37 +08:00
表示有心无力啊,一毛一条真的廉价了些,网页太多啦,
TICE
2017-12-14 21:48:18 +08:00
@sweetcali 微信 /QQ: MTQ0ODE4MzkwMw==
wh01096045
2017-12-14 21:54:26 +08:00
@sweetcali 微信:15578146934
cszchen
2017-12-14 22:10:44 +08:00
这跟人工录入没太大区别吧
msl12
2017-12-15 00:35:27 +08:00
@lsxiao 你这搞出个答案就没什么意思了...
zzl
2017-12-15 10:50:09 +08:00
微信:zhili124
linuxchild
2017-12-15 10:56:53 +08:00
@leyle 嘿嘿,可能大家都是练手吧。

这东西反正没什么技术含量,纯粹是体力活,毕竟每个学校的规则都不一样
wjx1993
2017-12-15 12:38:31 +08:00
@linuxchild 也对,体力活,小心身体吃不消😂
JayFang1993
2017-12-15 13:50:19 +08:00
体力活 每个学校官网也不统一~~~~
jssyxzy
2017-12-18 10:25:05 +08:00
我可以看看,还收人不,另外怎么防止不同的人抓取重复呢
hidder
2017-12-18 15:55:15 +08:00
@sweetcali 加我微信 gf5824119
itsql
2018-01-18 21:57:17 +08:00
我有相关的数据,可以合作,请联系我
NotNil1
2018-01-22 16:27:21 +08:00
直接用手把,写爬虫也快不了多少的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/414633

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX