分享个好玩的,看 19 年哪个大学的学生在 github 提交最多

2020-03-27 17:01:16 +08:00
 sakila

referencehttps://www.gharchive.org/

how to use:

code:

SELECT REGEXP_EXTRACT(email, r'@(.*)') domain, COUNT(*) c
FROM (
  SELECT REGEXP_EXTRACT(payload, r'([a-zA-Z0-9_.+-]+@[a-zA-Z0-9-]+\.[a-zA-Z0-9-.]+)') email
  FROM `githubarchive.year.2019`
)
-- WHERE REGEXP_CONTAINS(email, r"@[a-zA-Z0-9-]+\.[a-zA-Z0-9-]")
WHERE REGEXP_CONTAINS(email, r"@[a-zA-Z0-9-]+\.edu")
GROUP BY 1
ORDER BY 2 DESC
LIMIT 500;

result - wordwide:

result - chinese universities:

5836 次点击
所在节点    分享发现
32 条回复
ldm0
2020-03-28 04:40:26 +08:00
我组成了我校的十五分之一???
telnetning
2020-03-28 07:22:43 +08:00
楼主怕是不知道某些高校甚至不提供邮箱或者很难申请到
cht
2020-03-28 08:47:28 +08:00
想 cv 一下结果花了五分钟都没注册好 😔
Kirscheis
2020-03-28 09:00:06 +08:00
清华的学生邮箱是一串乱码一样的缩写,不能自己设置别名,所以学生不习惯用。北大的邮箱可以设置 3 个别名,稍微比清华的好用一点。不过我这很多人都常用自己的域名邮箱,我早年 github 上也用的 pku 邮箱,后来换成个人域名了,所以靠邮箱后缀并不怎么准。。
alphatoad
2020-03-28 09:12:34 +08:00
我校毕业后会收回邮箱,不是很乐意用
jackchao7432
2020-03-28 09:55:57 +08:00
样本不合理,所以这是一个没有意义的统计
Woodywuuu
2020-03-28 09:56:59 +08:00
我校估计是最低的
因为我校邮箱毕业不回收,可以拿去各处薅羊毛
在 github 认证的时候会提示我上传学生证作为佐证:doge
qwertqwert12345
2020-03-28 10:43:27 +08:00
说样本不合理的人,可以想一想怎么才能囊括所有

我直接说:不可能
miona
2020-03-28 16:33:47 +08:00
学校邮箱安全么?
CismonX
2020-03-28 16:50:27 +08:00
@Woodywuuu 我怀疑我们是校友🤣
tianxin8431
2020-03-29 17:39:47 +08:00
竟然能看到我校+1 。。。
sakila
2020-04-07 20:25:31 +08:00
@jackchao7432 样本不合理,所以这是一个没有意义的统计
-------
确实不合理,确实意义小,看个乐呵就行

@qwertqwert12345 说样本不合理的人,可以想一想怎么才能囊括所有

我直接说:不可能
-------
同意, 基本不能囊括所有人, 特别是 github 不像 linkedin, google scholar 有明确的个人认证机制

@telnetning 楼主怕是不知道某些高校甚至不提供邮箱或者很难申请到
-------
我还真不知道有的高校不提供邮箱, 直觉不太可能吧
即使邮箱在中国高校不怎么常用, 不至于没有吧

@cht1995 想 cv 一下结果花了五分钟都没注册好 😔
-------
哈哈复现过程比较复杂, 代码的技术含量并不复杂

@Perry 很多学校自建 GitLab 或者 GitHub Enterprise,这些信息应该不是公开的?
-------
同意 不过内网的东西 谁也拿不到吧

@fengyiqicoder 大部分经常编程的同学还是会用学校邮箱的,毕竟有免费的高级帐号可以用
-------
对 比如我 但是我校 laji 邮箱死活收不到 github 验证 于是作罢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/656853

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX