为什么一个“完全靠抄”的项目和教程能在这里火?

2019-03-30 19:06:03 +08:00
 Abbeyok

针对的是本站某个帖子:

首先是一个用 Python 登录各网站的项目: https://tanronggui.xyz/t/541855

可以看出都是从网上找来的代码,而且很多都是未经过验证就放上去了,没想到这个还能有 5k star ??

然后是作者所谓的教程: https://tanronggui.xyz/t/550157 看一下所谓的教程: https://github.com/CriseLYJ/Python-crawler-tutorial-starts-from-zero/blob/master/%E7%88%AC%E8%99%AB%E9%A2%84%E5%A4%87%E7%9F%A5%E8%AF%86.md 随便搜索一句话:

随便进一篇文章: http://www.zhongruitech.com/692280656.html

左边是 github 的文章,右边是搜到的文章

请问这样一个完全靠“抄”的项目和教程真的很好吗?

17179 次点击
所在节点    问与答
165 条回复
envylee
2019-03-31 01:51:19 +08:00
@Terry05 对啊,妈的 V 站的流量原来这么牛逼,真的厉害。
lynskylate
2019-03-31 02:12:30 +08:00
爬虫本身小白就多,入门简单,需求又大,大部分网站反爬措施弱智,天花板相对也低。
widewing
2019-03-31 02:14:26 +08:00
@CriseLYJ 兄弟你心态爆炸我也是能理解的,只当是有则改之吃一堑长一智吧。想要站在聚光灯下就要事先做好准备,是吧
likuku
2019-03-31 02:51:30 +08:00
@widewing 他项目说明页底部可俗气得挂着 “非喜勿喷”呢,指望有这种观点的人自信大度荣辱不惊(成熟公众人物)?
Humorce
2019-03-31 04:44:11 +08:00
once you go python , you are the part of python .

也许这就是 Python 的命运。
loading
2019-03-31 06:36:42 +08:00
@Terry05 你看错了,另外一个,目前还是 5.6k start
sergiojune
2019-03-31 06:39:13 +08:00
终于有人说出我的心声了,我一直想说他那个 5k+的项目就是抄的,而且转载了还不注明来源,不过我也忍了,毕竟现在抄袭太多,说不了太多,继续做好自己即可,借机推荐下自己的项目,每周一爆,逆向 JS[破解各种网站的 JS [知乎] [豆瓣][拼多多][Incapsula-CDN],持续更新]( https://github.com/SergioJune/Spider-Crack-JS),欢迎 star,会持续更新,可能会有点慢。
Abbeyok
2019-03-31 07:34:26 +08:00
@icekingcy 是的,甚至我一度怀疑该作者是买了 star
Abbeyok
2019-03-31 07:42:17 +08:00
@azh7138m 可以去看代码,可能这里没有仔细说代码的项目。网上收集+未经验证+不注明来源
irainsoft
2019-03-31 07:49:29 +08:00
有点搞不懂,收集和抄在这个事件里面不是一样的意思吗...

上一页作者的暴脾气也是厉害,写这种东西出于严谨应该标注任何非自己原创的东西,哪怕是什么官方文档复制来的东西也应该标注来源
miao1007
2019-03-31 08:19:29 +08:00
在 GitHub 上用扩展把 Chinese 字符串的项目给 block 了,世界就清净了。虽然有些极端,但是方便
Abbeyok
2019-03-31 08:33:25 +08:00
@irainsoft 然后总是把自己的过错推到别人身上,我也是醉了
okwork
2019-03-31 08:48:00 +08:00
@Senventise
知识在一定程度上,是可以区分原创和二次整理创作的。我指的是谷歌也不算原创,但在二次整理创作方面做的很好啊。

@Love4Taylor
你了解下欧美几千家媒体和出版社抗议谷歌的情况,谷歌新闻、谷歌图书都怎么干的,没你认为的那么不 evil。
MrCard
2019-03-31 09:19:34 +08:00
这样抄伤害的是认真写代码的人,写好一个功能不容易,改个 BUG 就得花上一整晚,别人按两个键就复制过来还顺手把作者改成了自己
看到这样一个项目有 5k 我是挺酸的,因为太容易了,但我看到 vue 怎么一点也不酸
Abbeyok
2019-03-31 09:30:05 +08:00
@MrCard 没错,顺手一复制就把代码归到了自己手下,嘴上说“我已经说了是收集的”就想把责任推了,还要求别人不能责怪他
abmin521
2019-03-31 09:31:01 +08:00
@okwork #113 不得不说 维基,谷歌一定程度打破了信息不对称, 不过他们可以禁止谷歌的爬虫 Deny *
Akiyu
2019-03-31 09:31:33 +08:00
@hasaki1997
你没有从原作者的角度来考虑这个问题

如果仅仅是拿来借鉴, 组合再一起, 就能获得那么多的 star 的话, 就没有人愿意去创新
(star 不是证明一个项目含金量的绝对手段, 但是大多数人在初次接触时, 都会选择 star 较多的)
这样的教程的确方便了别人, 但是造成这个方便的是这些东西的真正作者
而借鉴却不标明来源, 原作者就得不到应有的回报
greatghoul
2019-03-31 09:32:09 +08:00
ifxo
2019-03-31 09:33:18 +08:00
全是抄的,无中生有可能吗
okwork
2019-03-31 09:45:14 +08:00
@abmin521 #116 谷歌开始搞 news,books 是抡起袖子就搬,根本没和人家商量。早期互联网缺少内容,流行避风港原则,先搞了再说,等你投诉再撤。现在信息都互联网化了,大家发现优质内容必须要得到版权尊重,否则就是垃圾泛滥。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/550323

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX