google 搜中文太毒了吧,是不是已经放弃中文搜索了

2021-10-09 10:14:19 +08:00
 weiwenhao

http://asset.eienao.com/20211009101236.png

这种垃圾搜索信息是不是能赚很多钱,我看里面都是广告,实现成本高吗。 就我搜索这个内容,google 出了 100 条,有 95 条都是小 xx 知识网,而且网址都不同,根本屏蔽不完

30187 次点击
所在节点    Google
201 条回复
litao3rd
2021-10-10 11:27:55 +08:00
近期发现 google 上用中文搜索很多技术问题首页几乎都是各种 StackOverflow 的机翻页面,无力吐槽。

现在几乎只用 google 英文搜索了
JeffGe
2021-10-10 11:44:54 +08:00
我很疑惑 Google 中文用户现在很多吗,多到值得他们去做内容农场盈利?阴谋论一点会不会现在这个和 08 年搜索联想投毒事件差不多,给舆论造势用的?
SJ2050cn
2021-10-10 11:46:34 +08:00
最近是真的多,使用 ublocklist 后,谷歌中文搜索一页就剩了 1 、2 项,还是用百度搜中文,谷歌搜英文吧。
yazinnnn
2021-10-10 11:48:01 +08:00
但是百度被阿里云 腾讯云 华为云污染啊。。。

不如学门外语,看外语资料过活了(我现在是在谷歌搜英文和日文资料
litesoar
2021-10-10 12:03:19 +08:00
是不是每个人的搜索结果还不一样?
zvl0reqglvd
2021-10-10 12:16:52 +08:00
不用屏蔽广告的插件吗?
goodhellonice
2021-10-10 12:32:14 +08:00
这个搞的人真是绝了。。。乌鱼子
gujun1225
2021-10-10 12:55:41 +08:00
@litesoar 我看到的结果跟你一模一样。我也很奇怪。因为我这里 Google 的中文结果质量其实也很高。不排除百度水军?
bwangel
2021-10-10 13:17:21 +08:00



@litesoar 你开了 广告屏蔽插件吗?为什么咱俩的结果不一样
bwangel
2021-10-10 13:21:54 +08:00
啊,我刚刚改了搜索设置,把区域改成了美国,就看到正常结果了。
smallthing
2021-10-10 13:42:12 +08:00
1.google 的区域
2.你是否登录了账号
我的是没有这些的
secondwtq
2021-10-10 13:52:34 +08:00
我用同一个帐号,在 iPad 上需要翻两三页才看到大量这个站群的结果,在 PC 上一突开就满脸都是 ... 看起来 Google 在这种奇怪的地方下了不少功夫
另外对于用户来讲,这个最好的手段应该是在服务器端把结果过滤掉,就不会出现“过滤之后首页根本没有结果”的现象了,不过 Google 貌似没有直接提供一个域名的全局黑名单。最骚的是这个站对“-知识网 -百科网”的关键词完全免疫,观察之后,用“-上一篇”把它干掉了(明明“百科网”在标题和正文里面都有,可能 Google 给文本分了词?虽然其实中文不需要这么干)。不过这个关键词居然貌似没有误伤 CNBlogs 。

对于这个关键词(“c 语言二进制输出 -上一篇”)来讲,我的搜索结果中唯一值得关注的只有 CNBlogs,其实还有 CSDN 和百度知道的不少结果,但是这种结果会不会仔细去看就是个人喜好了。不过我最希望 Google 给出的其实是这个:
https://zhihu.com/question/438434182/answer/1699713812 C 语言中为什么没有直接提供二进制数的输出? - 暮无井见铃的回答 - 知乎 看到 jajuju 的这个答案,我这个实验就算没白做。
可惜在 Google 给出的一共不到一百个结果中,并没有这个结果(只有个知乎专栏的),好消息是如果你 site:zhihu.com 的话还是能找到的,我就是这么找到的。可见结果权重排序基本是乱的。

从实际的角度来说,要想最大限度地“净化”搜索结果,那么应该可以搞一个白名单,Google Custom Search 貌似是可以这么做的,把 reddit.com wikipedia.org zhihu.com bilibili.com youtube.com bbs.nga.cn v2ex.com chiphell.com 等一干网站加进去就行了。这几个差不多 cover 了我需要的简体中文内容的一大半,另外还有百度贴吧,百度的结果明显比 Google 要好,这个没救。
(我注意到 Google 还喜欢:对于同一个域名的结果,只显示他认为最 relevant 的,剩下的不给你看,或者有但是在二级页面里而不是全给你直接列出来。如果中文网络内容确实如此中心化的话,在 Google 这种策略下域名白名单反倒是更优的选择)
这么搞有一个直接的缺点就是干掉了所有的独立博客,这个是没法穷举的。但是我发现好像就算不加任何过滤,中文独立博客的结果也很有限,所以直接大网站白名单好像也不会差太多。
一个典型的例子是,刚才那个关键词几乎没有来自 github.io 的结果。但是单独 site:github.io 的话可以发现并不是没有有用的结果(虽然不多,大概是被“-上一篇”给干掉了)。鉴于确实有不少人往 github.io 上放博客,所以独立博客作者可以考虑往 github.io 上扔个副本然后链到主站,这样不需要审查,也算是间接 SEO 。
idragonet
2021-10-10 13:57:25 +08:00
默认搜索也是这样的垃圾结果,改为美国正常了。
soraginko
2021-10-10 14:31:34 +08:00
你不能还想马儿跑,还不让马儿吃草
RangerWolf
2021-10-10 15:27:20 +08:00
习惯用英语搜索就好了。。。
RangerWolf
2021-10-10 15:27:32 +08:00
没想到其他什么好的办法
ipwx
2021-10-10 15:51:57 +08:00
曾经我让一个新来的实习生去装一下 proxmox 虚拟机平台,上面配置一套 ubuntu 20.04 的快速创建虚拟机的方案。然后他离职了,因为他在培训班没上过 proxmox 和 ubuntu,在中文技术圈也没多少这方面的资料。

他走的原因:我不懂英文。
ipwx
2021-10-10 15:53:45 +08:00
真的就很气,做 Linux 运维居然不懂英文?碰到新的软件包问题不能解决你歇菜嘛?
ezreal
2021-10-10 16:19:28 +08:00
呼吁赶紧立法禁止垃圾站
wsc449
2021-10-10 16:33:49 +08:00
放心,这种站早晚被 K

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/806592

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX