被垃圾网页激怒,做了个搜索工具 Luxirty Search : 无内容农场、无广告、干净、简洁、快、为程序员优化,开源、可自建,比 Google 好

128 天前
 studyingss

Luxirty Search

立即体验-> search.luxirty.com

一个搜索引擎,基于 Google ,屏蔽内容农场,无广告,干净,简洁,快。

如果想添加到浏览器中,搜索语法是 search.luxirty.com/search?q=

开源地址: https://github.com/KoriIku/luxirty-search

特性&功能

  1. 内置内容农场屏蔽,目前包括了 csbn 、华 x 云、百 xxx 智能、腾 x 云开发者等,还有一些 StackOverflow 翻译站。(欢迎提新的黑名单)

  2. 点击 For Program,一键提高 GitHub 、Stackoverflow 、v2ex 、cnblog 的权重,免去反复手打 site:github.com 的麻烦。(同样欢迎补充新域名,只需要发在回复里就好)

  3. 一键搜索 V2EX 、Raddit 。

真比 Google 好吗?

  1. 当然!因为本质上就是基于 google cse 所以搜索质量跟 google 一样好,再加上屏蔽了几个大垃圾,所以总体来说比 Google 好(逃

  2. 虽然用了 google ,但我直接把 Google 加载广告的 js 拦截了,所以应该也没广告。(

与 uBlackList, Hit by Hidden 这类工具有什么区别?

这些工具在前端屏蔽搜索结果,也就是等到内容农场已经出现在搜索结果中,再将其删除或隐藏。

而 Luxirty Search 通过配置 Annotations 让 Google 直接屏蔽垃圾网站,服务器在执行搜索时就已经将网站排除,可以理解为内置多条 '-site:domain.com' 。详细的可以看文档 https://developers.google.com/custom-search/docs/annotations

你这输入框等那么久才出来怎么好意思说快的

这是 Google CSE 的限制,我也没办法,用 search.luxirty.com/search?q= 体感上会稍微顺畅点。

不过出搜索结果是很快的。这里说的快还有一层意思是那几个优化标签用起来很方便,省掉了手动打 site:语法的过程。

基于 Google 说什么可自建?

(好吧是有点标题党,我谢罪,

但如果说这个项目本身,实际试一下原始 cse 页面就知道确实有必要自建这么个项目了。

这地址会长期维护吗?

纯静态页面,没啥成本,应该能长期用,不放心的话自建一个吧,两分钟就能搞定。

关于具体的部署方式,因为可能会经常变化,请查看项目 readme 。

存在的问题

无法根据时间片过滤,比如搜索一年以内的,cse 本身不支持。

不会根据语言和地区排序(好像某些情况下是个优点。)

其它

更多信息会写在博客 luxirty.com/posts/luxirty-search

13207 次点击
所在节点    分享创造
180 条回复
NoLifeRyan
128 天前
可否手动给域名加减权重、置顶、屏蔽🤓
studyingss
128 天前
@qwertty01 我不是太了解 nginx ,能详细说说怎么构建的吗?
studyingss
128 天前
@NoLifeRyan 这个需要你用自己的 cse 部署,然后自己去配置。
如果你的需求比较大众,可以直接提出来我加。
studyingss
128 天前
@seedhk 感谢反馈,我也遇到过类似问题,因为搜索框是通过 Google 的 js 加载的,如果 js 加载失败就不显示了,后面我看下能不能加个重试机制。
studyingss
128 天前
@tycallen 请问字体放大是什么?一个插件吗,无法复现的话也不太好调。
chenxuuu
128 天前
其实还有一小点可以改进:

点 a 标签之后默认跳转到的是有谷歌跟踪的 data-cturl 链接,会中转跳转一下,如果可以直接跳到 href 就好了
不知道能不能实现
rongsh
127 天前
@studyingss 使用 vercel 部署后,搜索出现 404: NOT_FOUND
qwertty01
127 天前
@studyingss #42 就是 pnpm build 构建的 但是因为 你搜索路径是 /search Nginx 找不到这个路径报 404 了

现在暂时可以通过把 根目录设置为 results 来避免
studyingss
127 天前
@rongsh
@qwertty01 感谢反馈,我后面测试下 Orz ,如果能修好也可以直接去提个 pr 。
studyingss
127 天前
@chenxuuu 非常感谢,理论上来说应该可以实现,我看一下。
应该只要把 data-cturl 这个属性删掉就可以了是吧。
v2user89
127 天前
楼主做的很棒, 目前在用 kagi,一直付费确实也挺贵的, 虽然那边的结果也还行
chenxuuu
127 天前
@studyingss #50 我控制台直接删是没问题的,不知道实际上能不能行:

```javascript
document.querySelectorAll('.gs-title > a').forEach(function(link) {
if (link.dataset.cturl) {
delete link.dataset.cturl;
}
});
```
studyingss
127 天前
chenxuuu
127 天前
@studyingss #53 测试完美

接下来的一点小建议:
拉到底部时自动加载下一页贴上去(无限滚动),可以省去翻页的操作
另外我发现搜索结果是有网站预览图的,后期考虑显示出来吗?

层主慢慢写,前端小白还没看懂这东西的原理 。晚上我研究下
blankmiss
127 天前
确实是个很新颖的工具
myxingkong
127 天前
一个冷知识:

在 Google 搜索设置里面将 语言和地区 改成 美国 和 英语。使用 英文关键字 进行搜索可以过滤绝大多数的内容农场,并且搜索结果质量显著提升。
studyingss
127 天前
@chenxuuu

ok ,现在可以自豪地加再加一句无跟踪了。

我也前端小白,原理就是用 css 改变默认元素的样式,只要会用 f12 和 chatgpt 就可以做到。
预览图其实默认就是显示的,隐藏是因为 Google 官方也没显示,显示出来也很丑,你可以在 main.css 里面看到所有关键内容。

自动翻页我也打算做,但暂时不知道怎么实现,因为底下那个页码它不是个链接,没有头绪。
hazoop
127 天前
不错不错,我搜了啥是不是都知道啦?
monkeyWie
127 天前
感谢
studyingss
127 天前
@rongsh 已解决,用最新版本就可以了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/1078147

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX