一个科研狗开发的文献管理软件 Paperlib

2022-06-24 04:09:19 +08:00
 SorryChen

我是一个在计算机视觉里蝶泳的科研狗,一个文献管理软件基本是我的刚需。从硕到博这么多年用了各种各样的软件:Papers 、Mendely 、Readcub Papers 、Zotero ,没有一款能让我满意舒服的。


现有的软件

诚然这些软件都是伟大的软件,但是或多或少都有些小问题,比如:

  1. 无法精准的抓取到会议论文的发表情况
  2. 功能做的不咋地,一堆用不上的功能,每年太贵的订阅费 = =
  3. 太丑太丑了,像上个世纪的界面(没错说的就是你 zotero )
  4. ......

我想要的

而我想要的就是一个简简单单的论文管理软件:

  1. 他必须能精准地匹配到会议论文的发表情况。我认为这是一个文献管理软件最重要的功能。其他领域可能看期刊很多,但是像我们领域,大部分论文都是会议论文,我想 NLP 应该跟我们 CV 也差不多。但是会议不像期刊,很多都要很久才有 DOI ,有的甚至没有 DOI ,所以市面上的这些软件,几乎没有一个能很好的精准的匹配会议论文 metadata 的。我想要他精准匹配到是不是发表到 ICLR ICML NIPS ECCV 等会议上。而我不想每次写论文对对着一堆 arxiv publication 一个一个去搜他们发表在哪里的去做校对。
  2. 不需要什么花里胡哨的管理功能,就简单的 Tag ,Folder ,加星,Note 。
  3. 能够方便地进行检索,普通搜索,全文搜索,高级语法搜索,让我在开会时候想跟老师讨论一个论文的时候不需要手忙脚乱的去翻文件夹或者 Google 。。。
  4. 作为计算机行当,虽然 Github 的 star 能够收藏论文的代码仓库,但是并不容易找,更多时候还是去 google 。如果这个软件能帮我自动搜 code repository 然后存在软件里就好了。
  5. 当我准备开始写自己论文的时候,如果有方便的方式一键复制 bibtex 就好了。体验就好像打开 spotlight 输入关键词,直接回车粘贴。
  6. 它有一个简洁的 UI ,清晰的图标,至少看着不是上个世纪的。毕竟颜值就是生产力。

于是,一年多以前,在博士刚开始的时候,我就开始着手自己开发一个,符合上述需求的软件。

跟周围同学分享了一下,大家都觉得挺好用的。之前因为觉得不完美,害怕推广了之后自己没精力维护。经过一年多的打磨,这个软件也伴随我一年多的科研,加两次论文投稿。我已经把大部分功能做到我满意的地步了。所以在这里分享一下,给有同样需要的科研狗们!它就是 Paperlib !


Paperlib

使用简介

亮点

  1. 从 arXiv ,doi.org ,DBLP ,IEEE ,openreview.net ,PaperwithCode ,Google Scholar ,为每一篇论文尽量匹配精确的信息以及代码仓库。
  2. 全文搜索,高级搜索。
  3. 快速导出,一键复制 BibTex 。
  4. 为论文评分,分配标签、文件夹,加星,方便进行分类管理。
  5. 可以云同步数据,macOS win 双平台。
  6. 完全开源。

缺点

  1. 这是按照我一个人的科研习惯打造的,我不确定是否大家用的习惯。
  2. 对比 zotero 这软件,说实话因为自己没怎么用,我可能还不知道它有什么极其强大的功能,也许 Paperlib 这里没有。
  3. 开发者只有我一个人,我无法像大公司那样按时修 Bug 。现在基本是就是我周末没事的时候修一修。(不过自己已经很久没遇到什么恶性 bug 了)
  4. 我的领域是计算机视觉,我不确定其他计算机领域的人,比如 NLP 啊,数据库啊,啥的,能不能准确匹配好论文元数据。如果不准确可以开 Issue ,在软件里我定义了一系列 metadata scrapers ,我们可以一起开发更多的符合计算机领域的。但是目前计划是仅仅覆盖到计算机领域。因为其他领域真的不了解。
  5. Electron 。关于 Electron ,可能大部分人都不喜欢吧。实际上 Paperlib 是有 macOS 原生 swiftUI 版本的 branch 的,完成了一些基础的功能。但是作为一个人开发的软件,平时又要科研,想要维护好 win 和 mac 双平台,实在是太难了。最后我只能转为使用 Electron 。如果有任何喜欢 Paperlib 想接手 swiftUI 版本的同学,我非常欢迎。现在我看了看资源占用实际上也没有很夸张,比 zotero 是小一些的。。。可能因为没那么多乱七八糟的功能吧。。

最后的最后,祝大家科研顺利吧!

网址: https://paperlib.app/en/

Github: https://github.com/GeoffreyChen777/paperlib

15872 次点击
所在节点    分享创造
287 条回复
shizhao
2022-06-24 19:01:34 +08:00
那啥,zotero 可以简单理解为业界的标准格式
SorryChen
2022-06-24 19:02:30 +08:00
@c0pper 就实验运行上了,不能干瞪眼等着结果吧。。就写写。。
SorryChen
2022-06-24 19:02:51 +08:00
@shizhao 可以说说什么意思吗?标准格式是指?
gdm
2022-06-24 19:25:32 +08:00
好像找不到怎么导入 bibtex ?
SorryChen
2022-06-24 19:26:55 +08:00
@gdm 您是指直接导入 bibtex 文件么?没有 PDF 那种?我设计的理念是,每一个论文词条都是依托于 PDF 的,所以如果你有这方面需要,可以考虑后面版本加一下。
1ychee
2022-06-24 19:30:53 +08:00
@SorryChen 您好,我们使用 @lizhi.io 域名邮箱给您 (cha***.che***@wa***.***.uk)发了一份邮件,您看看?

我们是一家正版软件代理商,想看看未来有无合作机会。
gdm
2022-06-24 19:33:40 +08:00
@SorryChen 是的,毕竟每个博士生都会维护着自己的参考文献列表
我平常读得比较勤快的期刊,pdf 都是导入不了的,只能自己写蜘蛛去爬人家的网站来做 bib 文件,大写的尴尬
SorryChen
2022-06-24 19:39:23 +08:00
@gdm 原来是这样,看来是我们领域不太相同,我们这领域基本 PDF 都可以下载。你的需求我会考虑的
gdm
2022-06-24 19:48:17 +08:00
@SorryChen 是毫无关系的两个领域
我这领域一堆古老的顶级 paper 要引,写论文蛮痛苦的
chuanqirenwu
2022-06-24 21:57:09 +08:00
博士科研之余还有精力开发软件吗?这执行力和精力让人佩服!
AkashicRecords
2022-06-24 22:02:50 +08:00
作为 Zotero 的用户,试用了一下。对比 Zotero ,这个作品优点是简洁美观,对 CV 领域信息匹配全是挺强的。非常佩服 OP 能够根据自己的需求实现一个这么优秀的作品。
不过,Zotero 它虽然 UI 丑,但是在插件的加持下确实还是好用一点。比如对中文文献的支持以及可以自定 CLS 的 Word 插件,在国内投论文的话,还是难以替代。除此之外,Zotero 6.0 版本还新增了内置的 PDF 阅读器以及 Markdown 格式的笔记(之前是难用的富文本编辑器……),这对仅需快速查阅一下的论文、记些东西时挺方便的。
看了 OP 之前的帖子,对 Zotero 的上述东西也没啥需求……除此之外确实也没啥值得特别提到的了?
SorryChen
2022-06-24 22:06:13 +08:00
@AkashicRecords 对的,zotero 的插件,让他有非常大的优势。这个项目是我一开始本来想弄个自己用的,只是后来慢慢成型了,觉得不分享一下挺可惜的。这个项目因为面向的面足够窄,所以才能让我专注于开发一个小领域的核心需求面,同时面对的问题就是应该无法适用每一个人的需求了。感谢你的使用和反馈。
zoumouse
2022-06-24 22:10:40 +08:00
能加个从 zotero 导入的功能嘛
SorryChen
2022-06-24 22:12:42 +08:00
@zoumouse 我得研究下 zotero 是怎么存的哈,不过最简单的话,就是全部 pdf 全选一下拖进去。
yhgogogo
2022-06-25 00:00:58 +08:00
留个眼,以后看看有没有 ipad os 版本
James369
2022-06-25 00:42:12 +08:00
看来 op 主做科研挺闲的嘛,哈哈
hamhamham
2022-06-25 01:32:24 +08:00
Zotero 的浏览器插件有个功能很好用,识别到各种出版商网站的时候自动启用学校的 VPN (不是专门的 VPN 软件,而是 ezproxy 那种在 url 前面加一串字符就能用的,比如 https://login.ezproxy.library.xxxxx.edu/login?url=)。这个在学校外看论文的时候非常有用。
SorryChen
2022-06-25 01:40:05 +08:00
@hamhamham 额我们学校的操作跟你们的不太一样。。。我通常都是点 Institutional Sign In 登陆,然后 paperlib 的插件就可以正常导入并且下载 pdf 了,如果不登陆,就只能导入一些标题,无法下载 pdf 。
hamhamham
2022-06-25 01:44:24 +08:00
@SorryChen 那这个可能是小众需求😂。我们学校在 Institutional Sign In 里经常找不到,所以这个方法更方便。
Zhengqing
2022-06-25 04:11:56 +08:00
救命啊 太需要了啊!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/861794

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX