(纯吐槽)微信读书网页版为啥要做加密啊

9 天前
 SingeeKing
我知道是为了防盗版,但是 epub / pdf 满天飞的情况下,真的会有人去费力不讨好爬微信读书网页版吗,退一步就算想从微信网页版去获得书籍源文件,也应该不至于去模拟人工一页页爬吧,JS 逆向或者从网络包分析应该更合理啊

但是这个加密就让想用/写个插件的我很难受了;各种划词工具用不了,最近想写个 AI Research 工具也无解……
2104 次点击
所在节点    阅读
16 条回复
Cheons
9 天前

我很疑惑
Kite6
9 天前
如果它不加密,马上就有人爬(正版肯定校对过,和满天飞的盗版质量还是不一样的)。对比一下番茄小说,一样加密。
SingeeKing
9 天前
@Kite6 可是电子书这东西和小说不一样哇,就算爬下来了真的有人会去看 txt 格式的电子书吗…
SingeeKing
9 天前
至少我觉得我肯定会在扫描版本 pdf 和盗版 txt 二者中选择前者
mooyo
9 天前
微信读书上还有很多连载网文。。。
ZztGqk
9 天前
换个思路,你也用 ocr ,这样有些没选中态的地方也可以用你的划词工具
cxtrinityy
9 天前
暴露年龄系列,起点纵横 17k 刚建站那会儿,大家不都看的 txt ?盗版网文站现在还留着 txt 下载按钮呢,虽然没啥用
passive
9 天前
小说除了红楼梦我一直都看 txt 。

专业书有数学公式和插图,才看 pdf 。
ysc3839
9 天前
有的。比如 Google Play 有些图书是不给下载 epub 的,从网页版中就能很容易地获取内容。
ysc3839
9 天前
@SingeeKing 大部分电子书又不需要排版,只需要拿到文本就行了。而且纯文本的 txt 也可以转成 epub ,epub 就是 zip 打包 html 。
Vegetables
9 天前
我和 5 楼的意见一致去,感觉还是主要为了连载网文防盗,现在看网文订阅太贵了
fpk5
9 天前
@SingeeKing #3 超过一定长度的小说还真是 txt 的适应性最好,epub 放在有的设备上打开就卡死。网络小说我一直都是 txt 。
shiji
9 天前
你太小瞧爬虫佬了。 他们连接近于垃圾的信息都要爬一爬,何况是书
lpe234
9 天前
京东阅读也有。之前研究过 web 版,解密相当简单,甚至 JS 文件里面还有注释...
macaodoll
9 天前
为什么要加密,肯定是为了反爬虫,另外为什么要反爬虫,不光是为了保护他的电子书,更多的是防止别的,比如拿微信读书当公众号文章抓取
yidev
9 天前
你不爬!=别人不爬

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/1108785

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX