把一个小爬虫写成了个简单的网站(Avdict) 是不是没救了。

2017-10-11 15:05:21 +08:00
 syhsyh9696

网站不是很大,部署挺方便,我在自己家 nas 里部署了个,功能一点一点往上加吧。

恳请大家提点意见,几个小时后关吧,小水管可能会猝死...

Demo

Source code

9597 次点击
所在节点    问与答
32 条回复
chen2016
2017-10-11 20:29:35 +08:00
@syhsyh9696 你用的是 bootstrap,自带自适应,只需要加个 meta
sxm
2017-10-11 20:41:06 +08:00
几个月前用 PHP 做过一个,各种尺寸图片全部抓取差不多 400G 左右,再写了个数据展示,基本和原站类似。当时踩的坑是,单个文件夹内存放了百万+的小文件,导致之后文件夹复制删除那耗时惨不忍睹。
syhsyh9696
2017-10-11 20:55:49 +08:00
@sxm 源站是,javlibrary 还是 dmm.r18 。

如果是全下载的话还是应该影片文件夹分别储存啊~
我分析了一下数据库里的 url,里面的很多照片是可以构造出来的,所以我没抓图片。

主要是我硬盘不够用了(哭, 已经 4 个移动硬盘了,ssd 里还有好多电影没法存呢(哭
clearbug
2017-10-11 21:45:49 +08:00
到底咋播放啊?用手机点 video 找不到播放入口啊
tf141
2017-10-11 21:51:00 +08:00
半天没打开。。。。。。
sxm
2017-10-11 21:54:22 +08:00
@syhsyh9696 源站是 javbus,当时也只是写写玩的,只按图片类型及尺寸分文件夹,忘记了单个文件夹内文件过多的问题。之后转移到另一块硬盘上时才发现,那复制速度,差不多一天了。删除时只好把硬盘上的其他大文件又转移下,然后直接格盘了。影片数量大概 30 多万吧,我发现大图他是直接引用 DMM 的,而 DMM 编号与番号略有差异,所以抓取时就直接存图片 URL,毕竟也要不了多少容量。硬盘我也是不够用,本机上的 2 块硬盘可用空间常年是 20G 不到,移动硬盘我是用 3.5 硬盘+硬盘盒
tedd
2017-10-11 21:56:18 +08:00
居然有 30 多万部? Orz
syhsyh9696
2017-10-11 23:31:36 +08:00
@sxm 这样子 Javbus 骑兵步兵都有,这个很不错,但是我感觉分类稍微乱了点,而且 jbus 在 github 上已经有许多项目了。我现在还是个穷学生啊…只有一台笔记本,等以后挣钱了搞一套像样的存储好好整理一番再数据挖掘下(逃

我可是拥有天使萌所有影片的(逃
sosloop
2017-10-11 23:38:40 +08:00
赶紧 fork,^_^,感谢楼主
yangonee
2017-10-12 11:11:00 +08:00
用 avgle 啊,有 api
syhsyh9696
2017-10-12 12:04:02 +08:00
@yangonee 我这个也有哇,只不过还没完善好
jasondan
2017-10-12 12:46:44 +08:00
= =握爪,楼主。我之前也搞过类似的,不过不敢放给大家用

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/396775

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX