爬虫的极限是什么?

2022-03-15 21:16:06 +08:00
 huobi98988

单从技术层面讨论:

超顶尖的爬虫技术能否取得 APP (网页) 没有公开的数据 ? 例如访客的联系电话

5437 次点击
所在节点    Python
27 条回复
sariya
2022-03-16 11:00:56 +08:00
极限是被 ban
Danswerme
2022-03-16 13:47:47 +08:00
你这让我想起来我以前上班的一家公司,老板让我把另一家电商公司的用户订单数据爬出来,我说这个爬不到,他说我在我手机上都能看到订单,你爬不到? 我很无语,过了几天我就拜拜了。
yedanten
2022-03-16 13:57:22 +08:00
获得网页上未公开的数据已经脱离爬虫领域了,那是信安的领域,渗透测试干的活
flewsea
2022-03-16 14:42:38 +08:00
极限就是可以进包间,学缝纫机技术
bulay
2022-03-16 17:20:32 +08:00
不遵从 robots 协议的都不要爬才是最好的选择,既安全又简单
huobi98988
2022-03-23 18:21:05 +08:00
@advancejar 315 曝光的里面没有看到爬虫技术的使用
huobi98988
2022-03-23 18:21:25 +08:00
@advancejar 哪个案例是使用爬虫的?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/840593

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX