讨论一下手机监听的可能性

2023-07-17 10:40:01 +08:00
 pkoukk

观月经监听贴有感,大家反驳的意见主要集中是

软件( APP )监听不可行,没权限,无法控制耗电量

硬件监听,看上去也没人抓到过实时上报的数据包

但是我感觉好像并不是完全不可行,以下是我想的一个方案,因为没有搞过嵌入式,有没有搞过的老哥说说行不行

1 、目前手机上普遍都有语音助手,一般情况是通过专用的语音识别芯片实现的。比如这款 .介绍里说待机只有几亚毫瓦,还带 208k 的 SRAM 和 1M FLASH 。

2 、这么大的存储,只存“小爱同学”这几个字是不是太浪费了,能不能定期更新一些热词进去?

3 、命中热词之后,其实也不需要实时上报,在内存或者日志记录一个字典,存一下触发次数

4 、随着其它系统上报数据,一起上报。

5 、厂商分析后,做成画像卖给广告商联盟。

看着流程很长,但其实只要做到分钟级的处理链路,对用户来说就相当实时了。

11955 次点击
所在节点    程序员
134 条回复
icyalala
2023-07-17 16:00:08 +08:00
既然愿意讨论技术,那我就再说一下。

从技术上讲,对于移动设备,能做实时监听又低耗电的,只有系统去调用 coprocessor 来做。
App 层面没有这个权限去调用 coprocessor 的功能,录音也需要系统权限,即使录音功耗没办法控制。
用加速计陀螺仪等传感器监控的 (比如 AccelEve),相比录音的而言有更大计算量和远远不如的精度,
功耗同样无法控制;更不用说现在系统的传感器采样率已经被限制了。
所以在技术方面讨论,App 做不到,系统能做到有限的词汇。

再从动机上讲,手机厂商和 App 厂商做这些事需要利益驱动的,
就算有能力去做的,风险收益也完全不成比例。比如拼多多已经有能力拿到系统权限去改耗电报告了,
现在分析出来那些下发的 apk 都是拦截通知、分析使用量和 log ,能直接拿数据,何必去搞风险高收益低的事情呢。
现在广告联盟能也能从各个 App 合法的直接拿大量精确数据,搞什么语音监听。

相关性并不意味着因果关系,但人总是希望得到解释。
在遇到强大的推荐系统和巧合的时候,就使用不愿相信自己被猜中了,或者这就是巧合。
lmkyl
2023-07-17 16:17:55 +08:00
某天餐桌上有人说了“白茶”,第二天微信朋友圈就出现了白茶广告:

1 、鉴于我是第一次听说“白茶”,也不存在主动搜索、查询,证明跟输入法无关

2 、朋友圈广告平时出现什么品牌、产品,没点数?说心理因素的,大可不必尬聊

3 、关闭了视频、麦克风权限,继续观察朋友圈广告,再无“白茶”,说心理因素的,别装逼了,明显跟监听和算法有关



另外,微信无故调用摄像头,怎么解释: https://tanronggui.xyz/t/920983

图我还存着的,只是懒得找第三方图床
Monteli
2023-07-17 16:31:58 +08:00
不监听是不可能的,手机装了那么多软件,你能保证每个软件都很老实?即使每个软件都老实了,你能保证你的系统一定老实?即使系统老实了,你能保证所有硬件芯片就老实了?总有一环可以治你,哈哈
Ericcccccccc
2023-07-17 16:33:57 +08:00
当然是可能的

只不过性价比太低, 你是老板, 你会花钱搞这么个团队吗? 用户画像足够精准了.
churchill
2023-07-17 16:37:42 +08:00
道理我都懂, 可是这只鸽子为什么这么大。。。。。
lifesimple
2023-07-17 16:40:20 +08:00
@tangtang369 同偏向于心理学原因,如果你前一天没有因为微信群有人说向量数据库这个词,你没关注到,第二天 b 站依旧推送向量数据库你可能根本不会当回事,也不会记得,恰巧因为你头天记住这个词了然后你会觉得这个推送是针对性推送。
zlowly
2023-07-17 16:40:26 +08:00
我只想反问一下,手机都是在自己手里的,各种达人牛人到处都有,为什么这么多年了,还没有消息是有人在自己手机里找到这个“监听语音”?难道制作这个功能的人这么强的吗?
someday3
2023-07-17 16:44:45 +08:00
很多都能举出来一两个例子,聊过什么然后打开淘宝或者 b 站,就有相同的内容推荐。这种幸存者偏差完全不能说明问题,因为你没聊之前可能就在推荐这种,只是你不关注而已。

怎么才能算证据呢,就是你很多次聊了之后都能出现相似的推荐。你今天聊数据库,明天聊裙子,后天聊结婚,大后天聊鞋子。以此类推,完全不相关,统计一下出现的次数,越多越好,把分母增多成十几,二十几,你再对比,就能看出来效果了。

我关注这种现象很久了,知乎上也有些人说到类似的现象。自己和朋友讨论了 xxx ,然后淘宝就推荐了 xxx ,所以肯定是监听了;或者自己和朋友聊了微信 xxx ,然后淘宝就推荐了 xxx 。这种巧合现象完全不能说明任何问题,偶然事件的概率再低在你人生的两三万天里出现几次也是很合理的。
howoldareyou2
2023-07-17 16:59:36 +08:00
@JustPisces 你同事事后没进行任何与输入法相关操作?
codespots
2023-07-17 17:01:56 +08:00
@bertonzh 我也思考过这个问题,结论和你的基本一致。不过我有过广告行业相关经历,我补充下另外几个背景,广告联盟,idfa 、cookie mapping 、设备指纹,广告行业有非常多的手段来根据一些特征对用户进行定位或者说映射。加上广告非常考验 ROI ,用户看到的大多数都是 ROI 高的广告,这种广告很多更有针对性,而且多是热门内容。所谓热门内容,多数和你从各种渠道看到的内容(新闻、综艺、电视、音乐、社会热点、广告、花边娱乐、军事政治、热搜、公众号、小红书讨论的内容。热榜等等不一而足,甚至你在路边等公交看到的广告)有关。所以很容易就和你产生关联。加上孕妇效应,很容易造成你被监听的错觉。
codespots
2023-07-17 17:07:09 +08:00
我先放一个结论,目前为止( 2023 年 07 月)还没有这种技术手段,但要解释清楚为什么很多人会有这种疑问没个一两万字是很难说清楚的,因为这涉及到社会学、心理学、广告投放策略、广告技术、经济学相关非常多内容
Huelse
2023-07-17 17:10:23 +08:00
@wipbssl #17 pdd 那个还真不是靠 google ,而是有人现在 github 上放出反编译分析了
codespots
2023-07-17 17:11:56 +08:00
@codespots sorry ,我仔细思考了一会,如果想特别详细解释这个现象,一两万字都很困难,其中涉及到的每一个方面都可以单独写一篇文章
mohumohu
2023-07-17 17:15:32 +08:00
现在无论是安卓还是 ios ,只要调用麦克风顶部状态栏就会有图标提示,也不是说没有利用系统漏洞的可能,但经常幻想 app 用麦克风监听你聊天的还是多虑了。
Y25tIGxpdmlk
2023-07-17 17:16:55 +08:00
B 站的推荐算法是出了名的乐色,不存在这么牛批的精准推荐。

从经济上去考虑,可能性也比较小。B 站不以盈利为目的,给你推荐一个没有公司投流量的东西,为了什么呢?就算是和微信有广告联盟,但是一般都是推一些商家的产品为主吧。
Huelse
2023-07-17 17:23:23 +08:00
楼上真的一堆反智言论,拿自己一个特殊例子就想直接证明普遍性,事实上是到目前为止还没有明确证据,输入法倒是板上钉钉的。

这类话题 3 年前甚至更早就开始了,至今都没有效的结论,绝大多数都是个人怀疑和特例推论:
https://tanronggui.xyz/t/700109
https://tanronggui.xyz/t/746470

此前看到一个回复说,xxx 曾经有尝试过语音收集,但无效信息太多,十句话都不一定一句有效的,而且识别不一定准确,精准度低的可怜就被取消了。想想也挺合理,假如你来做这个需求的话你觉得好做吗?
Baoni
2023-07-17 17:26:39 +08:00
孕妇理论不能解释一切好吗,如果今年是龙年真的有很多孕妇怎么办?
你也要用孕妇理论解释其实并没有更多的孕妇,都是心理作用?顺便嘲笑一下对孕妇理论不买账的人没有科学素养?
snw
2023-07-17 17:31:36 +08:00
@maye9999
PDD 那么大的新闻,被罚倒闭了吗?屁事都没。
既然爆出来也没啥处罚,那么自然没动力去费力爆料的,毕竟爆料还得举证,没详尽的证据还会被倒打一耙。

所以没有新闻逻辑上不能证明没有。
HomeZane
2023-07-17 17:36:44 +08:00
有可能,但是没必要
GrayXu
2023-07-17 17:38:33 +08:00
@tangtang369 #1 向量数据库本身就是随着这波 llm 热度又热起来了,推给你不是很正常吗。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/957316

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX