程序员的女友系列(更新到第五篇)

2019-05-05 11:26:17 +08:00
 ginyan

程序员的女友系列,分享一个普通学生程序员如何追到 172 学霸女神的,会持续更新有干货的,希望大家喜欢!

「程序员的女友 001 」如何加到她的微信

「程序员的女友 002 」如何和女孩子微信聊天

「程序员的女友 003 」从微信聊天到第一次单独吃饭

「程序员的女友 004 」和女孩子出去玩什么?

「程序员的女友 005 」给喜欢的女孩子写一个程序

14615 次点击
所在节点    推广
176 条回复
AddOneG
2019-05-05 19:25:18 +08:00
好找还是因为在大学。。 感觉要是工作了之后就很难脱单了 O__O "… 所以大学找了就要好好坚持住 祝 99
kljsandjb
2019-05-05 19:26:36 +08:00
贴吧即视感啊…
geson
2019-05-05 19:30:50 +08:00
赚了,楼主
melvin
2019-05-05 19:37:07 +08:00
广告贴?
NarwhalL
2019-05-05 19:49:08 +08:00
??????我自爆了
jon
2019-05-05 20:58:55 +08:00
公众号广告?
ginyan
2019-05-05 21:05:43 +08:00
@AsunaQAQ @zhangalong69 两位大哥对不住了!
@ztz12 是的了
@maguazhou 重在学习啊哈哈哈朋友
@mengdisheng 哈哈哈哈哈哈,要残忍的告诉你这是现实啊,兄弟!
@KevinBu 哈哈哈哈,我重在分享
@AddOneG 谢谢祝福!
@geson 是的是的哈哈哈哈
@melvin @jon 不是广告啦,只是文章首发在公众号,同步更新在 v2
jon
2019-05-05 21:41:48 +08:00
太长了,能说说确定关系用了多长时间? 2 个月?
mingyun
2019-05-05 21:52:59 +08:00
最后的公众号广告猝不及防
kafeisemang
2019-05-05 22:09:08 +08:00
在某个星球看过了
blackbbc
2019-05-05 22:21:43 +08:00
我我我我我我我我我我我我我我我我我我我我好酸啊!
Yapie
2019-05-05 22:43:59 +08:00
举报了,太欺负人了嘤嘤嘤
rearcher
2019-05-05 22:52:58 +08:00
技术论坛不是秀恩爱之地!(狗头,其实我酸了 555555 )
273579540
2019-05-05 23:21:12 +08:00
@Nostalgiaaaa 是的。我之前来来回回关注他订阅号几次,说实话,感觉一般,一直鼓吹 Android..其实我觉得前端一统江湖指日可待,现在还有多少公司需要开发原生 APP 的?还有,我觉得他还不如我帅....虽然我比较低调。他的营销能力确实值得我这种码农学习的。
273579540
2019-05-05 23:23:00 +08:00
其实我想说,是你女朋友也不一定是你老婆,是你老婆也不一定跟你过一辈子。生活就是这样。没必要这么高调。最后祝你们幸福
wangfei324017
2019-05-06 01:24:58 +08:00
BEST WISHES
20015jjw
2019-05-06 05:38:28 +08:00
我只是想说 邮件为啥没通知..
SlipStupig
2019-05-06 09:06:47 +08:00
兄弟我完全跟你相反啊。。

之前认识了一个非常漂亮的女孩子啊,礼貌性的交换了微信,然后就开始 Q&A 模式,基本上都是我一问她一答,真的非常累,秉着程序员对技术的执著,我就想了是不是因为我情商太低,我完全不知道她喜欢什么,于是我萌生了通过 NLP 去挖掘她喜好和性格特点,这样我不就可以弥补”情商“了嘛,而且还能省力!(想想都觉得我机智)

收集数据:

1.把妹子发过的所有原创微博抓下来
2. 把微信朋友圈所有转发的链接和公众号文章(手动采集)
3. 过去半年的天气数据(大家会很困惑,我后面会解释)

我的目的是想更了解妹子喜好和禁区以及如何激发她表达的欲望,所以需要做几个维度:情感标注、命名实体识别、主题挖掘、协同过滤和综合相关系数,我大概觉得能 cover 的类型数据应该有几类:

- 电影娱乐(数据从豆瓣上抓影评)
- 心灵鸡汤(这个找了好多数据源)
- 各种名著书籍(妹子是学文学的,推测应该喜欢这个,数据来源很多)
- 各种社会新闻( zhihu 和网易新闻)
- 评论数据(用的美团的评论)

模型训练:

- 命名识别标注,通过 jieba POS 识别,主要识别人名&地名,做一个组合
- 情感标注,通过 SVM 跑评论数据
- 主题挖掘,通过 SLDA 设置 100 个 topic,然后合并后最后有 40 个
- word2vec 训练找相似内容

数据挖掘

分析喜好
通过命名识别识别的人名和地名,分别做 tf-idf 求权重出来,把 df < 2 的全部干掉,最后出来高权重人名和地名,包含这些人名和地名的文章都可以算高价值内容(相当于阅读理解的重点)。

话题情感
然后把那几篇文章和微博拉出来,通过内容分析 topic 做一个摘要,进一步合并 topic 后做个情感标注,得到了 topic 相关的正负面信息,最终分析出来,整体情感比较偏向负面,我根据人的经验推测性格是内向型的(很有可能不对。。)。

最相关性
为了了解妹子喜欢什么,用 word2vec 跑出来最相近的书籍、地名和美食,方便我去找更多共同话题

天气因素
这个是受到英国人的启发,没事聊天气,于是我用 naive bayes 分析了情感正负面与天气的关系,最后结论是,影响不大,但是她不喜欢下雨(雨天的时候喜欢发一些负面的东西,很有可能是样本的问题)

数据画像
有了以上数据后,大概基本上掌握了性格特点,通过一顿操作后,做了一些数据完善(过程太长省略了),最终确定了画像结果


说一下最终的结果吧,跟妹子聊天确实话题变多了,隔着屏幕都能感觉她很开心,我就更开心了,但是依然没有改变一问一答的情况,我只能放弃了。大家要引以为戒不要学我这么傻!
Constellation39
2019-05-06 09:07:57 +08:00
引起不适,建议永封
thinkmore
2019-05-06 10:00:30 +08:00
@ginyan 大兄弟,说好的照片呢?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/561051

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX