学历:
最高学历本科,去年六月毕业,学的是数学
编程:
- R:
- Python: 写过不少,开着 SO 的话能力有巨大提升。主要用 Python 写过 machine learning 相关的东西,还有就是抓数据,解析 json ,处理文本,写 sql 之类的
- Scala 写了很多 ETL 和在 Apache Spark 里面跑的东西。最近觉得以前自己写的代码风格不是特别统一,对 higher-order function 的掌握也不太好,所以在从头学起。还有就是有的 ETL 要许多步的 map, flatMap, reduce, 最近在思考怎么写可以增强可读性
算法:
刚上完 Coursera 上的 Stanford 的第一门 Algorithm ,主要讲了基本的 big-oh, divide and conquer, sort, randomized algorithm 之类的。觉得很有意思,应该会继续上
工作中做过的项目:
- 用 GLM 给车险数据做建模分析。软件用的是 SAS
- 用 Python 从 Intagram 抓数据、设计 MySQL 里面每个 table 、把数据输入到 MySQL 数据库中。用 Bash 把几个 Python 脚本串起来。
- 把公司里原来有的、用以分析 Facebook 数据的 Python 代码重新写了一下,使它看上去不那么像面条(原来的 script 里几乎没有几个 functions
- Debug MySQL 的 queries , debug Scala 写成的 ETL ,写原创的 Scala ETL
- 用 R 做关于公司在线社交账号的数据分析和建模。比如,找到了一群比较忠实的顾客,然后开会的时候和老板一起推进引入 membership 的功能。再比如,发现和某一类明星账户合作比较好(而不是另一类。具体可能不方便在这里透露)。同时也找到了一些不那么愿意花钱的顾客……
- 写 Scala 拉数据,以协助进行 A/B Test ( A/B Test 的实现是前端的同事们写的)。同时负责联系和 A/B Test 有关的各个人员,并且为他们解读数据。(例如:“不是的, p-value 小于 0.05 不一定说明我们的奇思妙想是对的……”
- 妄图对 emoji 进行类似于情绪分析的东西(不过最后没成功…这里顺便吐槽一下 Python 2 对 unicode 的支持
- 这个虽然不算”项目“,不过每周我都会给 team 里的各位讲 paper 推公式,然后大家一起脑洞可以怎么在工作中用
最近非常感兴趣、刚开始看的技术 /话题:
- 函数式编程(前室友每天给我疯狂安利 Haskell
- 中文的 NLP
联系方式:
chaoguo94@foxmail.com