工作两年的同事不知道逻辑回归是什么,这个正常吗?

2018-12-20 04:00:50 +08:00
 yuikns

如题,同事是国内本科,国外硕士,在厂里写了两年的 python。今天需要和他对接 feature,我跟他说用一下逻辑回归,他问我什么是逻辑回归。


那些纠结于逻辑回归中文翻译的,自己去谷歌和百度搜索"逻辑回归",看看前五个链接是不是指的 Logistic Regression。


我觉得知道损失函数而不知道“逻辑回归”的人,是可以暴露一些事实的,例如不怎么看过英文资料。

14488 次点击
所在节点    程序员
122 条回复
yidinghe
2018-12-20 23:43:24 +08:00
我想知道一个进销存系统,一个微信商城,一个报表生成工具,一个学籍管理系统,一个移动话费业务办理网站,一个扫码点单 app,这些应用有哪个地方用到了逻辑回归?这才是 IT 业界的真正面貌,苹果商店里面用到逻辑回归算法的 app 恐怕连万分之一都不到。
yuikns
2018-12-21 00:32:38 +08:00
@FrankHB 帝球你好啊。你说的这些我完全同意。而且这是个太典型的例子了,所以正好适逢其会,我就拿来用一下。

正文中的内容都是从原楼里面抄过来的,只改变了几个名词。在原楼中,因为一个中文名词,又是鄙视别人是基础差的“ 250 ”,又是嘲笑别人“不怎么看过英文资料”。

知道 Byte Order 就一定要看到 "字节序" 就立即脑补过去么?同理 k-平均算法我得立刻知道是 k-means,knn 我记得 k-nearest neighbors 还不够,看过 k-近邻法也不足,别人跟我提到 "最近邻居法",我还得立即反应过来。我觉得这个是不是过于苛求?


字节序这个名词我到底学没学过?我甚至可能也看过,但我觉得抓中文名词真的是没事找事。accuracy 和 precision 哪个是准确率,哪个是精确率,哪个又是精准率? sequence 和 order 哪个才是 "序" 呢?我知道通过各种规则可能总可以说出个 123 来。但是我真的是要做翻译家么?我的很多老师都很明确的教导过我,这些术语不要去纠结中文翻译,变种太多,没必要凭空给交流增加负担。作为懒鬼,我也觉得追究这个负担太重了。

于是在美帝过了好几年,莫名被标记上一个又是基础差又是不看英文资料的断言,感觉实在不是那么服气。

这是我个人里的想法。
yuikns
2018-12-21 00:32:45 +08:00
@janhu9527 我觉得并没有那么牵强。
php 里面做高层次逻辑的占大多数,还是做底层数据的占大多数?连 redis 的大多数是手写协议还是去找个轮子?
而做数据处理的,各种 pyspark, pytorch, numpy 什么到处飞,虽然并不占主流,但目前的确占了很大一块的。
yuikns
2018-12-21 00:32:53 +08:00
@dremy "S 函数"( https://zh.wikipedia.org/wiki/S%E5%87%BD%E6%95%B0 )了解一下。虽然我也是 3 秒钟前才知道的。
yuikns
2018-12-21 00:33:13 +08:00
@qiayue 我和站长自首过。要是是违规那么我认罚。即便我并非存心捣乱。

"搞笑" 是说,我很难认同主帖中的观点。

https://tanronggui.xyz/t/519425?p=1#r_6633293
occam88
2018-12-21 01:13:59 +08:00
@yuikns

谁给你说我没有跟他说相关的概念?而只说了中文?

谁又跟你说我坚持“字节序”是“ endianness ”中文的唯一翻译?

我把字节序、大小端、网络序全部跟他讲完之后他还是说没概念,我难道加上一句 endianness 他就马上懂了?

别以为就只有你会 English,就只有你去过 American,只有你有国际范儿。

让人作呕。
kaid97
2018-12-21 01:25:49 +08:00
李航应该是机器学习最基本入门了吧,玩 python 搞数据分析的,应该会知道才对
yuikns
2018-12-21 01:26:34 +08:00
@occam88 知道你会用法语问候别人母亲了。你才有国际范“儿”。

你难道没有注意到,我引用的并不全是你一个人的内容?我为你一个人开个帖子?哈哈,我比你想象的更加懒。
我说的是各种回复。说的是拽个翻译的名词当唯一解,一言不合就是“基础差”的各种“归纳法”。
yuikns
2018-12-21 02:04:53 +08:00
@occam88

> 那些纠结于字节序中文翻译的,自己去谷歌和百度搜索"字节序",看看前五个链接是不是指的 endian

这个我是不是可以理解为,不管 endian,大小端还是 byte order,总之那个概念吧。哪怕它有一万种中文翻译,但是因为被谷歌或和百度识别了,那么"字节序"必须是一交流别人就必须知道的概念。
那时候你还没提过“同时会用大小端、字节序。”这回事吧。

退一步讲,你和一个做高层逻辑的人说传输层的事情,人家没回忆过来,立马就是人家没常识。

随便评价别人容易,被人同样方法扫一地图炮 -- 请容我再强调下,我说的是从主帖开始的包括各种 v 友的我不太认可的回复,若有时我自己也这样,那么我说的也包括我自己 -- 就立马不舒服起来,就觉得被针对了。

我不认识那位 php 程序员,我就是觉得,他是不是会有同样不舒服的感觉?

很久以前我从单田芳老爷子那儿听故事,见识了一些新的词汇,这些新的词汇要解释起来其实也很通俗。和朋友们聊起来,不小心用上了,人家问我,这是什么,我惊讶道--你这都不知道?但为什么别人需要对我的上下文了如指掌呢?我以前有很长时间不懂,现在也时有这种想法,很惭愧。
yuikns
2018-12-21 02:07:36 +08:00
@kaid97 可能是统计学系方法没有影印版,大家直接 PRML 开坑了吧。另外,据说周志华的那本新书里面在讲到这一章的时候对这段掌故也提了几句。可惜借了几天居然没看过那一节。
tsui
2018-12-21 03:25:13 +08:00
本来是想来秀优越感的:“一个国外硕士居然这字节序都不懂”
发现自己本科教育有问题,只能印撑了
Davic1
2018-12-21 07:36:36 +08:00
翻译一下,在“逻辑回归”这个问题上,是同事“太菜”了,不如我,还是”逻辑回归”这么简单的概念都应该知道啊,从而为自己站在“都应该知道”的行列感到自豪???
yuikns
2018-12-21 08:05:16 +08:00
@Davic1 请参考补充说明。主题标题和正文是复制某个帖子,只换了几个名词。

就事论事,私以为,

1. “逻辑回归”是一个糟糕的翻译,即便网上很多文档用它指代 LR 这个概念
2. 即便这个是个“好的”翻译,私以为也不应苛求在交流时候,发现别人不知道这个中文名词,就立马认定人家“啥都不懂”。或许人家了解的是什么 logistic regression 呢?
3. 在分工合作的时候,每个人的常用背景知识各有不同。LR 固然是一个大领域里面非常基础的知识,但是这并不意味着所有合作的人都立刻能进入上下文。由此就评价别人没常识,我觉得这个非常鲁莽而无礼。

最后,楼主一点都不觉得知道 lr 这个概念有什么了不起的。有需要的人,接触一下很自然就能会用会实现。要是有谁觉得知道点这个,就带着某种奇异的优越感和别人合作,这种行为是“一起做好一件事”的阻碍。
wensonsmith
2018-12-21 08:08:19 +08:00
occam88
2018-12-21 08:16:25 +08:00
@yuikns

①如前所述,我从来没有坚持"字节序"是唯一的合法性翻译,倒是不少人坚持只有一种翻译,或者没有翻译,只能英文。

请不要无线放大对方的陈述,然后再去反驳一个不存在的论点。
occam88
2018-12-21 08:23:46 +08:00
@yuikns

②那 php 程序员不会感觉到不舒服,至少当面讨论问题的时候,我没有表现出来,还帮他把对应 php 函数查完了给他看。
occam88
2018-12-21 08:27:43 +08:00
@yuikns

③我的同事不懂字节序(注:endianness ),我没说过会他在自己领域上会逊色。
janhu9527
2018-12-21 09:09:38 +08:00
@yuikns 这不是 php 程序员的问题,是正常基础好的科班毕业都应该知道,逻辑斯蒂回归如果不是机器学习方向的根本不会学,但是字节序上过 C 语言、汇编、组成原理一定会教,考研都会考,怎么能说不牵强?学过不知道和没学过不知道不是一回事。难道程序员整天 crud 就不需要懂数据结构了?然而大厂前端面试都要考数据结构,这帖子开得根本毫无意义
FrankHB
2018-12-21 12:07:20 +08:00
嘛,其实一般来讲翻译的整体语感因人而异吧。我觉得 k-means 这个和 knn 的中文说法还是比较符合惯例也没疑问的,虽然可能因为我也不常看这些原文所以反而不太会有这样的障碍的原因。
不过有些是确实明显应该发现问题的。这里面还有不同的情况。
第一类,一些翻译非一一对应的同义词,如 order 和 sequence 这里虽然中文都是“顺序”,但是含义是有差别的:前者强调“有序”,后者强调“序列”。如果了解原文,同时又是中文母语使用者,这些应该不难明确,并不需要翻译家的程度就容易明白。这些都是影响非常广泛的常用构词单元,至少对技术人员来讲分辨清楚不该算是苛求。
另一类是翻译构词不当。我举例说的“堆栈”,就是偏义复词在翻译上的滥用。这样的翻译明显很糟糕,因为“堆”和“栈”偏偏就是有明确所指的两回事,所以至少回过神来真清楚原始含义之后,就应该容易认识到翻译容易引起误会问题而辨别出什么是不恰当和应当避免的。因为陷入为主而坚持不恰当的翻译,一定程度是不可理喻的。
第三类是更复杂的,就像 endianness 和 byte order 这个问题(我另外有回了)——还不只是中文问题了,原文就有洞。
简单来说就是 endianness 这个用典:
1.不太符合要表达的准确的含义(只有大端和小端,而不是和其它序);
2.而且相当早就被误用了,以讹传讹(既不是大端又不是小端的 PDP-11-endian 很有年头了);
3.还有更多的歧义(虽然一般是指 byte order,但也可以指 bit order,虽然后者往往用 bit endianness 区分强调)。
所以我在正式场合用 byte order,除非是明确排除非 BE/LE (特别是明确不要求 bit/byte )的情况。
(类似的情形,应该 octet 的地方就不用 byte。)
如果不是很清楚这档子破事来用,就得推测含义,而每次都要由内行的承担启发式瞎蒙以免歧义的开销实在太不公平。
退一步讲,日常也就算了,至少涉及 spec 的问题我不会退让。
这算是翻译问题上比较复杂的情况了,但我认为仍然有必要推敲清楚——实际上理解上也没多复杂。

另外:
1.我翻了一下叫“逻辑回归”倒应该是有些年头了,维基上词条也就叫“逻辑回归”,醉了……
2.用不恰当的翻译不一定就是啥都不懂,但如果不懂原文是啥的前提下,要只会这样不靠谱的术语还很懂,是不太能让人信服的。因为正常情况下几乎不可避免的会遇到不同的翻译,而且其它翻译明显更好的情况下,一般人都不会固执不合理的翻译不放。所以比较合理的推测是孤陋寡闻,只见过使用不当翻译的例子,也许懂一部分,但不太可能全懂了。另外,要懂原文的,如果遇到翻译存疑,大可直接用原文或者至少说清楚对应的原文是啥,没有道理非用不被对方接受的翻译引起交流障碍。
3.实际工作中,如果发现术语翻译偏差,先约定清楚用什么翻译或者干脆直接用原文不应该造成问题。这类沟通细节上的问题,没必要扣帽子。
mikefy
2018-12-21 12:17:25 +08:00
真的很不想说,楼主活了那么多年,都不知道自己是个 XX,这正常吗?我觉得挺异常的,XX 可以换成某些你懂的。每天发些垃圾帖子

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/519187

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX