手贱拿大模型试了下最近一次的 LeetCode 周赛,道心破碎了,成仙路已断,前路在何方?

5 小时 56 分钟前
 CC11001100

四道题全部 AC 。。。

我连题目都没仔细看,就无复制粘贴题目给它,等它推理出结果就复制回提交框:

中间有提交错误的:

我把错误截图给大模型,让它继续推理,然后如此反复,除了最后一道题错了几次才推理出来,前边都是一把过,最后一道题错了两次推测出来了。

跟一个力扣刷了几千道的朋友吐槽用大模型刷题,虽然我在嘴硬,但我自己撑死了也就是三道题的水平。。。AI 算法水平至少高我一个大段位。。。。

不过还好,它用时大概半小时,比第一名耗时还长一些,碳基生物保住了一点脸面:

但想一想,从 OpenAI 发布 Chatgpt 到今天,也才几年的时间就已经发展到这个程度了,我原本以为程序员能干到 35 岁也行,到时候回老家养猪,就很抽象,感觉撑不到 35 岁就得被淘汰了。。。过年回去得提前调研下养猪方案了。。。

1054 次点击
所在节点    程序员
22 条回复
w568w
5 小时 39 分钟前
大可不必妄自菲薄,从你给的这几题来看,大模型训练的时候数据集里肯定有对应题解了,它只是原样背诵答案罢了。

「看到题目会写这个算法本身」值 1 块钱,「理解算法背后的思想」值 10 块钱,「实际工程中与人交流并设计架构,想到现实的独特场景可以转化成这个算法问题来解决」值 1000 块钱。
RoccoShi
5 小时 35 分钟前
leetcode 的题还是偏简单了,对于现在的大模型来说小菜一碟
CC11001100
5 小时 34 分钟前
@w568w 我开始是拿 hot100 来试的,觉得能做出来是因为早就有题解了,所以后来我拿周赛来试,周赛都是新题现出的,类似于高考试卷有模式可寻但都是新题,我记得之前力扣周赛排名高的话好像可以大厂绿色通道面试速通,感觉可能会出现新的作弊赛道,哎大意了直接发论坛了。。。
tcper
5 小时 34 分钟前
你如果正经训练一下肯定比大模型厉害,人脑也是需要训练的

而且可以找找真正竞赛题让 ai 试试,几种算法的组合 ai 就不行了
CC11001100
5 小时 31 分钟前
@tcper 戳心了兄弟,我训练了,上学那会儿还专门刷过一段时间算法题,奈何资质愚钝。。。
ccoming
5 小时 29 分钟前
拳头永远硬不过锤子,要学会使用工具。
CC11001100
5 小时 29 分钟前
@RoccoShi 第四道题能做出来,在码农里算法水平应该能算前 0.1% 。。。
levelworm
5 小时 11 分钟前
@CC11001100 大模型的训练快多了。

不过说实话,我的确觉得 AI 代替部分码农的工作,不是很远的未来了。很可能大公司内部已经在做了。而且要命的是,码农还挺配合的。

很多朋友举的反例,我觉得都不是很大的问题。比如说需求不清楚 AI 也没办法。第一,需求不清楚,其实人也没办法,你还得继续交流,而交流的精准度和耐心,人未必比得上 AI ,第二,公司可以强制执行标准化需求,换句话说,与其让 AI 适应人,不如让人适应 AI 。

国内大厂我相信肯定有人在做了,就是不能说。我觉得首当其冲的大概就是数据分析,数据工程、前段这种直接面对业务(业务恨不得你们 24 小时相应),技术上又没啥特别难的东西。
neteroster
5 小时 5 分钟前
R1 确实很猛,带思考的大模型做这种题只会越来越强,毕竟:结果可验证 + R1 指明了强化学习在推理 LLM 上的有效性,这俩一结合就能预估这种算法竞赛未来的 LLM 能打过所有人类就是和 alpha go 打败人类棋手一样自然的事情。

虽说如此,实际应用场景复杂得多,还要在 Agent 、超长记忆、持续学习这几个领域有所进步才行,现在的技术这几个方面是明显薄弱的。很期待未来的发展。
williamjing
5 小时 2 分钟前
以后 leetcode 的分数就没意义了,因为你面对的都会是 AI 。以后面试看来默认需要手撕代码了。
mythabc
5 小时 1 分钟前
积极拥抱变化寻找出路,不要再钻研代码细节。
(上回发了个 cursor 的帖子,还有人说我广告,时代都变了感觉 v2 有一帮冥顽不灵的人)
tcper
4 小时 56 分钟前
@CC11001100 你意思是自己刷一些题算训练了?你去看看 ACM 队员怎么训练的
me1onsoda
4 小时 42 分钟前
@w568w 碳基生物何尝不是在背答案,效率还低。很多人一年半载再去刷 h100 又不会了。背到极致也算牛逼
majula
4 小时 28 分钟前
想当年李世石柯洁输给阿尔法狗,岂不比楼主更加道心破碎。人家可都是实实在在的行业前 0.1%(不包括业余棋手)。

李世石没几年就宣布隐退了,理由是输给 AI 后,他再也无法享受围棋这项竞技。

柯洁则是一开始对 AI 各种冷嘲热讽,实战被吊打后则是破防嚎啕大哭。然后能明显感觉出来他对下棋越来越没有胜负欲,工作生活的重心也开始转移到围棋以外的地方。或许这就是我们这些“传统程序员”中一部分人的写照。

好在程序员这个职业的工作内容几乎不是“算法竞技”,现实场景的业务涉及到和形形色色的人、和其他(非计算机)系统的对接,这些目前看来还很难由 AI 独立搞定。

不过那些纯搞技术的“底层程序员”确实应该“睁眼看看世界”了,不然真的会被落在后面。我在 /t/1095887 #2 回复的后续,我们公司那帮老算法工程师在被 AI 降维打击一次后,现在也开始拥抱 AI ,用 LLM 辅助研究了。
jukanntenn
4 小时 22 分钟前
高射炮打蚊子,别说大模型,我用搜索引擎也能达到同样的效果呀,这能说明什么问题呢?
kk2syc
4 小时 17 分钟前
你让大模型来试试高考题,应该连大专都不够分数。
fpk5
4 小时 6 分钟前
周赛是给你练习速度和熟练度的,半个小时三道题就差不多了。你不能跟计算器比乘除法。
levelworm
4 小时 1 分钟前
@majula #14
这个还不算底层。至少要到操作系统编译器这个层次,然后接触硬件啥的。AI 对于缺乏公开资料的东西还是不行,还能苟几年。
mumbler
3 小时 44 分钟前
现在最强模型是 gemini-2.0-flash-thinking-exp-01-21
aistudio.google.com
mumbler
3 小时 42 分钟前
@kk2syc #16 现在三巨头大模型有博士水平,但不能保证一次做对,需要抽卡,重试多次高考全部能拿下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/1107195

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX