V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
CC11001100
V2EX  ›  程序员

手贱拿大模型试了下最近一次的 LeetCode 周赛,道心破碎了,成仙路已断,前路在何方?

  •  
  •   CC11001100 ·
    CC11001100 · 2 小时 52 分钟前 · 875 次点击

    四道题全部 AC 。。。

    我连题目都没仔细看,就无复制粘贴题目给它,等它推理出结果就复制回提交框:

    中间有提交错误的:

    我把错误截图给大模型,让它继续推理,然后如此反复,除了最后一道题错了几次才推理出来,前边都是一把过,最后一道题错了两次推测出来了。

    跟一个力扣刷了几千道的朋友吐槽用大模型刷题,虽然我在嘴硬,但我自己撑死了也就是三道题的水平。。。AI 算法水平至少高我一个大段位。。。。

    不过还好,它用时大概半小时,比第一名耗时还长一些,碳基生物保住了一点脸面:

    但想一想,从 OpenAI 发布 Chatgpt 到今天,也才几年的时间就已经发展到这个程度了,我原本以为程序员能干到 35 岁也行,到时候回老家养猪,就很抽象,感觉撑不到 35 岁就得被淘汰了。。。过年回去得提前调研下养猪方案了。。。

    第 1 条附言  ·  2 小时 20 分钟前
    用来测试的周赛题目链接: https://leetcode.cn/contest/weekly-contest-433/
    第 2 条附言  ·  1 小时 46 分钟前
    我已经报名了下次的力扣周赛,准备混个历史最高排名玩玩看看能到多少。。。
    21 条回复    2025-01-23 01:29:23 +08:00
    w568w
        1
    w568w  
       2 小时 36 分钟前   ❤️ 2
    大可不必妄自菲薄,从你给的这几题来看,大模型训练的时候数据集里肯定有对应题解了,它只是原样背诵答案罢了。

    「看到题目会写这个算法本身」值 1 块钱,「理解算法背后的思想」值 10 块钱,「实际工程中与人交流并设计架构,想到现实的独特场景可以转化成这个算法问题来解决」值 1000 块钱。
    RoccoShi
        2
    RoccoShi  
       2 小时 32 分钟前 via iPhone
    leetcode 的题还是偏简单了,对于现在的大模型来说小菜一碟
    CC11001100
        3
    CC11001100  
    OP
       2 小时 31 分钟前   ❤️ 1
    @w568w 我开始是拿 hot100 来试的,觉得能做出来是因为早就有题解了,所以后来我拿周赛来试,周赛都是新题现出的,类似于高考试卷有模式可寻但都是新题,我记得之前力扣周赛排名高的话好像可以大厂绿色通道面试速通,感觉可能会出现新的作弊赛道,哎大意了直接发论坛了。。。
    tcper
        4
    tcper  
       2 小时 31 分钟前
    你如果正经训练一下肯定比大模型厉害,人脑也是需要训练的

    而且可以找找真正竞赛题让 ai 试试,几种算法的组合 ai 就不行了
    CC11001100
        5
    CC11001100  
    OP
       2 小时 28 分钟前
    @tcper 戳心了兄弟,我训练了,上学那会儿还专门刷过一段时间算法题,奈何资质愚钝。。。
    ccoming
        6
    ccoming  
       2 小时 26 分钟前 via Android
    拳头永远硬不过锤子,要学会使用工具。
    CC11001100
        7
    CC11001100  
    OP
       2 小时 26 分钟前
    @RoccoShi 第四道题能做出来,在码农里算法水平应该能算前 0.1% 。。。
    levelworm
        8
    levelworm  
       2 小时 8 分钟前 via Android
    @CC11001100 大模型的训练快多了。

    不过说实话,我的确觉得 AI 代替部分码农的工作,不是很远的未来了。很可能大公司内部已经在做了。而且要命的是,码农还挺配合的。

    很多朋友举的反例,我觉得都不是很大的问题。比如说需求不清楚 AI 也没办法。第一,需求不清楚,其实人也没办法,你还得继续交流,而交流的精准度和耐心,人未必比得上 AI ,第二,公司可以强制执行标准化需求,换句话说,与其让 AI 适应人,不如让人适应 AI 。

    国内大厂我相信肯定有人在做了,就是不能说。我觉得首当其冲的大概就是数据分析,数据工程、前段这种直接面对业务(业务恨不得你们 24 小时相应),技术上又没啥特别难的东西。
    neteroster
        9
    neteroster  
       2 小时 2 分钟前 via Android
    R1 确实很猛,带思考的大模型做这种题只会越来越强,毕竟:结果可验证 + R1 指明了强化学习在推理 LLM 上的有效性,这俩一结合就能预估这种算法竞赛未来的 LLM 能打过所有人类就是和 alpha go 打败人类棋手一样自然的事情。

    虽说如此,实际应用场景复杂得多,还要在 Agent 、超长记忆、持续学习这几个领域有所进步才行,现在的技术这几个方面是明显薄弱的。很期待未来的发展。
    williamjing
        10
    williamjing  
       1 小时 59 分钟前
    以后 leetcode 的分数就没意义了,因为你面对的都会是 AI 。以后面试看来默认需要手撕代码了。
    mythabc
        11
    mythabc  
       1 小时 58 分钟前
    积极拥抱变化寻找出路,不要再钻研代码细节。
    (上回发了个 cursor 的帖子,还有人说我广告,时代都变了感觉 v2 有一帮冥顽不灵的人)
    tcper
        12
    tcper  
       1 小时 53 分钟前
    @CC11001100 你意思是自己刷一些题算训练了?你去看看 ACM 队员怎么训练的
    me1onsoda
        13
    me1onsoda  
       1 小时 39 分钟前   ❤️ 1
    @w568w 碳基生物何尝不是在背答案,效率还低。很多人一年半载再去刷 h100 又不会了。背到极致也算牛逼
    majula
        14
    majula  
       1 小时 25 分钟前   ❤️ 1
    想当年李世石柯洁输给阿尔法狗,岂不比楼主更加道心破碎。人家可都是实实在在的行业前 0.1%(不包括业余棋手)。

    李世石没几年就宣布隐退了,理由是输给 AI 后,他再也无法享受围棋这项竞技。

    柯洁则是一开始对 AI 各种冷嘲热讽,实战被吊打后则是破防嚎啕大哭。然后能明显感觉出来他对下棋越来越没有胜负欲,工作生活的重心也开始转移到围棋以外的地方。或许这就是我们这些“传统程序员”中一部分人的写照。

    好在程序员这个职业的工作内容几乎不是“算法竞技”,现实场景的业务涉及到和形形色色的人、和其他(非计算机)系统的对接,这些目前看来还很难由 AI 独立搞定。

    不过那些纯搞技术的“底层程序员”确实应该“睁眼看看世界”了,不然真的会被落在后面。我在 /t/1095887 #2 回复的后续,我们公司那帮老算法工程师在被 AI 降维打击一次后,现在也开始拥抱 AI ,用 LLM 辅助研究了。
    jukanntenn
        15
    jukanntenn  
       1 小时 19 分钟前
    高射炮打蚊子,别说大模型,我用搜索引擎也能达到同样的效果呀,这能说明什么问题呢?
    kk2syc
        16
    kk2syc  
       1 小时 14 分钟前
    你让大模型来试试高考题,应该连大专都不够分数。
    fpk5
        17
    fpk5  
       1 小时 2 分钟前 via iPhone
    周赛是给你练习速度和熟练度的,半个小时三道题就差不多了。你不能跟计算器比乘除法。
    levelworm
        18
    levelworm  
       57 分钟前 via Android
    @majula #14
    这个还不算底层。至少要到操作系统编译器这个层次,然后接触硬件啥的。AI 对于缺乏公开资料的东西还是不行,还能苟几年。
    mumbler
        19
    mumbler  
       41 分钟前
    现在最强模型是 gemini-2.0-flash-thinking-exp-01-21
    aistudio.google.com
    mumbler
        20
    mumbler  
       39 分钟前
    @kk2syc #16 现在三巨头大模型有博士水平,但不能保证一次做对,需要抽卡,重试多次高考全部能拿下
    kk2syc
        21
    kk2syc  
       31 分钟前
    @mumbler 但是高考对于大多数人来说只有一次机会,所以什么水平不重要,重要的是考题模型。换个说法吧,让大模型去考申论,永远都过不了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1239 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 18:00 · PVG 02:00 · LAX 10:00 · JFK 13:00
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.