V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
stelvetica
V2EX  ›  问与答

李飞飞团队用不到 50 美元训练出媲美 DeepSeek Rl 的 AI 推理模型,诸君这个有可能么,该怎么用上啊

  •  
  •   stelvetica · 6 天前 · 590 次点击

    李飞飞团队用不到 50 美元训练出媲美 DeepSeek Rl 的 AI 推理模型 格隆汇 2 月 6 日|据科创板日报,李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到 50 美元的云计算费用训练了一个名叫 s1 的人工智能推理模型。该模型在数学和编码能力测试中的表现与 OpenAl 的 o1 和 DeepSeek 的 R1 等尖端推理模型类似。研究人员表示,s1 是通过蒸馏法由谷歌推理模型 Gemini 2.0 FlashThinking Experimental 提炼出来的。

    诸君这个有可能么,该怎么用上啊

    1 条回复
    omega3
        1
    omega3  
       6 天前
    直接用 Gemini 2.0 FlashThinking Experimental
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3900 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 05:15 · PVG 13:15 · LAX 21:15 · JFK 00:15
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.