李飞飞团队用不到 50 美元训练出媲美 DeepSeek Rl 的 AI 推理模型，诸君这个有可能么，该怎么用上啊

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

李飞飞团队用不到 50 美元训练出媲美 DeepSeek Rl 的 AI 推理模型格隆汇 2 月 6 日|据科创板日报，李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到 50 美元的云计算费用训练了一个名叫 s1 的人工智能推理模型。该模型在数学和编码能力测试中的表现与 OpenAl 的 o1 和 DeepSeek 的 R1 等尖端推理模型类似。研究人员表示，s1 是通过蒸馏法由谷歌推理模型 Gemini 2.0 FlashThinking Experimental 提炼出来的。

诸君这个有可能么，该怎么用上啊

训练

模型

1 条回复

omega3

6 天前

直接用 Gemini 2.0 FlashThinking Experimental