一个来自中国创业者 L5 自主编程能力的探索

330 天前
 yafeilee

大家好,我是 ShowMeBug 的创始人亚飞,全栈工程师,连续创业者。今天非常高兴跟大家介绍一下,我们自主研发的、带有 L5 自主编程能力的 1024Code 云端开发平台和进展情况,目前我们已经启动了公测邀请。

1024Code 云端开发平台介绍视频: https://www.bilibili.com/video/BV1YF4m1c7rH/?share_source=copy_web&vd_source=9bb16af47f4ff115bffa964190f6fa4b

1024Code 的核心能力

1024Code 是采用 1024PaaS (全栈自研的云端编程环境)为核心,通用大模型为基座,花费了 10 多个月构建一套自主决策链 AI Agent (目前称为 AI 导师),提供了编程环境感知,代码编辑,Shell 、Console 的自阅读,运行与自主 Debug 。

简单来说,就是将 AI Agent 安装了手与脚,让其自主完成需求分析到编码调试的过程。

1024Code 尝试定义 AI 与人类编程交互的新方式

在当前阶段,1024Code 更相信人类的代码,所以 AI 在修改人类代码时需要人类确认,AI 在修改自己的代码时可以立刻生效。

得益于我们全栈自研的技术,我们的团队能够深度定义编辑器的内核,实现快编辑的能力,能够准确区分代码是来自 AI 生成还是人类编写。

具体能力介绍

从零开发一个小项目

1024Code 可以根据你的需求介绍,进行 MVP (最小可行版本)拆解需求,然后实现第一版 MVP 。它可以实现一个小型项目(至多不超过 10 个)多个文件的生成和编辑。

解决一个小的需求

你提出需求,1024Code 的 AI 导师会首先自行感悟编程环境(例如是哪个语言哪个框架),然后分析需求(如遇需求不清楚时会自行跟你互动),构建代码语义树,确定需要创建新的文件或者修改哪些文件,生成对应代码,利用 1024PaaS 提供的更新代码块能力进行逐字处理。最后尝试运行代码并检查控制台输出,完成本次需求实现。

自动 Debug 错误

发现控制台的错误时,它会自行开始 Debug 调试错误。读取报错信息并决定如何修复,然后读取对应代码进行修改。

与人类在代码归属上创新互动

AI 导师可以直接修改它自己之前完成的代码,修改人类代码需要一个确认与 diff 比较的过程。

1024Code 中 AI 导师的能力限制

AI 导师在 1024Code 中是一个完全拟人的存在,它有自己独立的交互界面,甚至人类可以直接观察它的每一步操作。由于当前大模型的智能还不足够,我们看一下能力上的限制。

决策能力上的限制

目前超出 10 个文件的较大项目表现会出现成功率大幅下降的情况。

在网页项目、命令行项目、Python 游戏外的项目,目前没有针对优化。

浏览器眼睛视觉还未添加

在更理想的情况下,AI 导师应该能主动识别浏览器网页上的界面错误,并进行修复,但这个依赖于现有大模型的多模态能力与 Token 成本,目前还未实现相关能力。

未来的展望

未来的编程世界将发生重大范式变化,云端编程+原生 AI 编程将彻底改变传统本地开发方式,就如同文档在线化置于本地编辑,Figma 置于 PS ,网盘置于本地 USB 存储。80% 的代码由 AI 完成,人类完成剩下的架构工作是接下来 AI 时代相当长时间持续的一种新的编程常态。

具体案例

同事跑了几个项目,大家可以点击视频链接了解:

  1. 尝试使用 1024Code 的 Agent 智能体功能修复 Chart.js 里一个 Bughttps://www.bilibili.com/video/BV1Lj421f7UK/?share_source=copy_web&vd_source=9bb16af47f4ff115bffa964190f6fa4b

  2. 使用 Agent 智能体功能补全&迭代音乐播放器项目代码https://www.bilibili.com/video/BV1uK421v74Z/?share_source=copy_web&vd_source=9bb16af47f4ff115bffa964190f6fa4b

  3. 国内也有 Devin 了?一句话需求生成 2048 游戏!https://www.bilibili.com/video/BV1m2421N7eN/?share_source=copy_web&vd_source=9bb16af47f4ff115bffa964190f6fa4b

我们已经发布邀请码公测

1024Code 目前已经启动了邀请码公测,大家可以通过朋友或者主动申请获取邀请码来体验和使用产品,目前整个产品完全免费,AI Agent 的体验使用是积分消耗模式。

如果你在商业、投资或大模型能力上想与 1024Code 合作可以直接加创始人微信号:lyfi2003

让我们一起打造下一代全新 L5 全自主编程新范式吧!

8211 次点击
所在节点    分享创造
34 条回复
xiaoyoumaojun
329 天前
体验了一下,感觉确实不错,非常看好! 这款产品非常适合开发爱好者,不管是小白还是资深开发者,都非常的实用且友好~
matrix1010
329 天前
@locoz 把代码丢给 AI 改这个是 L1 或者 L2 级别,L5 级别是完全自主决策(开发->测试->部署),通俗来说就是不要程序员了。我觉得 L1/L2 级别 op 这样没什么 AI 背景的公司可以做,就相当于强化版 GPT 套壳,但 L5 级可能真的要 cognition 这样精英 AI 团队来完成。如果你仔细看一遍 devin 的视频,devin 会自主打开浏览器查询信息,程序无法运行时会自主添加 print 代码并根据 print 自动 debug 。

BTW ShowMeBug 是一个面试程序员的产品,op 现在却要做一个 L5 编程替代程序员的产品,挺耐人寻味。
locoz
329 天前
@matrix1010 #22 你把事情想复杂了,自己去搜索、根据搜索到的页面内容进行归纳总结和找到需要的信息、自己添加日志进行 debug 、自动调用命令行、自动通过特定方式部署程序等模拟人机交互的事情,都是只需要做好操作接口,并且在 prompt 中告诉语言模型可以这么做,就能轻松做到的事情,这方面反而是这整个产品中最简单、最没有门槛的。

因为做到这些事情的核心在于决策能力,而决策能力来源于语言模型,像 GPT4 、Claude2 这种头部级别的大语言模型本身就具备做出这种决策的能力,并且之前出现过的很多让 AI 进行自动化操作的产品都是这么做的,包括 ChatGPT 上的插件功能本质上也就是这么做的。
matrix1010
329 天前
@locoz 我们一年后看吧。你说很简单,我觉得没那么简单,那就只能等一等,看看同类型产品是层出不穷还是 devin 一枝独秀。
duron600
329 天前
L5 是啥
xieren58
329 天前
ShowMeBug 是不是要完蛋了???
yafeilee
329 天前
@xieren58 我们使命是帮助程序员的工程能力评估成长和工程效率提升,是我们 showmebug 产品新的衍生和对方向的把握的探索,更多会助力中国技术人才的发展而不是取代,不知道你如何下此判断。
yafeilee
329 天前
@duron600 全自主的意思,google 有对 agi 的定义,区别于现有的 L3 左右的 ai 助手式的交互
vultr
329 天前
@yafeilee 这是一个生成前端代码的工具吗?后端代码能不能干?
qgy18
329 天前
这个必须支持
yafeilee
328 天前
@vultr 目前 python 游戏,python 命令,网页表现还可以,其他没有特别优化。还需要更强的大模型底座。
buchikoma
327 天前
感觉这种产品的最大受益者是大学生,完美应付各种作业和课设
w4ngzhen
327 天前
看到了你们发的截图,是如何评判命令行工具复杂度算是 level1 ?就因为没有 UI 么?
yafeilee
325 天前
@w4ngzhen 主要还是测试结果 ai 理解需求很轻松 正确率超过了 50%

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://tanronggui.xyz/t/1024090

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX