【CSDN 编者按】AI 技术的快速发展,让越来越多的企业和开发者开始尝试将 AI 工具应用于软件开发中,期望能够提升开发效率、减轻开发负担。Devin,作为一款自发布便备受瞩目的自动化 AI 开发工具,宣称能够像人类工程师一样独立完成从代码编写到调试、部署等一系列任务。为了验证这个说法,本文作者经过一个月的实际测试,分享了他们的亲身体验和深刻感想。
2024 年 3 月,一家新的 AI 公司突然崭露头角,凭借强大的融资支持,吸引了业界的广泛关注:它完成了由 Founders Fund 领投的 2100 万美元 A 轮融资,同时得到了行业领袖们的支持,包括 Collison 兄弟、Elad Gil 以及科技界的其他杰出人物。这家公司背后的团队成员更是令人惊叹:他们都是国际奥林匹克信息学竞赛(IOI)金牌得主——这些人解决的编程问题大多数人都难以理解。他们推出的产品名为 Devin,声称将是一位完全自主的软件工程师,能够像人类同事一样与你对话,完成从学习新技术、调试成熟代码库到部署完整应用,甚至训练 AI 模型等各类任务。
作为 Answer.AI 团队的一员,我们一直在实验 AI 开发者工具,而 Devin 给我们带来了一种不同的感觉。如果它能兑现其承诺的一半,那么它确实有可能改变我们的工作方式。然而,尽管 Twitter 上充满了激动人心的评论,但我们发现实际使用它的详细报道却寥寥无几。于是,我们决定亲自测试 Devin,用一系列真实任务来考验它。这篇文章便是我们对 Devin 的深入探索——对 2024 年最受关注的 AI 产品进行一次彻底的检验。
(AI 生成图片)
Devin 是什么?
Devin 的独特之处在于其基础设施。不同于一般的 AI 助手,Devin 通过 Slack 平台操作,并且能够自建计算环境。当你与 Devin 进行对话时,实际上是在与一个拥有完整计算环境的 AI 交流——这个环境包括了网页浏览器、代码编辑器和命令行界面。Devin 能够安装依赖项、查阅文档,甚至预览它自己创建的 Web 应用。以下是启动任务让 Devin 工作的一种方法:
(通过 Slack 启动 Devin 任务的方式)
整个体验设计上让人感觉像是在与同事交流。你描述想要完成的工作,Devin 就开始行动。通过 Slack,你可以观察它解决问题的过程,必要时向你请求凭证,并在任务完成后分享链接。而背后,它正在一个 Docker 容器中运行,使其能够在隔离环境下安全地进行实验,同时保护你的系统不受影响。此外,Devin 还提供了一个 Web 界面,允许你访问其工作环境,实时观看它与 IDE、网页浏览器等工具的交互。以下是Web界面的截图:
(Devin 的 Web 界面)
初步成功
我们交给 Devin 的第一个任务简单但真实:将 Notion 数据库中的数据导入 Google Sheets。Devin 以惊人的能力完成了这一任务:它找到了 Notion API 文档,理解了所需内容,并指导我一步步设置 Google Cloud Console 中的必要凭证。不同于单纯提供 API 指令,它一步步引导我完成每个菜单的操作和按钮的点击,省去了通常繁琐的文档查找过程。整个过程持续了大约一个小时,其中只有几分钟的人工干预。最终,Devin 分享了一个链接,指向一个格式完美的 Google Sheets 文档,成功完成了数据的导入。