Devin在实践中能做什么？

Cognition的演示展示了Devin处理端到端工程工作，例如重现和修复真实的GitHub问题（例如，来自SWE-bench的SymPy对数错误）、构建和部署Web应用程序（例如，部署到Netlify的交互式生命游戏网站），以及使用外部工具/服务（例如，在Modal上运行ControlNet）。

与Devin合作通常是怎样的？

Cognition描述的一个实用工作流程是：Devin起草一个分步计划（交互式规划），您批准或调整它，然后Devin执行——运行命令、迭代失败、修改文件并提出更改以供审查（例如，通过PR）。

Devin可以访问哪些工具？

Cognition描述Devin可以在持久性工作区内访问终端（用于环境设置和测试）、代码编辑器（用于阅读/修改文件）和浏览器（用于研究和与Web应用程序交互）。

Devin是如何被评估的，SWE-bench在此背景下是什么？

Cognition强调了来自SWE-bench（一个软件工程基准）的例子，其中包括Devin设置环境、重现错误、实施修复并运行测试的实例。在Cognition的比较中，他们指出Devin是独立完成的，而其他模型则是在辅助下完成的（即被告知具体要编辑哪些文件）。

Devin 2.0是什么，以及它有哪些变化？

Devin 2.0（于2025年4月3日发布）引入了“代理原生IDE”体验，并强调通过主动的代码库研究和详细规划来加快范围界定。Cognition还描述了能够启动多个并行Devin的能力，每个Devin都有自己独立的基于云的交互式IDE。

Devin Search和多代理功能是什么？

Cognition推出了Devin Search作为一种代理工具，用于探索和理解代码库。他们还描述了多代理工作流，其中多个Devin可以在隔离的VM中并行运行，同时在实践中保持写入单线程。

Devin是否可用，以及如何定价？

Cognition表示Devin在早期访问阶段，同时正在扩大容量。他们还宣布了一项灵活的计划，起价为20美元（Devin 2.0），后来又推出了新的自助服务计划（免费、专业版、高级版、团队版、企业版），并开始对包括Ask Devin和Devin Review在内的以前免费的产品收费。

Cognition的幕后是谁，以及它是如何获得资金的？

Cognition将自己描述为一个专注于推理和构建AI队友的应用AI实验室。该公司表示资金充足，其中包括由Founders Fund领投的2100万美元A轮融资，并得到了各行业领导者的支持。

Devin by Cognition

WebsiteFreeAI Code Assistant AI Developer Tools

Cognition 的 Devin 是一款自主 AI 软件工程代理，可以使用带有终端、编辑器和浏览器的代理原生 IDE，以及用于大型任务的搜索和并行云代理，端到端地规划、编码、运行测试、调试和发布 PR。

访问网站

推广此工具

https://www.cognition-labs.com/blog?ref=producthunt&utm_source=aipure

概述
视频
替代方案

产品信息

更新于：2026年05月19日

什么是 Devin by Cognition

Devin 是 Cognition 的“AI 软件工程师”，旨在通过自主执行从头到尾的真实软件工程工作流程，而不仅仅是自动完成代码。Devin 定位为工程团队的协作队友，可以接收任务，理解相关的代码库上下文，跨文件进行更改，在沙盒环境中运行命令和测试，并生成可审查的输出（例如拉取请求），这些输出遵循团队的开发流程。Cognition 已经展示了 Devin 在实际任务中的应用——例如修复现有代码库中的错误以及构建和部署应用程序——同时继续将产品扩展到代理原生的 IDE 体验，其中包含旨在理解代码库和规模化执行的功能。

Devin by Cognition 的主要功能

Cognition 的 Devin 是一款自主 AI 软件工程代理，旨在处理从计划到代码、测试再到部署的整个流程，其工作方式更像是一个队友，而非聊天工具。它能够探索和理解代码库（通过搜索/维基式索引），提出并执行分步计划，运行命令和 CI 进行自我验证，开启 PR，响应评审反馈，并迭代修复问题直到检查通过。最近的更新强调更紧密的端到端工作流程（代理原生 IDE/终端交接、代码评审辅助、调度和托管并行 Devin），以便团队可以卸载范围明确的工程工作和调查，同时让人类参与批准和合并决策。

端到端自主工程循环: 规划、编码、调试、运行测试/CI，并以 PR 形式交付更改——迭代失败和反馈，直到工作准备好合并。

带有人工批准的交互式规划: 预先起草一个具体的逐步计划，用户可以在执行前修改以调整范围和方法。

代码库理解（搜索/维基）: 索引仓库以回答问题、映射依赖关系、生成文档式摘要/图表，并加速入职和影响分析。

PR 评审和自动修复循环: 通过分析差异以查找可能的问题来支持评审工作流程，并可以获取 PR 评论/CI 结果以自动应用修复和更新。

多代理委托（托管 Devin）: 将大型任务分解为子任务，并在并行的隔离虚拟机中运行它们，同时保持写入协调以减少冲突。

终端 + 本地到云端交接: 在本地启动会话，并在任务超出笔记本电脑能力时将其交接到云端计算，从而保留上下文和进度。

Devin by Cognition 的使用场景

企业遗留系统现代化: 通过自动化重复的迁移步骤、验证和 PR 生成以供人工评审，实现跨多个仓库的遗留堆栈（例如 COBOL/旧版 Java）现代化。

大型代码库中的错误复现和修复: 设置环境，复现报告的问题（例如开源错误），实施修复，并运行测试以确认正确性，然后开启 PR。

安全/漏洞和 lint/CI 清理: 接收静态分析结果或失败的检查，并迭代修补代码直到 CI/lint 通过，从而减少工程团队的繁重工作。

高容量 PR 的代码评审加速: 帮助评审人员理解复杂的差异（包括复制/移动检测和逻辑分组），并标记可能的错误/警告以集中人工注意力。

通过调度进行重复性工程操作: 按计划运行可重复的任务（例如，定期检查、例行更新），并在运行之间保持状态，以便每个会话都能从上次中断的地方继续。

跨职能数据/运营调查（通过专业变体）: 在使用类似 Devin 的代理进行数据工作的组织中，团队可以提出运营问题（例如，“为什么注册人数下降了？”），并获得分析/SQL/仪表板，而无需让工程师脱离核心工作。

优点

通过自主处理规划→实施→测试→PR 迭代，减少了端到端工程的繁重工作。

提高了范围明确、可验证任务（迁移、错误修复、CI 清理）的吞吐量，并可以通过托管代理并行化工作。

与实际工程工作流程（PR、CI、评审评论、终端/本地到云端）集成，让人类掌握批准的控制权。

缺点

最适合明确的需求和可验证的结果；模糊/产品创意任务仍然需要强大的人工指导。

自主执行增加了对仔细审查/治理的需求，以避免回归或不一致的更改。

并行代理会增加协调复杂性；写入通常必须保持受控以防止冲突。

如何使用 Devin by Cognition

1) 获取 Devin 的访问权限: 如果您的公司已经与 Cognition 合作，请向您的管理员或 Cognition 请求权限。然后登录 Devin 网络应用程序 app.devin.ai。

2) 启动 Devin 会话（网页版）: 打开 app.devin.ai 并创建一个新会话。提供清晰的任务提示（例如，错误报告、功能请求、重构、迁移）。Devin 将为您起草一个分步计划，供您批准或调整（交互式规划）。

3) 启动 Devin 会话（终端版）: 使用 Devin for Terminal 从您的终端本地启动。当任务超出您的笔记本电脑的处理能力时，将同一会话转移到云端并在那里继续。

4) 将 Devin 连接到您的工程工作流程 (Linear): 直接在 Linear 中将工单分配给 Devin 或添加 Devin 标签。对于错误分类自动化，配置您的工作流程，以便添加“Bug”标签时自动触发 Devin——无需手动分配。

5) (可选) 通过 MCP 连接可观测性/数据工具（例如 Datadog）: 连接 Datadog MCP，以便 Devin 可以在调查期间查询日志。这有助于 Devin 在代码级根本原因分析的同时包含证据（日志发现）。

6) 让 Devin 端到端地调查错误: 当被触发时（例如，通过 Bug 标签），Devin 可以定位相关文件，检查最近的更改（例如，通过 git 历史记录），并将摘要发布回工单：可能的根本原因、受影响的文件和建议的修复方法。

7) 让 Devin 实施修复并处理 CI/lint 直到通过: Devin 可以进行代码更改、运行检查/测试，并迭代失败。它还可以处理 CI/lint 问题，直到所有检查都通过，从而完成从调查到工作修复的闭环。

8) 使用 Devin Search / DeepWiki 进行代码库理解: 使用 Devin 的代码库理解工具来探索存储库。DeepWiki 可以自动索引存储库并生成包含架构图、源代码链接和摘要的 Wiki，以加快入职和调查速度。

9) 使用 Devin Review 扩展 PR 审查: 在 Devin Review 中打开 PR 以更快地理解更改。它按逻辑（而非仅仅按字母顺序）组织差异，检测复制/移动操作以获得更清晰的差异，并运行 AI 错误检测，根据置信度/严重性标记问题。

10) 通过审查反馈关闭代理循环: 在 PR 审查期间，像往常一样留下评论。Devin 可以获取审查反馈和 CI 结果并进行迭代，直到 PR 获得批准并准备合并（包括在支持的情况下自动修复审查评论）。

11) 使用托管的 Devins 进行并行工作（大型任务）: 对于大型项目，让 Devin 将工作分解为独立的块，并并行启动多个托管的 Devins。每个都在自己的隔离 VM 中运行，具有终端/浏览器/开发环境，通过测试验证更改，并报告结果。

12) 使用调度进行重复性任务: 如果任务需要重复运行（例如，定期检查或日常维护），请告诉 Devin 安排重复会话。Devin 在运行之间保持状态，因此每个会话都可以从上次中断的地方继续。

13) 使用 DANA 进行数据库/数据查询（如果您的工作区中可用）: 从网络应用程序中的代理选择器中选择 DANA（一个专门用于查询数据库、分析数据和创建可视化的 Devin 优化版本），或者从 Slack 使用 /dana 或 @Devin !dana 进行提问。DANA 可以回答包含 SQL 的问题，以便团队可以验证逻辑。

14) 提供反馈以随着时间的推移改进结果: 通过在聊天中提供反馈并接受或添加知识来指导 Devin。您还可以通过 [email protected]、Slack Connect (Teams) 或应用内反馈按钮发送反馈；Cognition 会记录客户反馈以推动改进。