构建个人 AI 工厂(2025 年 7 月版) - 中文版

#中文

[译]构建个人 AI 工厂(2025 年 7 月版)

构建个人 AI 工厂

John Rush 介绍了一种高效利用 AI 工具构建个人开发工厂的方法。他通过多个 claude 代码窗口同时运行,每个窗口对应独立的 git-worktree 分支,利用 o3 和 sonnet 4 等工具制定计划、执行计划并验证结果,最终实现代码的自我进化。

John 遵循的核心指导原则是“修正输入,而非输出”。当出现问题时,他不会直接手动修补生成的代码,而是通过调整计划、提示或代理组合,确保下一次运行从构建层面就是正确的。这种理念类似于游戏 Factorio 中的自我生产工厂,通过 AI 代理实现一个能生成代码、验证代码并自我改进的代理工厂。

在日常基础工作流程中,John 的主要交互界面是 claude code,并运行本地 mcp 系统执行 Goose 和 o3。第一步是规划阶段,将高层级任务提交给 claude code,调用 o3 生成执行计划并生成包含原始需求与实施方案的 <task>-plan.md 文件。第二步是执行阶段,sonnet 4 读取计划并将其转化为任务清单,根据任务复杂度选择 sonnet 3.7 或 sonnet 4 执行计划,同时要求 claude 在完成每个任务步骤时同步编写提交记录,以便在出错时回退到之前的状态。第三步是验证阶段,sonnet 4 根据原始方案验证代码,o3 进行二次验证,指出并要求删除不必要的向后兼容代码和“lint 忽略标记”,任何问题都会反馈到方案模板中修正,而非直接在线修改。

John 认为输入优于输出,因为输出结果可弃置,而计划和提示词能持续积累价值。在源头调试能惠及所有未来任务,将智能体从代码打印机转变为自我提升的协作伙伴。例如,曾有智能体编写了将整个 CSV 加载到内存的代码,John 让智能体改用流式处理,并将“CSV 必须使用流式处理”写入计划规范,现在计划检查器会自动标记任何未采用流式处理的 CSV 代码,这就是工厂的自我进化。

为了扩展 AI 工厂规模,John 已开始编码更复杂的工作流,为特定任务构建专门的代理(通过 MCPs 实现)。一个 MCP 会扫描所有生成的 Clojure 代码,应用本地代码风格规则,另一个 MCP 会检查生成的代码,将重试和 Thread/sleep 等代码替换成内部重试库。John 正在构建一系列这样的小型智能体,每个智能体处理一项特定任务,通过组合它们搭建更复杂的工作流程,例如生成 API 集成方案、测试用例和技术文档,显著提升功能开发和系统集成的效率。

实现这一目标的关键在于持续迭代输入内容。并行发起多个任务尝试几乎没有成本,所有智能体都并行运作,当某个智能体失败、卡顿或缺乏上下文时,John 会把经验教训反馈到下一轮迭代中,优化输入内容。代码本身是可丢弃的,而指令集和智能体才是真正的资产。

John 正在改进工厂的几个方面,包括优化智能体之间的整体协调,实现更自动化的工作流管理和智能体间依赖关系处理;将业务文档与智能体对齐,调整采集信息的抽象层级,聚焦于用例场景;构建更复杂的工作流,增加更多智能体和更紧密的协调;以及跨供应商优化 token 使用,实现 Claude Max 套餐与 Bedrock 之间的无缝切换。

John 的 AI 工厂已经足够在其续杯咖啡时自动提交代码,但还不足以让其彻底告别工资单。尽管约束条件会变,但核心原则不变:修正输入,而非输出。

#AI #实践 #思考 #Claude #ChatGPT

Building a Personal AI Factory (July 2025 snapshot)

2025 AI 报告

根据 ICONIQ 发布的《2025 年人工智能状况报告:构建者手册》,今年的行业焦点已从企业如何采购 AI 转向了构建者如何构思、交付并规模化 AI 产品的实践指南。报告围绕五大核心维度展开:产品路线图与架构、市场进入 (GTM) 策略、人才与团队、成本管理与 ROI,以及内部生产力。

在生成式 AI 产品的开发上,代理工作流 (Agentic Workflows) 和垂直行业应用是最热门的方向,其中近 80% 的 AI 原生公司正致力于构建代理工作流。多数公司依赖第三方 AI API,但高增长公司更倾向于微调现有模型或开发专有模型以实现深度定制。OpenAI 的 GPT 系列模型依旧是市场首选 ,不过企业正普遍采纳多模型策略,平均每家公司使用 2.8 个模型以优化不同场景。技术上,检索增强生成 (RAG) 和微调 (Fine-tuning) 是最常用的模型适配方法 。部署 AI 产品时,开发者面临的最大挑战是模型幻觉 、可解释性与信任 ,以及如何有效证明投资回报率 (ROI)。

在市场进入策略方面,多数公司目前将 AI 功能作为增值服务捆绑在高级付费套餐中 (40%) 或免费提供 (33%) ,这表明 AI 目前更多被用作竞争优势而非独立的利润中心。尽管如此,已有 37% 的公司开始探索基于使用量或 ROI 的新型定价模式 。随着产品走向成熟,向客户提供 AI 决策的透明度变得至关重要 。在合规与治理层面,“人在回路” (human-in-the-loop) 的监督 (66%) 是确保 AI 公平与安全最核心的保障措施。