Loading...

每个 PR 都被 AI 逐行拷打的感觉,真的很爽

发布于

AI 时代是这样的。AI 只要写代码就可以,可 Code Review 要考虑的事情就很多了

image

写代码这件事被 AI 极大提速了,但 CodeReview 并没有一起变轻松

写代码的时候目标通常比较明确——把需求实现出来就行。

但 Review 不一样,你得同时盯好几条线:逻辑对不对、边界有没有漏、异常处理稳不稳、命名是不是别人一看就懂、可维护性怎么样、有没有潜在 bug、安全问题、性能问题……写和审本来就不是同一类脑力活。

AI 在”生成”这件事上已经很强了。但兜底和挑错,依然是成本更高的环节。产出提速了,审查没有,这中间的落差正在变大。

最近 AI 圈在聊一个词叫 Harness——意思大概是:模型再强,能不能把事真正干完、干稳,靠的是模型外面那一层。Code Review 就是那一层里很关键的一块。


Vibe Coding 越爽,人工 Review 越跟不上

image

我平时会拿 AI 做一些 vibe coding 小项目。好处很明显——快、顺、能一直往前堆。写着写着就上头了,想法一个接一个往外冒,代码跟着就出来了。

但问题也摆在那:AI 生成的代码我不完全相信,我又不想自己逐行检查,有时候甚至也看不太懂它写了什么。于是就出现了一个很矛盾的状态——继续往上堆很爽,停下来 Review 很痛苦。

我不是不想做 Review。我是不想每次都手动介入一次 Review,至少让AI先审一遍找出明显问题。


所以我做了一个直接长在 GitHub PR 里的 AI Review:Oops

image

我不想再做一个聊天机器人,也不想每次手动开 Claude Code /review。更想要的是把 Review 这件事直接放进我本来就在用的 GitHub 工作流里。

Oops 是一个 GitHub App。代码推上去,PR 发出来,Oops 自动开始工作,最后把结果回到 GitHub。不用切工具,不用手动触发,不用记命令。

欢迎大家安装试用:👉 https://oops.denox.cc/codereview 👈

仓库地址:Github

而这件事,我从想法到跑起来,只花了一个晚上

真正有产品价值的,不是模型回答了什么,而是它嵌进了你原本就在用的流程。

image


不止分析 diff,而是在沙盒里真实 Review

image

只看 diff,很多信息是不完整的。真正的 Review 往往依赖上下文——这个文件在项目里怎么被调用,相关逻辑是不是在别处已经有实现,改动前后是不是和仓库整体结构一致。光看 diff,这些你都看不到。

以前我自己仓库能跑的,也就是 lint、关键词匹配,再不济上个付费产品凑合用。这些东西看的还是表面,缺的就是”真的把代码拉下来读一遍”的那一步。

所以 Oops 会在沙盒里真实拉代码、拿上下文、做更接近真实开发环境的评审。不是让模型说两句,而是让 AI 真正进入代码上下文里干活。


一晚上能做完这件事,靠的不是我多能写代码,是 ADP 把工程底盘打得足够牢

image

如果不是基于 腾讯云ADP Claw模式,我从零做这套东西,光是要自己处理沙盒调度,想想就猪脑过载了,环境怎么隔离、生命周期怎么管、跑完怎么回收,每一项都够我搞一周。

我没自己搭 Runtime。Agent Runtime 让 Oops 不是一次性调用就完事,而是一个完整任务的执行过程——拉代码、读上下文、跑评审、回写结果,整条链路在一个 runtime 里走完。

ADP 本质上就是一套生产级 Harness,云沙盒直接给我一个隔离环境,代码评审在里面跑,不碰本地、也不污染主机。

而且我没做并发控制。Agent Runtime 的沙盒是毫秒级启动、百万级并发的——多个 PR 同时进来,我不用担心排队、不用担心抢资源。

每个能力都不是摆设——它们各自对应我做 Oops 时本来要踩的坑。基础打牢了,我才能把一晚上的精力全压在”Review 这件事本身该怎么做好”上,而不是花在搭基础设施上。


过去大家谈 AI coding,多数都在讨论”怎么让它写得更快”。但真正要让这套流程跑顺,不只是生成更快就行,还得有一层机制去承接生成之后的检查、反馈、修改。

AI 的价值不只是写代码,也应该包括审代码、提问题、帮你补后续流程。

当 AI 开始 Review AI,研发流程才真正闭环。

加入智能体创作者社群🚀

加入交流群

欢迎加入 ADP 创作者交流群一起构建!