大模型的能力始于泛化,但是也困于泛化。
今年开始使用agent帮助coding的占比是明显低于去年的,一方面是对ai的强大能力已经接受了,但主要是因为目前的工作集中于AI的能力边界附近。
coding Agent的能力边界在哪呢,我认为是精准。实际工作中,难以让AI精准的输出一行我想要的代码,因为客观来说这行代码是逻辑不完备的,是具有漏洞的,但是从业务或者架构角度而言这行代码是最合适的,反而AI会做很多拉低计算或者程序效率的操作,应该如何向它同步这些上下文呢,一个好的项目infra,一个好的skill或者其他md文件固然可以弥补,但是终究还是难以顾及全方面,而一旦忽略对代码的review,在Ai强大的生成能力下很快代码就会变成一个屎山,逻辑混乱、代码重复,边界条件异常奇怪等等。
特别是贴近业务侧的代码,以及一些主观上已经有了设计的代码,交给ai来做是很难完成的。但是在基本功能实现,指定接口的函数实现、一次性工具(不顾及代码美观),这些还是在agent的舒适区的。事实上,图片、视频等领域我的体验也是这样的情况