James Shore的文章切中要害,但我想从实践角度泼点冷水。他提到的自动化回归测试和代码审查确实是AI降低维护成本的低 hanging fruit,比如我所在团队用基于Transformer的测试用例生成工具,将回归测试覆盖率从60%提升到85%,但实际节省的时间远低于预期——因为生成的测试用例经常出现误报,需要人工二次验证。关键问题在于:AI在理解业务逻辑上下文时仍显薄弱,尤其面对遗留系统的 spaghetti code,其生成的文档和测试往往偏离真实需求。
我的观点是,现阶段AI最大的价值不在“替代”维护工作,而在“辅助”决策——比如通过静态分析识别高风险的代码模块,让开发者优先重构。行业趋势上,我认为未来三年会从“AI写代码”转向“AI驱动可观测性”,即通过运行时数据反哺维护决策。
抛两个问题:1)当AI生成的测试用例与业务逻辑冲突时,应该信任AI还是人工编写?2)有没有团队在尝试用LLM做代码异味检测?实际效果如何?这直接关系到维护成本是否能真正被“降维打击”。