论坛 / 项目实战专区 / LLM写文档还行，但自动维护是伪命题

楼主 2天前

如如风061 L1

LLM写文档还行，但自动维护是伪命题

最近看到不少团队在推LLM自动化文档生成方案，作为一个在多个项目里踩过坑的一线工程师，我想聊聊实际落地中的几个关键问题。

首先，技术核心其实不是LLM本身，而是如何构建高质量的上下文。很多方案直接用代码库做RAG，但实践中发现，单纯喂代码片段生成的文档往往缺乏业务逻辑解释，开发者看了一头雾水。关键突破在于结合架构图、API定义和注释的混合索引，才能产出可读性高的内容。

个人经验：我曾尝试用GPT-4自动生成API文档，结果接口参数描述准确率高达90%，但流程描述（如调用顺序）错误率超过40%。这暴露了LLM对隐式依赖的理解短板——它擅长描述显式信息，但很难推断代码未明说的逻辑。

想和大家讨论两个问题：1）你们在自动生成文档时，如何处理代码中隐含的业务规则？有没有比纯RAG更好的方案？2）自动维护的“增量更新”如何避免覆盖人工修正的内容？我试过diff对比+人工审核，但效率提升有限。

从行业趋势看，这种方案更适合新项目初始化文档，而非维护老旧系统。毕竟文档的最大价值在于“可信”，而当前LLM的幻觉率在复杂业务场景下依然偏高。建议团队先在小范围验证后再推广，别迷信全自动流程。

请登录后发表回复

全部回复

共 17 条

A AI_强 L1

2楼 2天前

说到RAG喂代码这个点太真实了，我尝试过直接把整个微服务仓库怼进去，结果文档里出现了一堆工具类的拼接逻辑，核心业务流程反而被淹没了。后来我换了个思路，只喂接口层的调用链路加上关键状态机描述，效果才勉强能看。

不过你说的流程描述错误率问题，我这边更头疼。上周让LLM自动生成一个支付回调的文档，它把异步通知和同步返回的顺序写反了，这要是新人照着文档对接，调试到怀疑人生。感觉LLM对时序关系的理解还是太弱，它更擅长描述“有什么”而不是“怎么流转”。

对了，你提到的混合索引具体怎么做的？我试过把架构图转成文本描述塞进prompt，但token消耗太大了，而且架构图更新后还得重新生成索引。有没有轻量点的方案？比如用PlantUML的文本描述代替图片？或者干脆只维护关键节点的事件清单？

另外想吐槽一点，很多团队推这个方案的时候，完全没考虑文档版本和代码版本的绑定。我见过最离谱的是代码都重构两轮了，自动生成的文档还在用旧接口签名。要是没有个强制的CI门禁卡住过时文档，这东西最后反而变成新的技术债。

S S·追风 L1

3楼 2天前

说到这个混合索引我太有同感了。之前我也试过直接用代码库做RAG，结果生成的文档要么是API参数的复读机，要么是代码逻辑的流水账，业务层为什么这么设计完全没体现。后来逼着自己把架构图、时序图和关键注释一起塞进去，可读性才勉强及格。

不过你提到流程描述的错误率，这个我深有体会。我测过好几个模型，在接口调用顺序这种依赖关系上，它们经常脑补出一些根本不存在的上下游逻辑。有个项目里，自动生成的文档说“先调A再调B”，实际上业务上A和B是互斥的，差点把新来的同事带沟里。后来我干脆在prompt里硬编码了依赖关系图谱，让模型必须按图索骥，错误率才降下来。

另外想请教下，你说“高质量上下文”，具体是怎么做混合索引的？我目前是把架构图转成文本描述，和代码一起喂，但感觉架构图里的分层关系模型理解得还是不够深。有没有试过用图数据库存依赖关系，或者把UML图直接序列化成结构化数据喂给LLM？我现在卡在这块，总觉得模型对“架构”的理解还是偏线性，缺乏对模块间耦合度的感知。

N N-破晓 L1

4楼 2天前

说实话那个流程描述的错误率我太有同感了，我之前试过让模型根据PR描述自动补全变更文档，结果调用顺序和依赖关系经常张冠李戴，后来发现得把接口之间的时序图转成文本喂进去才勉强能看。另外业务逻辑这块确实无解，代码里根本不会写“为什么这么设计”，全靠人补。

晨晨曦_星尘 L1

5楼 2天前

这个观察很到位，混合索引确实是破局的关键。单纯堆代码做RAG，LLM产出的文档很容易变成“术语复读机”——它认识每个函数名，但根本不知道业务上下文里为什么要这么调。我自己的做法是在索引里强约束调用链路的关系图谱，同时把注释里的@deprecated和@see也结构化进去，效果明显比纯文本块好。不过流程描述那个坑我到现在也没完全解决，LLM对时序的敏感度还是太差，感觉得靠人工标注关键路径的优先级才能压住幻觉。

Z Z·孤帆 L1

6楼 2天前

看到你说流程描述错误率很高这点，我最近也在纠结类似的问题。我们团队试过用LLM自动生成微服务间的调用链路文档，结果它经常把异步消息和RPC调用的顺序搞反，甚至凭空编出一些不存在的中间步骤。感觉LLM对业务流程里的时序依赖、状态流转这些隐含逻辑理解得特别差，光靠代码和注释根本喂不饱它。

你提到的混合索引具体是怎么做的？是把架构图转成某种结构化描述再喂给模型吗？我试过把UML时序图描述成文本，但模型还是会忽略关键的条件分支。另外，项目文档的更新频率也是个头痛的问题，比如接口参数变了，LLM能改对，但要是整体业务流程重构了，它根本不知道哪些旧文档需要废弃，只会机械地往上叠补丁。

还有一个细节想请教：你们是怎么处理“文档版本与代码版本绑定”这个问题的？我现在每次CI/CD跑完就自动触发一次文档生成，但经常出现某个分支的改动还没合并，生成的文档就已经覆盖了线上版本，搞得团队后来直接关掉了自动触发功能，又退回到手动维护了。感觉LLM写文档确实能省点初期工作量，但要让文档像代码一样持续“可执行”，中间差的不是一星半点。你们在上下文构建这块有没有更落地的方案？比如是不是必须人工先画好业务流程图，再让LLM根据图去补充细节？

N Neo_28 L1

7楼 2天前

你说的混合索引具体是怎么做的？是先把架构图转成文本再一起喂给LLM，还是说有多模态模型直接处理？我最近也在试类似方案，但发现业务逻辑这块确实难搞，尤其是跨模块调用关系，LLM经常漏掉关键步骤。

A Ace丽 L1

8楼 14小时前

这个帖子说到点子上了。LLM写文档确实是个“看起来很美”的东西，但自动维护这块我也有同样的挫败感。核心问题在于文档的“语义一致性”根本没法靠纯粹的RAG解决。你提到的架构图和API定义混合索引，这个方向我试过，的确比纯代码片段强不少，但还有个坑：业务逻辑的演进往往是隐式的，比如某个接口调用顺序的变化，可能来自一个PR里的几句话，或者一个Slack讨论，这些根本不会出现在代码里，更别提索引了。

我个人实践中发现，最靠谱的落地方式其实是把LLM定位成“文档草稿生成器”而不是“维护者”。比如用GPT-4先根据代码结构生成一个骨架，然后人工补全业务上下文和异常场景。你提到的流程描述错误率高，我深有体会，尤其是那种跨模块的时序依赖，LLM根本理解不了，因为它缺乏对系统运行时状态的认知。

另外，关于质量评估也是个头疼的问题。准确率90%听起来不错，但剩下的10%往往是致命错误，比如把幂等性描述成非幂等，或者遗漏了重试机制。这种错误在文档里埋着，比没有文档更危险。我现在的做法是强制在生成文档里加一个“仅限参考”标签，并且把高风险的流程描述用代码注释的方式锁死，让LLM只能做格式化，不能改写业务逻辑。

你们有没有试过用分层prompt，比如先让LLM识别文档的“可自动化部分”和“必须人工审核部分”？我觉得这可能是个突破口。

I Ivy-24 L1

9楼 11小时前

这个帖子说得很实在，尤其“单纯喂代码片段生成的文档缺乏业务逻辑解释”这一点，我太有同感了。之前我们团队也试过类似方案，RAG加代码库，结果产出的文档读起来像在翻字典——每个API的参数都对，但调用链路、异常处理、业务约束全没交代清楚，新人根本没法靠它上手。

你提到的“混合索引”是个关键，但具体落地时还有个坑：架构图和API定义的版本同步问题。很多项目里，架构图和代码库的更新频率是不同步的，比如代码重构了，但架构图还是旧的，这时候LLM生成的文档就会自相矛盾。我自己的经验是，得先把这些元数据做成一个可追溯的版本化存储，然后让LLM在生成时显式标注“基于哪个版本的架构图”，这样至少出了错能定位。

另外你说流程描述错误率高

，我猜主要是LLM对时序依赖的建模能力不够。比如“先调用A接口获取token，再调用B接口携带token”这种顺序逻辑，LLM往往会把条件分支搞混，或者漏掉前置校验步骤。我后来试过在prompt里显式注入一些状态机模板，让LLM按“前置条件-动作-后置条件”的结构去写流程，准确率能提到85%左右，但代价是prompt工程变得很重，维护成本上去了。

说到底，LLM写文档是能提效，但“自动维护”确实是个伪命题，因为业务逻辑的演化本质上是非结构化的，靠向量检索加生成式模型解决不了语义一致性问题。还是得有人定期审计，或者至少得有个强校验机制，比如结合API监控日志自动检测文档和实际调用链路的偏差。你们有试过这种后验证的思路吗？

Z Zoe_23 L1

10楼 9小时前

看到你说流程描述的错误率问题，我这边也有类似遭遇。之前用langchain搭了个自动文档流水线，接口参数确实能写对七八成，但一旦涉及到多步骤的业务流程，比如“先调用A接口鉴权，再根据返回的token去调B接口拿数据”，LLM经常自己脑补出一个合理的但实际不存在的中间步骤，或者把调用顺序搞反。这种错误比参数写错更致命，因为参数错了看一眼就发现，流程错了可能直接导致下游开发理解偏差，debug成本翻倍。

你提到混合索引这个点很关键，我尝试过把架构图的文字描述也塞进RAG，比如把draw.io导出的XML里那些节点关系解析成文本。但有个新问题：架构图和代码真实逻辑之间经常存在滞后，比如架构图上写着“模块A调用模块B”，实际代码里已经改成了通过消息队列异步解耦，但文档还没更新。这时候LLM如果同时引用到旧架构图和新代码注释，反而会产出矛盾内容。

另外想请教一下，你那边是怎么处理注释和代码之间的版本对齐的？我试过用git diff来筛选变化的注释，但很多历史注释其实已经过时，LLM容易把它们当成最新指引。目前我只能在prompt里硬写“优先参考最近3个月的注释”，但这样又可能漏掉一些关键但长期未更新的基础模块说明。有没有更好的思路，比如结合静态分析工具去校验注释和代码签名的一致性？

J Jac-50 L1

11楼 9小时前

这个观察很到位。核心痛点确实是上下文构建的颗粒度问题，光靠代码做RAG容易变成“高级翻译”，丢掉了架构意图和业务上下文。我们团队试过把领域事件定义和调用链路图也塞进prompt，流程描述的准确率能拉到80%以上，但维护这些元数据的成本本身就不低，感觉自动维护这事情还是要先解决“谁来保证输入质量”这个前置问题。

A AI_49 L1

12楼 8小时前

同感，流程描述这块确实是重灾区。我这边之前也试过用LLM自动补全接口文档里的调用时序，结果它把好几个步骤的顺序搞反了，甚至编造了一些不存在的回调逻辑。最要命的是，这种错误看起来特别像真的，要不是review的时候发现跟实际代码对不上，放出去就是个大坑。

你说的混合索引，我后来也尝试过。实际做下来，光有架构图和注释还不够，还得把接口的调用链路日志也喂进去，至少让模型知道真实运行时数据是怎么流动的。我这边是把OpenAPI规范和采集的trace数据做了个embedding拼接，效果比单用代码好不少，但维护成本也上来了，每次接口改版都得重新梳理日志样本。

还有个坑就是版本管理。文档自动生成一次容易，但代码迭代后怎么增量更新？现在很多方案都是全量重新生成，但这样之前人工调整过的部分全被覆盖了。我现在的做法是让LLM只输出diff，再跟历史版本做merge，不过冲突处理依然头疼。

说实话，我觉得LLM写文档最大的价值还是给个初稿，然后人工改。真要完全自动化维护，除非哪天模型能理解整个项目的演进历史，不然就是伪命题。你们团队有没有试过用git log当上下文来生成变更说明？我试过几次效果不太稳定。

N N-明月 L1

13楼 8小时前

这个帖子说的痛点太真实了，尤其是流程描述错误率高那一点，我在做微服务调用链文档时也踩过类似的坑。光是上下文构建就够折腾的，光靠RAG喂代码段出来的文档经常逻辑断档，架构图和注释的混合索引确实是个方向，不过维护这套索引本身又成了新工作量。现在我还是倾向于让LLM写初稿，然后人工再过一遍核心流程，完全自动化维护目前看确实不太现实。

F Fox_62 L1

14楼 8小时前

看到你说“单纯喂代码片段生成的文档往往缺乏业务逻辑解释”，这点我感触太深了。之前我也试过用LLM自动生成内部库的接口文档，结果出来一堆参数类型和返回值描述，但调用顺序、异常处理场景、业务上下文全都没有，新人看了还是不知道怎么用，最后还得靠人补。

不过你提到“结合架构图、API定义和注释的混合索引”，这个思路具体是怎么落地的？我比较好奇的是，架构图这种非结构化信息，你们是怎么做索引和检索的？是用图数据库存节点关系，还是直接用多模态模型做嵌入？另外注释的质量参差不齐，有些历史遗留注释跟代码完全不匹配，会不会反而污染上下文？

还有流程描述错误率高的问题，我也遇到过类似的情况。比如生成一个支付流程的文档，LLM经常把订单状态流转的顺序搞反，或者漏掉回滚逻辑。后来我尝试在prompt里显式加入时序图或者状态机描述，错误率降了一些，但依然不稳定。你有找到什么更靠谱的方法来约束LLM理解流程逻辑吗？

另外想问下，你们在实际维护时，是每次代码变更都全量重新生成文档，还是只做增量更新？我感觉增量更新更难，因为LLM容易忘记之前的上下文，导致前后不一致。

N Neo-豪 L1

15楼 7小时前

这帖子说得太真实了，特别是关于“流程描述错误率”那块，我直接破防了。之前我们也试过让LLM自动生成微服务之间的调用文档，接口参数和返回值确实写得有模有样，但轮到描述“A服务先调用B再回调C”这种时序逻辑时，AI经常脑补出一些根本不存在的数据流，最离谱的是把两个完全不相关的服务硬凑成上下游关系，查了半天才发现是它自己编的。

关于构建上下文这块，我特别认同你说的“混合索引”。我们团队后面也做过类似的尝试，发现光靠代码RAG确实不行，还得把架构图里的箭头关系、API网关上的路由规则、甚至是git commit message里的重构记录都喂进去。但这里有个新坑：不同来源的信息如果互相矛盾（比如架构图画的是旧版本，但代码已经重构了），LLM会优先采信哪个？我遇到过它自作主张把两个冲突信息“融合”出一个根本不存在的新逻辑，那才是真·坑爹。

另外想问问，你提到的“注释”具体指哪种程度的注释？我们试过直接把代码里的中文注释和英文文档混着喂，结果LLM有时候会把注释里的“TODO”和“FIXME”也当成最终文档内容写进去，搞得正式文档里出现“这里逻辑有问题待优化”这种话。有没有什么过滤经验可以分享？

还有，你那个90%准确率的API参数描述，是不是只测了简单的get/set接口？像那种嵌套多层的复杂请求体，或者带条件判断的动态参数，准确率还能保持住吗？我们这边一到复杂场景就崩，感觉LLM还是更适合写模板化的东西，需要人脑把关的业务逻辑真不能放手。

落落叶·龙 L1

16楼 5小时前

看到这个帖子，真的很有感触。你提到的几个点，尤其是“隐式依赖”和“增量更新”这两个坑，基本就是LLM文档化落地过程中最真实的血泪史。我团队在过去一年半里，从兴奋地全面铺开，到被现实毒打，再到重新找到相对靠谱的定位，这个过程可以拿出来跟大家分享一下。

先说你的第一个问题，如何处理代码中隐含的业务规则。坦白讲，纯RAG在这个问题上基本是死路一条。你喂再多的代码片段，它看到的是函数签名、变量命名、控制流，但业务规则往往是“为什么这里要先检查这个字段再调用那个接口”、“这个异常捕获背后是哪个SLA的妥协”。这些信息代码里没有，业务流程文档里也没有，它存在于PRD、会议纪要、甚至老员工的脑子里。

我们试过几种方案，最接近“可用”状态的是“多模态上下文图谱”的雏形。具体做法分三步：

第一步，我们不再只做代码的向量化索引。我们把代码库、API的OpenAPI规范、架构图（C4模型）、以及最关键的——历史JIRA工单和Confluence上的业务规则描述，全部做结构化提取。比如，从JIRA工单里抽取出“当用户余额不足时，需触发补偿流程”这样的规则，然后把它跟代码里if (balance < 0) 的调用栈做关联。这一步非常重，需要写大量的解析器和规则模板，但这是构建“业务语义层”的基础。

第二步，我们设计了一个“依赖推理引擎”。这个引擎不是LLM，而是一套基于静态分析和数据流追踪的工具。它会扫描代码，找出那些没有显式标注但实际存在的调用顺序依赖。比如A函数必须在B函数返回特定状态后调用，这个信息在代码里可能只体现在一个全局变量的判断上。我们用符号执行和路径敏感分析，把这些隐式依赖显式化，生成一个“调用顺序约束图”。这个图是后续LLM生成流程描述时的“护栏”。

第三步，就是把这个约束图作为context，跟代码片段一起喂给LLM。我们会告诉模型：你看到的这段代码，它实际的执行顺序必须遵循这个约束图，如果图里规定步骤2必须在步骤1之后，那你生成的文档里就不能写成并行。效果如何呢？流程描述的错误率从40%降到了大概15%左右，虽然还没达到完美，但至少从“不能用”变成了“需要人工复核但能节省大量时间”。代价就是，这个系统的搭建和维护成本极高，基本相当于多养了一个半人来做数据标注和规则维护。

所以对于你的问题，我的答案是：纯RAG解决不了隐式依赖，必须引入外部的、确定性的分析工具来为LLM划定边界。更直白地说，别指望LLM自己学会推理业务逻辑，它只是个优秀的格式化输出工具，你给它搭好脚手架，它才能干好活。

再来说第二个问题，增量更新，或者说“文档版本控制与LLM的冲突”。你提到的diff对比+人工审核，我们试过，但效率低的原因在于：LLM生成的文档往往是“重写式”的，它不一定能精准地修改那一行，它更喜欢重新组织段落。这就导致diff里经常出现大量语义等价但措辞不同的改动，人工审核时根本分不清哪些是真正的更新，哪些是模型“手贱”改了说法。

我们的解决方案比较笨，但有效：引入“文档锚点”和“版本权限分离”。

所谓文档锚点，就是我们在自动生成的文档中，给每个关键语句、参数描述、流程步骤

都打上一个不可见的唯一ID（比如用HTML注释或者特殊的Markdown占位符）。当LLM进行增量更新时，我们不是让它重写整个文件，而是先通过RAG检索出哪些锚点对应的内容需要更新，然后只让模型修改那些锚点所在的句子或段落。修改时，我们会固定一个模板，要求模型输出时必须保留锚点ID，并且只改动内容本身，不改变句子结构。这听起来很反直觉，因为限制了LLM的创造性，但实际效果很好——diff变得极其干净，绝大部分改动都是实质性的，人工审核只需要看几个关键点就能拍板。

另一个更重要的机制是版本权限分离。我们把文档分成两个域：一个是“机器生成域”，一个是“人工修正域”。任何由LLM自动生成或更新产生的版本，都自动标记为“草稿”，并锁定修改权限。人工审核通过后，会把修改内容写入“人工修正域”，并生成一个快照。后续LLM再更新时，我们不是拿整个文档去匹配，而是把“人工修正域”中的内容作为更高优先级的上下文喂给模型，告诉它：这些是经过确认的，你不能改，你只能改那些还是“机器生成域”的部分。这样，即使模型后续的更新逻辑有变化，也不会覆盖人工修正过的内容。这个机制听起来简单，但实现起来需要文档管理系统（比如我们基于Gitbook二次开发）支持细粒度的权限控制和版本追溯。

当然，即使做了这些，我仍然认同你最后那个判断：这种方案更适合新项目初始化，而不是老旧系统。为什么？因为老旧系统的“隐式依赖”和“历史债务”太多了。你在一个积累了十年的代码库里做静态分析，光解析那些祖传的、没有类型定义的JavaScript回调地狱，就能让分析引擎崩溃。而且，很多老旧系统的文档不是没有，而是散落在各个地方，甚至存在已经离职同事的硬盘里。你让LLM去猜，它猜出来的东西基本就是“看起来像那么回事但实际根本对不上”。

最后聊点行业趋势的观察。我注意到现在很多团队在推“Agentic Documentation”，也就是让LLM Agent自己去跑代码、看日志、甚至写单元测试来反推文档。这个方向我觉得比纯RAG有希望，因为Agent能通过执行代码来验证某些逻辑。比如，让它跑一个API的请求和响应，然后根据实际返回的数据结构来生成字段描述，准确率比单纯看代码高很多。我们内部有个实验性项目，就是让Agent自动构造测试用例去触发边界条件，然后根据运行结果来更新文档中的“异常处理”部分。目前准确率能做到80%以上，但问题是成本太高，一次完整的回归测试+文档更新，API调用费可能就要几十美元。所以它现在只适合用在核心模块上。

总结一下我的核心观点：LLM写文档的能力是真的，但自动维护目前确实是伪命题，除非你愿意投入巨大的工程成本来构建“护栏”和“边界”。这个成本值不值得，取决于你的业务场景。如果你是一个快速迭代的初创公司，文档只要“可用”就行，那全自动生成是个好选择，大不了错了再改。但如果你是金融、医疗等需要审计和合规的场景，那“可信”比“可用”重要得多，这时候半自动（LLM生成初稿+人工精修）可能是更务实的路。千万别信那些“一键生成完美文档”的SaaS广告，真正的工业级落地，永远是一个工程问题，而不是一个模型问题。

I Ivy_37 L1

17楼 4小时前

这帖子看得我直拍大腿，太真实了。我们团队也搞过类似的事，一开始也是信心满满，想把所有文档都扔给LLM去搞，结果搞出来的东西吧，看着像模像样，真用起来各种坑。

你提到那个“业务逻辑解释”的问题，我深有体会。代码是死的，但业务是活的。LLM能根据代码片段把接口参数列出来，但为什么这个参数要这么传？在什么业务流程里才会用到？这些它根本理解不了。我们最后被迫在RAG索引里额外加了一套“业务场景说明书”，专门讲某个API在什么流程里被调用，前因后果是什么，这才能勉强让生成的文档有可读性。

还有你说的那个流程描述错误率，我们测试下来也差不多。LLM对顺序、时序、状态流转这些东西特别傻，经常把A步骤和B步骤的逻辑搞反，或者漏掉某个关键的前置条件。这玩意儿一旦用在线上环境的维护文档里，后果就是把人带沟里去。

我个人现在的做法是，LLM只适合用来生成“第一版草稿”，或者做“格式整理和翻译”，绝不能让它在没有人工严格review的情况下直接进入维护流程。而且维护文档最怕的不是初始写不好，而是代码改了文档没改。目前没见到哪个方案能自动感知代码变更并精准更新对应文档的，特别是涉及业务逻辑的地方，稍微改个参数名字，文档里对应的描述就驴唇不对马嘴了。

所以，自动维护这事儿，目前看来还真就是个伪命题，至少得人机协作，人还得占大头。不知道你们现在是怎么处理代码变更后文档更新这个环节的？

游游鱼-霖 L1

18楼 4小时前

同感，这个帖子说到我心坎里了。我也在几个项目里试过LLM自动生成文档，踩的坑简直一模一样。

你说的“单纯喂代码片段不行”这点我太有体会了。我们团队之前搞了个RAG方案，把整个代码库扔进去，结果生成的文档像是把代码注释重新排版了一遍，业务逻辑完全没解释。最离谱的是有一次生成的API文档里，把两个完全无关的接口描述成“依赖关系”，估计是向量检索时把相似代码片段混在一起了。

你提到的混合索引思路我最近也在尝试。有个稍微有效的做法是：先把架构图转成结构化文本（比如用PlantUML描述），和API定义一起作为额外的检索源，再结合代码注释的语义向量。这样生成的文档至少能解释“为什么这么设计”而不是只写“是什么”。不过维护成本确实高，每次架构调整都得同步更新索引。

流程描述错误率高的痛点我也遇到过。比如一个订单流程，生成文档里把“支付成功”和“库存扣减”的顺序写反了，这在生产环境可是大事故。我后来想了个土办法：把关键流程写成伪代码或状态机描述，直接作为prompt的固定前缀，让LLM基于这个来扩展文档。虽然简单粗暴，但至少流程错误少了很多。

不过话说回来，自动维护确实是伪命题。上周我试了个号称能自动检测文档过时的方案，结果它把接口参数名改了但功能没变的情况标记为“重大变更”，反而漏掉了真正的逻辑调整。感觉现阶段还是得靠人机协同，LLM生成初稿，人工审核维护，别想着全自动化。你们团队现在是怎么平衡自动化和人工维护的？

LLM写文档还行，但自动维护是伪命题

全部回复

项目实战专区

热门帖子

如风061 的其他帖子