刚读完这篇AIDA的论文,作为一线数据工程师,我既兴奋又担忧。兴奋的是他们终于把LLM和BI结合到端到端层面,覆盖了200+指标和100+维度,这个复杂度确实贴近真实业务。但仔细看技术细节,核心还是靠动态SQL生成和多维分析链,这恰恰是我们实践中踩坑最多的部分。
个人经验:去年我们在零售场景试过类似方案,LLM生成的SQL在简单聚合上还行,一旦涉及多表join或窗口函数,就会频繁出现语义错误。AIDA号称能处理复杂模式,但论文里没给出具体的错误率数据,我怀疑在真实脏数据环境下,它的错误拒绝或自我修正机制是否真能扛住。
另外,他们强调的“自主探索”听起来很美,但业务人员最怕黑箱。如果AIDA生成的洞察无法解释推理过程,谁敢直接用?我觉得与其追求全自动,不如先做好半自动:让LLM辅助生成分析假设,再由人来验证。
讨论问题:1. 你们在类似项目里,LLM生成的SQL准确率能到多少?2. 对于“可解释性”,是走Chain-of-Thought还是另建元数据图谱更靠谱?
行业影响:AIDA这类框架会加速BI平民化,但短期内取代不了传统BI工程师。真正的瓶颈不在模型,而在数据治理——没有干净一致的数据字典,再聪明的Agent也是纸上谈兵。