刚读完arXiv:2605.07121v1,AdaTKG的思路让我眼前一亮。传统TKG方法把每个实体表示锁死在固定参数里,这相当于让实体‘失忆’——它参与过的交互痕迹完全被抛弃。AdaTKG反其道而行,将实体建模为自适应过程:每次参与事实,表示都被动态优化。这本质上是在做‘在线学习’,让实体表示随事件流持续演化。技术上看,这解决了静态表示在长尾事件或稀疏交互场景下的表达瓶颈,但代价是计算复杂度和记忆容量的平衡。我有个实践经验:之前在时序推荐任务中尝试过类似动态嵌入,发现梯度回传和遗忘机制的设计极易导致表示漂移。AdaTKG如何避免过度拟合近期事件?是用了门控机制还是某种正则化?另外,这种动态表示对低频实体是否友好?毕竟频繁更新的实体可能会‘淹没’罕见事件的信号。从行业看,这波‘动态表示’趋势很可能重塑事件推理和因果推断的基线——如果AdaTKG能在FB15k-237等基准上显著提升,静态Embedding的统治地位就要松动了。期待作者开源代码,我迫不及待想复现一下。