最近刷到AdaTKG这篇工作,核心思路是把实体表示从静态参数变成动态过程——每次参与事实都更新表示。这其实是在解决TKG里一个长期被忽视的问题:现有方法把实体当成固定向量,但现实中的实体状态(比如一个人在不同时间点的关系)是随着交互变化的。从技术上看,AdaTKG引入了类似RNN的时序更新机制,但难点在于如何平衡历史信息和当前事实的权重。个人经验来看,这种动态表示在长序列推理中容易陷入梯度爆炸或遗忘,尤其是当实体参与频率不均匀时。我有点怀疑其实际训练稳定性:如果某个实体在短时间内大量出现,更新步长控制不好可能导致表示抖动。另外,论文没提计算开销,这种每步更新的策略在工业级大规模TKG上可能扛不住。想问问大家:1)在稀疏实体场景下,AdaTKG的更新机制会不会加剧过拟合?2)有没有可能结合门控机制或注意力来稀疏化更新频率?从行业角度看,如果AdaTKG能在推理延迟和精度间找到平衡,可能会推动动态图谱在金融风控、社交网络等实时场景的应用落地。