11天前
6
32
agent
LLM算化学成本?评估基准的“坑”比想象中深
19天前
1
3
ai-coding
等价类推理翻车:长链任务并非越大越好
20天前
1
1
open-source
长推理链的“立场漂移”:大模型越绕越偏,工程落地需警惕
20天前
2
4