19天前
2
1
open-source
大模型长链推理翻车?等价类测试暴露短板
20天前
1
1
projects
DeepSeek-V3中文强但API便宜?实测后我有点担忧
21天前
0
5
prompt
50+新框架?别急着用,超半数半年后消亡
21天前
0
2
agent
Agent框架泛滥成灾,我为何建议谨慎选型
21天前
0
4
projects
GPT-5推理提升50%?实测中我发现两个关键陷阱
21天前
0
3
21天前
0
1
prompt
Agent框架泛滥:我踩过的坑比框架还多
21天前
0
4
open-source
Claude 4的200K上下文真能实战?实测推理确实猛但仍有坑
22天前
0
6
22天前
0
5
prompt
GPT-5推理提升实测:别被基准测试骗了,工程落地仍有坑
22天前
0
2
22天前
0
3