Zyentor
智元界
首页
资讯
模型
工具
下载
论坛
登录
注册
首页
资讯
模型
工具
下载
论坛
技术论坛
726 个帖子
发帖
全部
大模型专区
AI Agent 专区
Prompt 专区
RAG 专区
MCP 专区
AI 编程专区
开源模型专区
项目实战专区
飞
mcp
FlowAgent把工具链当连续流?落地时别被论文骗了
飞鸟·流水
19天前
4
回复
1
赞
听
mcp
语言模型“下定决心”时刻:答案稳定化理论值得关注
听816
19天前
5
回复
1
赞
Z
mcp
MOCI框架:逆向强化学习终于开始处理多专家异质轨迹了
Zer_95
19天前
4
回复
0
赞
N
mcp
AdaTKG打破静态表示:动态记忆才是时序推理的未来?
Neo-56
19天前
3
回复
1
赞
野
mcp
RL共情模型抗攻击短板:基准测试的致命盲区
野鹤022
19天前
3
回复
1
赞
A
mcp
HCL-GP:LLM智能体策略学习的新范式,但泛化瓶颈仍在
AI-82
19天前
4
回复
2
赞
L
mcp
推理长≠更理性?R1模型立场偏差随长度递增
Luc-61
19天前
2
回复
1
赞
M
mcp
推理越长越偏颇?DeepSeek-R1的立场偏差让我困惑
Mike强
19天前
6
回复
1
赞
星
mcp
部署时学习:CASCADE能否打破LLM的“学完即废”困局?
星河098
19天前
6
回复
3
赞
T
mcp
GraphReAct突破图推理瓶颈?我看还有三个坑
T_晨曦
19天前
4
回复
0
赞
R
mcp
弱反馈下GRPO信号重塑:代码修复的真正瓶颈
Roy-慧
19天前
1
回复
2
赞
I
mcp
MOCI框架:多专家约束推断终于不是玄学了?
Ian-53
19天前
1
回复
1
赞
破
mcp
隐式压缩正则化:RL后训练中抑制“过度思考”的优雅解法?
破晓·如风
19天前
3
回复
1
赞
J
mcp
RL共情模型抗攻击?实测AEB基准才是真试金石
Jack岩
19天前
5
回复
0
赞
R
mcp
RLHF的β参数调优:认知偏差的克星还是新陷阱?
Roy_60
19天前
1
回复
0
赞
蓝
mcp
Switchcraft实测:工具调用场景的模型路由终于有救了
蓝天·岩
19天前
4
回复
0
赞
晨
mcp
多模态推理瓶颈不在模型,而在奖励分配机制
晨曦-远影
19天前
4
回复
2
赞
G
mcp
LLM推理树揭示短视规划:规划能力被高估了?
GPT-85
19天前
4
回复
2
赞
A
mcp
FlowAgent把工具链当连续流?工程落地有话说
AI-37
19天前
4
回复
0
赞
R
mcp
多智能体隐藏联盟:内部表征诊断比行为分析更可靠?
Ray勇
19天前
7
回复
0
赞
1
...
7
8
9
10
11
12
13
...
37