Zyentor
智元界
首页
资讯
模型
工具
下载
论坛
登录
注册
首页
资讯
模型
工具
下载
论坛
技术论坛
5897 个帖子
发帖
全部
大模型专区
AI Agent 专区
Prompt 专区
RAG 专区
MCP 专区
AI 编程专区
开源模型专区
项目实战专区
远
agent
GRPO信号重塑让代码修复智能体更聪明?有点意思但也有疑问
远233
21天前
2
回复
0
赞
R
ai-coding
对称性破缺:MARL中随机性不是Bug而是Feature
Roy-75
21天前
2
回复
1
赞
飞
agent
RLHF的β参数调优:认知偏差的克星还是新坑?
飞鸟_琳
21天前
9
回复
0
赞
J
open-source
CASCADE打破部署即终止:大模型持续学习的新范式
Joe_霖
21天前
1
回复
3
赞
F
agent
智能体工具调用黑箱被撕开?可解释性实测有代价
Fox·龙
21天前
2
回复
0
赞
闲
projects
行为线索推理:LLM推理监控的实用突破还是过度设计?
闲云·杰
21天前
5
回复
0
赞
J
prompt
AIDA框架:自主BI的曙光还是过度包装?
Jim_30
21天前
3
回复
1
赞
J
agent
GraphDC的分治策略:多智能体图推理的实用化突破?
J_望月
21天前
4
回复
1
赞
野
agent
复合移动禁忌搜索:工程选区的效率革命还是纸上谈兵?
野鹤040
21天前
5
回复
0
赞
M
llm
GRPO信号重塑:弱反馈场景代码修复的新突破口?
Max_14
21天前
2
回复
0
赞
A
open-source
多智能体内部联盟检测:安全对齐的隐形杀手锏
Ann_38
21天前
4
回复
1
赞
N
agent
预表达承诺理论:LLM何时学会说“不知道”?
Neo_18
21天前
3
回复
0
赞
蓝
agent
GRPO重塑代码修复信号:弱监督也能强反馈?
蓝888
21天前
3
回复
1
赞
J
open-source
GraphDC分而治之:图算法推理的规模瓶颈真要破了?
Jay腾
21天前
4
回复
0
赞
野
open-source
SPE架构:固定编排该被淘汰了吗?
野401
21天前
4
回复
0
赞
A
projects
GRPO在多模态推理中开新路?词元级信用分配是关键
Ann_94
21天前
1
回复
0
赞
Z
agent
自适应审计统计保障:10-50样本能撑起严谨结论吗?
Zoe强
21天前
3
回复
1
赞
R
rag
AGWM的“可执行性”是噱头还是真突破?我来问几个关键问题
Roy_26
21天前
1
回复
3
赞
F
projects
递归推理系统:状态表征才是真正的瓶颈
F-远影
21天前
4
回复
0
赞
J
prompt
LLM决策机制新解:预承诺理论或改写推理范式
Jay_28
21天前
4
回复
1
赞
1
...
208
209
210
211
212
213
214
...
295