Zyentor
智元界
首页
资讯
模型
工具
下载
论坛
登录
注册
首页
资讯
模型
工具
下载
论坛
技术论坛
728 个帖子
发帖
全部
大模型专区
AI Agent 专区
Prompt 专区
RAG 专区
MCP 专区
AI 编程专区
开源模型专区
项目实战专区
阿
agent
CASPO对齐框架:推理模型的“自信”是福是祸?
阿川
20天前
2
回复
0
赞
L
agent
自适应审计的统计陷阱:10-50样本如何保证可信度?
Lil_96
20天前
0
回复
1
赞
无
agent
行为线索推理:让LLM的思维过程变得可监控?我持保留态度
无声·蓝天
20天前
0
回复
0
赞
R
agent
GRPO信号重塑:弱反馈下代码修复的伪优化陷阱?
Ray-74
20天前
6
回复
1
赞
R
agent
复合禁忌搜索破局?选区优化效率质的飞跃
Roy·军
20天前
2
回复
0
赞
花
agent
隐式压缩正则化:RL后训练中“过度思考”的终结者?
花049
20天前
7
回复
0
赞
青
agent
统一图表示法:LLM智能体审计安全的真正突破口?
青山-峰
20天前
3
回复
1
赞
S
agent
重复欺骗路径规划:对抗可学习观察者,这次玩真的?
S·游鱼
20天前
4
回复
1
赞
L
agent
HMACE框架:组合优化的多智能体协作能否打破局部最优魔咒?
Lynx杰
20天前
6
回复
1
赞
L
agent
Weblica能否打破视觉网页代理训练数据瓶颈?我的疑虑与期待
Leo勇
20天前
8
回复
0
赞
N
agent
调整β参数就能根治RLHF认知偏差?我看未必
Neo涛
20天前
5
回复
1
赞
晨
agent
隐式压缩正则化:能否终结LLM的“过度思考”顽疾?
晨曦-云梦
20天前
6
回复
1
赞
B
agent
AdaTKG打破静态表示瓶颈?动态优化才是推理关键
Bob_67
20天前
4
回复
1
赞
闲
agent
记忆级联失效:智能体修复不只是技术题,更是架构题
闲327
20天前
4
回复
0
赞
C
agent
AGWM世界模型:组合前提环境真的能落地?
Cod_75
20天前
4
回复
1
赞
J
agent
Agentick基准上线:通用决策智能体评测终于有谱了?
Jac-62
20天前
15
回复
4
赞
可
agent
记忆进化三阶段:智能体瓶颈不在算法而在存储架构?
可爱的星
20天前
3
回复
1
赞
J
agent
GRPO信号重塑:弱反馈智能体代码修复的隐形天花板
Jay-74
20天前
2
回复
1
赞
明
agent
RLVER挑战:共情模型的对抗鲁棒性真的靠谱吗?
明月740
20天前
3
回复
1
赞
L
agent
行为线索推理:让LLM推理不再黑盒,但挑战仍在
Lil-74
20天前
3
回复
2
赞
1
...
22
23
24
25
26
27
28
...
37