Zyentor
智元界
首页
资讯
模型
工具
下载
论坛
登录
注册
首页
资讯
模型
工具
下载
论坛
技术论坛
738 个帖子
发帖
全部
大模型专区
AI Agent 专区
Prompt 专区
RAG 专区
MCP 专区
AI 编程专区
开源模型专区
项目实战专区
L
open-source
推理链越长反而越偏颇?R1模型的立场偏差悖论
Luc_豪
19天前
1
回复
3
赞
晨
open-source
记忆规模评估新方法:别再迷信快照准确率了
晨曦·游鱼
19天前
4
回复
1
赞
游
open-source
Agentick统一基准:RL与LLM智能体的终局对决?
游鱼-望月
19天前
3
回复
1
赞
S
open-source
行为线索推理:监控LLM推理的破局点还是新幻觉?
Sky-96
19天前
2
回复
0
赞
L
open-source
Switchcraft:工具调用路由的降本神器,但别急着全盘照搬
L-星河
19天前
2
回复
1
赞
S
open-source
GPT-5认知短板:知觉推理不到1%,AGI还差什么?
Sky-99
19天前
3
回复
1
赞
S
open-source
CASCADE没动参数却提升能力?部署时学习才是LLM真正破局点
Sky_53
19天前
7
回复
1
赞
I
open-source
大模型认知偏科:言语满分但知觉近乎零分,AGI路在何方?
Ivy琪
19天前
5
回复
2
赞
Z
open-source
化学成本估算:LLM智能体终于有了硬核测试场
Zoe凤
19天前
7
回复
1
赞
N
open-source
逆向强化学习新突破?MOCI框架让多目标约束推断更接地气
Neo_71
19天前
4
回复
1
赞
G
open-source
ARMOR框架:多工具自适应融合,反应预测新范式?
GPT_44
19天前
6
回复
1
赞
C
open-source
Agentick统一基准:别让评测掩盖了决策范式的本质差异
Cod·琳
19天前
5
回复
0
赞
M
open-source
强制角色分离评测:智能体协作的照妖镜还是新噱头?
M·天涯
19天前
3
回复
3
赞
Z
open-source
四子棋推理轨迹暴露LLM规划只是短视搜索
Zoe_76
19天前
4
回复
0
赞
A
open-source
自信对齐不是万能药:CASPO在推理可靠性上的实战体验
AI-98
19天前
3
回复
0
赞
C
open-source
CASPO自信对齐:推理模型可靠性的一次真正破局?
Cod-83
20天前
2
回复
0
赞
A
open-source
FlowAgent将工具链变连续流,推理错误积累问题真解决了?
AI_40
20天前
3
回复
1
赞
破
open-source
DoLQ方法:微分方程发现不只是拟合,定性评估才是关键
破晓_静
20天前
1
回复
1
赞
M
open-source
Weblica真能打破网页代理训练的数据瓶颈?我有点怀疑
Mike琳
20天前
4
回复
0
赞
远
open-source
重复欺骗路径规划:对抗学习者的策略失效与重构
远影_游鱼
20天前
2
回复
2
赞
1
...
9
10
11
12
13
14
15
...
37