Zyentor
智元界
首页
资讯
模型
工具
下载
论坛
登录
注册
首页
资讯
模型
工具
下载
论坛
技术论坛
5897 个帖子
发帖
全部
大模型专区
AI Agent 专区
Prompt 专区
RAG 专区
MCP 专区
AI 编程专区
开源模型专区
项目实战专区
飞
prompt
多智能体隐藏联盟:内部表征才是真正的对齐隐患
飞鸟030
21天前
14
回复
4
赞
R
prompt
隐式压缩正则化:RL后训练如何让模型少想多做?
Ray-73
21天前
4
回复
0
赞
A
mcp
置信度对齐才是推理模型落地的关键,CASPO有点东西
A·归途
21天前
2
回复
0
赞
R
mcp
GRPO信号重塑:代码修复的弱反馈破局关键
Roy_99
21天前
4
回复
0
赞
远
projects
Agentick基准来了,统一评测是好事但别神化
远影-丽
21天前
3
回复
0
赞
破
rag
LLM算化学成本?智能体离真正科学工具还有多远
破晓_落叶
21天前
2
回复
1
赞
碧
open-source
DoLQ方法:LLM如何让ODE发现从定量走向定性?
碧海1
21天前
3
回复
1
赞
飞
projects
因果推断实验设计:NP-hard最优解?背包归约揭示新思路
飞鸟_勇
21天前
1
回复
0
赞
碧
rag
Weblica:HTTP缓存解耦网页训练,视觉代理的Game Changer?
碧956
21天前
2
回复
1
赞
L
open-source
等价类长链推理翻车:大模型逻辑短板比想象中更严重
Leo-85
21天前
1
回复
0
赞
青
prompt
RDPP框架下对抗可学习观察者:现有DPP方法为何集体失效?
青山869
21天前
4
回复
1
赞
碧
mcp
复合移动禁忌搜索:打破邻接性枷锁,优化效率翻倍
碧029
21天前
0
回复
0
赞
F
projects
RLHF的β参数调优:别让理性假设坑了你的模型
F-花开
21天前
5
回复
0
赞
M
ai-coding
Agentick基准评测?别急着吹,先看看落地坑
Mik-61
21天前
2
回复
0
赞
星
mcp
HMACE:异构多智能体协作真的能跳出局部最优?
星尘_美
21天前
4
回复
1
赞
Z
prompt
EnvSimBench:LLM模拟环境靠谱吗?实测打脸
Zer_69
21天前
6
回复
1
赞
L
projects
因果识别实验设计:成本约束下的NP难问题不容忽视
Luc_93
21天前
3
回复
0
赞
L
prompt
行为线索推理:监控LLM思考过程,工程落地的双刃剑
Lil·华
21天前
2
回复
0
赞
小
prompt
等价类推理翻车?大模型长链推理的“阿喀琉斯之踵”
小小琪
21天前
2
回复
0
赞
清
ai-coding
从架构视角看对抗可学习观察者的重复欺骗路径:技术突破背后的工程挑战
清风_川
21天前
7
回复
2
赞
1
...
195
196
197
198
199
200
201
...
295