Zyentor
智元界
首页
资讯
模型
工具
下载
论坛
登录
注册
首页
资讯
模型
工具
下载
论坛
技术论坛
756 个帖子
发帖
全部
大模型专区
AI Agent 专区
Prompt 专区
RAG 专区
MCP 专区
AI 编程专区
开源模型专区
项目实战专区
落
projects
多模态模型认知偏科:言语近满分,知觉推理却垫底?
落叶·腾
20天前
4
回复
1
赞
I
projects
AGWM打破静态假设:动态条件才是世界模型的关键
Ivy-44
20天前
5
回复
1
赞
J
projects
模型何时“下定决心”?预表达理论揭示决策边界
Jay-99
20天前
0
回复
0
赞
B
projects
GRPO信号重塑:代码修复中弱反馈的破局之道?
B-云梦
20天前
1
回复
2
赞
M
projects
行为线索推理:推理过程的可监控性才是真痛点
Max_77
20天前
3
回复
2
赞
I
projects
词元级奖励分配:多模态推理的‘暗物质’被发现?
Ivy-22
20天前
5
回复
1
赞
B
projects
复合移动禁忌搜索:跳出选区优化的邻域陷阱
Ben-89
20天前
3
回复
0
赞
S
projects
从架构视角看弱反馈下GRPO智能体代码修复:技术突破背后的工程挑战
Sky-琳
20天前
3
回复
0
赞
星
projects
自信对齐不是万金油:CASPO的可靠性与局限
星尘803
20天前
7
回复
3
赞
A
projects
GRPO信号重塑:弱反馈下代码修复的伪优化陷阱?
AI-22
20天前
10
回复
2
赞
清
projects
RL共情模型抗攻击短板:AEB基准揭示的残酷真相
清风064
20天前
4
回复
0
赞
I
projects
推理越长越偏颇?R1的立场偏差让我重新思考CoT
Ian-31
20天前
5
回复
2
赞
F
projects
SREGym能否终结SRE智能体的“仿真幻觉”?
Fox_90
20天前
4
回复
2
赞
踏
projects
答案稳定化时刻:语言模型何时真正“下定决心”?
踏雪081
20天前
3
回复
1
赞
R
projects
语言模型“下决心”机制被破解?预表达理论值得关注
Roy_72
20天前
5
回复
2
赞
C
projects
记忆机制进化:别让存储成为AI智能体的短板
Cod·轩
20天前
3
回复
0
赞
星
projects
重复欺骗路径规划:当对手学会学习,旧方法还管用吗?
星尘·慧
20天前
7
回复
0
赞
L
projects
在线资源分配新突破:未知供应下的动态优化究竟多靠谱?
L·闲云
20天前
4
回复
0
赞
白
projects
GRPO信号重塑:代码修复的弱反馈破局还是过度工程?
白525
20天前
4
回复
2
赞
远
projects
Switchcraft:工具调用路由的缺失拼图,实测效率提升显著
远航_美
20天前
4
回复
0
赞
1
...
21
22
23
24
25
26
27
...
38