Hermes Desktop发布:养马人告别浏览器,原生桌面应用来了
Hermes Agent的桌面版Hermes Desktop正式发布,将Web UI打包为原生桌面应用。用户无需打开浏览器或命令行,即可直接管理AI代理集群。该工具由开发者sir1st打造,旨在提升养马人的操作效率,支持多窗口、任务栏集成等桌面特性。对于AI从业者而言,这标志着AI代理管理工具从网页端向桌面端的重要演进,降低了日常操作门槛。
阶跃Step 3.7 Flash:196B参数Agent模型,推理成本再降
阶跃星辰发布新一代开源Flash模型Step 3.7 Flash,专为高并发Agent场景设计。采用196B稀疏MoE架构,推理激活仅11B参数,配备1.88B视觉编码器,推理速度高达400 TPS,支持256K上下文。相比前代Step 3.5 Flash,在保持高性能的同时进一步降低推理成本,为AI应用大规模落地提供经济高效的基座模型。
王慧文的框与AI财富的地理密码
王慧文画出的那个框,不仅框定了中国AI创业的热土,更揭示了一个反直觉的现象:在云计算和远程办公高度普及的今天,AI领域的资本和人才却加速向少数地理“小框”集中。文章通过对比北京与旧金山的财富流向,探讨了AI时代地域集聚效应背后的逻辑,指出“小框”正成为新型财富的汇聚器。
马斯克拥抱C语言:Grok 5训练提速一个数量级
马斯克宣布SpaceX已用C语言重写大模型训练堆栈,替代JAX,使Grok 5训练速度提升一个数量级。同时,Colossus II超算集群在建,总功率1吉瓦、造价170亿美元。算力租赁业务同步推进,与Anthropic签有400亿美元协议但含90天解约条款,凸显马斯克对算力资源的绝对控制。
Meta用1830亿token将数学教材翻译成Lean库
Meta联合纽约大学发布ATLAS项目,消耗1830亿token,将26本本科及研究生数学教材自动翻译成Lean 4形式化代码库。该库包含46,203条数学声明,证明通过率92.7%,代码规模达630,999行,仅数周内即达到社区标准库Mathlib的四分之一。项目覆盖分析、代数、拓扑等十余个数学领域,并提供了可视化知识图谱浏览器。
AI出海爆发:产品速度与资金效率的平衡之道
过去一年,AI出海应用迎来集中爆发。Gartner预测2026年全球AI相关支出将达到2.53万亿美元,同比增长44%;IDC数据显示未来五年复合增速达31.9%,全球AI IT投资将突破万亿美元。在这场竞速中,产品迭代速度决定企业跑多快,而资金效率则决定能走多远。本文从数据与行业视角,解析AI出海的增长引擎与生存法则。
Siri变身AI平台:苹果的豪赌与隐私困局
苹果即将在WWDC上推出史上最大规模Siri改版,新界面采用聊天机器人范式,集成灵动岛,并允许接入Google Gemini和Anthropic Claude等第三方AI模型。这标志着Siri从语音助手转型为AI模型分发平台,但隐私承诺的突破和用户体验的同质化风险,成为苹果必须跨越的两道坎。
事件级预测世界模型WALL-WM发布,机器人不再逐帧学动作
自变量机器人团队发布全球首个事件级预测具身智能世界模型WALL-WM,将机器人的动作学习单位从时间帧切换为语义事件。传统VLA模型需逐帧预测0.1秒后的手部位置,而WALL-WM直接想象抓住杯子这一事件,跳过中间冗余帧,实现跨场景泛化。模型基于事件边界进行训练,融合语言、视觉和动作信息,在真机测试中展现出更强的鲁棒性。该研究已在论文《WALL-WM: Carving World Action Modeling at the Event Joints》中公开。
智谱AI自研硬件曝光,携手早教代工厂布局终端
据《读佳》独家报道,智谱AI正在研发多款硬件产品,型号包括ZAI-P1、ZAI-M2、ZAI-N1等。其中ZAI-P1已在2026年2月获得工信部电信设备进网试用许可证,申请及生产企业为智谱AI全资子公司成都智谱华章科技有限公司。该消息显示智谱AI正从软件向硬件端延伸,并携手早教代工厂加速终端落地,标志着国产AI大模型厂商在AI硬件领域的深度布局。
小云雀短剧Agent 2.0:200元复刻AI版《给阿嬷的情书》
字节旗下AI视频工具小云雀近日升级短剧Agent 2.0,基于Seedance 2.0模型,大幅降低AI短剧创作门槛。用户仅需200元即可生成一部完整短片,如《给阿嬷的情书》风格作品。新版本支持更长的叙事结构、角色一致性增强,以及多场景自动衔接。这标志着AI视频生成从单镜头向完整剧集制作迈进,为独立创作者提供了低成本、高效率的影视级创作能力。
Claude Opus 4.8遭曝蒸馏Qwen和DeepSeek,API问答现原形
近日,有开发者通过API反复测试发现,Claude Opus 4.8在回答“你是什么模型”时,竟多次自称是Qwen或DeepSeek。这一现象在网页端无法复现,但API接口下稳定出现,引发社区对模型蒸馏的广泛猜测。本文梳理事件经过、技术原理及行业影响,为AI从业者提供关键信息。
Claude Code动态工作流:AI编程的军团时代来了
Anthropic推出Claude Code动态工作流预览版,让用户一句话即可调度上百个智能体协同处理超大型任务。该功能可自动编写脚本、拆解任务,Bun创始人Jarred Sumner用其将Bun从Zig迁移至Rust,产出75万行代码,耗时11天,测试通过率99.8%。但高token消耗引发开发者社区争议,单次任务成本可达数百美元,目前仅Max和Team用户默认开启。
中科院团队获数千万融资,MRAM存内概率计算突破能效瓶颈
北京熵旋芯智完成数千万元天使轮融资,由英诺天使基金领投,海贝资本跟投。作为国内唯一基于MRAM构建存内概率计算平台的技术团队,其首创的“器件+算法+架构”全栈方案,在处理生成式AI等任务时,相比传统架构有望实现万倍能效提升。团队已完成阵列级流片,计划2027年初交付首批芯片,率先落地边缘具身智能和自动驾驶决策优化场景。
AI原生创业:你的Agent昨晚替你把公司跑了一遍
Stepan Gershuni在cyber.fund发布创始人指南,指出AI原生创业的核心不是雇佣更多人手,而是让公司学得更快、迭代更快。文章提出三步法:先绘制工作地图,将重复性任务按自主程度分级,强调频率胜过重要性;再将公司记忆编码进代码库,通过Context(操作记忆)让AI读懂业务默契。数据显示,高频任务(如每日10次工单分类)一年有3650次优化机会,而低频任务(如每周投资人更新)仅52次。Anthropic的MCP方案将Context占用从15万token降至2000token,削减98.7%。
DeepSeek V4引爆芯模协同,国产算力生态加速跨越“能用”门槛
DeepSeek V4的发布不仅展示了模型本身的强大,更标志着国产算力生态从“芯片被动适配模型”向“芯模协同”的根本性转变。华为昇腾与DeepSeek在超大规模工程化尺度上验证了协同可行性,填补了CUDA+英伟达体系长期形成的生态护城河。CANN生态从“幼儿期”步入“青年期”,开发者已能独立解决问题、贡献代码。AIGCode在昇腾上实现MoE模型MFU达65%,接近行业平均两倍。金融、科研等领域核心业务加速迁移,国产算力平台正成为业务首选。
世界模型接棒语言模型,这家公司全球首创物理AGI“双金字塔”体系,通用机器人进入“家庭时代”
{ title: "百台真机进家庭,极佳视界双金字塔体系冲击物理AGI", summary: "极佳视界于5月20日发布通用人形机器人品牌拾光,首款产品S1采用轮臂构型,聚焦真实家庭场景。公司披露自研双金字塔技术体系,涵盖数据与算法两大维度。目前拾光S1已获百台量产订单,将于第三季度在武汉光
Codex自动化三合一:信息抓取、数据分析、报告生成全搞定
OpenAI最新公开的Computer-Using Agent技术,让Codex模型能够直接操控图形界面,实现从信息抓取、数据分析到报告生成的全流程自动化。该智能体经过专门训练,能理解屏幕内容、规划任务路径,并模拟鼠标键盘操作。面对按钮位置变动、多层弹窗或页面加载延迟等复杂情况,它具备实时重试与自适应能力。这标志着AI从“理解指令”向“自主执行”迈出关键一步,预计将大幅提升办公、数据运营等场景的效率。
无GPU也能跑!OmniVoice Studio开源声音克隆获5k星
OmniVoice Studio作为ElevenLabs的开源替代方案,支持646种语言的声音克隆,无需GPU即可在CPU模式下运行。该项目已获5k星标,提供跨平台桌面客户端,最低4GB内存即可启动。核心功能包括零样本声音克隆(仅需3秒样本)、声音设计、电影级视频自动翻配、全局听写组件及MCP服务端集成。内置显存智能管理,支持阿里CosyVoice 3和苹果M芯片优化后端,彻底解决显存溢出问题。
工业具身智能落地提速,微亿智造研发投入超2亿
微亿智造作为工业具身智能领域的先行者,展示了AI机械臂在工厂中的真实落地能力。公司近三年研发投入累计超5.7亿元,2025年达2.35亿元,算力投入从0.52亿增至1.51亿元。其产品已在外观检测、焊接、打磨、装配等环节实现稳定运行,并将能力延伸至物流分拣、码垛等前沿场景。与传统自动化不同,微亿智造通过“看见—判断—处理”的具身智能闭环,解决了非标工业场景中的柔性作业难题,订单持续增长验证了客户对ROI的认可。
央企AI落地困局:Agent跑起来先过组织关
央企AI落地面临的最大挑战并非技术,而是组织与系统改造。文章揭示,企业级Agent大规模应用需先解决老系统接口改造、统一身份认证、权限穿透等难题,这往往是一个耗资千万、耗时一两年的跨部门工程。当前多数企业仍停留在Demo或尝鲜阶段,Agent任务时长、首字回复时间及token效率等性能问题同样棘手。