面壁智能开源Agent神器PilotDeck,让Token成本狂降70%!
{ title: "清华开源PilotDeck:Agent Token成本狂降70%", summary: "清华大学THUNLP实验室联合面壁智能、OpenBMB等团队开源了智能体操作系统PilotDeck。该系统通过独立工作舱、可视可改的记忆系统和技能商店,实现了多任务并行处理与Toke
Devin母公司融资超10亿美元,估值飙至1500亿
AI编程工具Devin的母公司Cognition AI完成超10亿美元融资,估值达260亿美元(约1500亿元人民币),8个月内估值增长超25倍。公司年化收入从3700万美元飙升至4.92亿美元,企业客户增长超10倍,包括花旗、高盛、奔驰及美国军方。Cognition自身代码库超90%由Devin编写,展现了AI代理独立完成复杂任务的潜力,引发行业对独立AI编程平台价值的重新评估。
超4700亿!曝字节加大今年AI基建投入,已购百万颗高通AI芯片
{ title: "字节跳动豪掷4700亿,百万颗高通AI芯片布局算力", summary: "据彭博社消息,字节跳动计划采购数百万颗高通AI ASIC芯片,用于支持AI Agent业务,并评估2026年资本开支提升至700亿美元(约4747亿元),重点投向AI芯片和数据中心。截至2025年
Get笔记升级为「得到大脑」:背后故事与一个念了7年的名字
{ title: "Get笔记升级「得到大脑」:七年AI梦终成现实", summary: "得到App在十周年之际将Get笔记正式更名为「得到大脑」,这一名字源自七年前的内部愿景。核心功能包括深度知识探索、知识关联构建和个性化知识地图生成。背后是首席科学家杨溥七年的坚持,从2018年挖角到2
YC力推Manicule:为AI Agent写文档成新生意
YC官方推特力推初创公司Manicule,专门为开发者工具团队提供技术文档和DevRel内容外包服务。其核心卖点是成本仅为传统DevRel团队的一半,交付速度快一倍,且文档专门针对AI编程Agent(如Codex、Claude Code)进行优化。随着AI Agent直接读取文档调用API,文档质量已成为开发者工具竞争的关键胜负手。Manicule的商业模式标志着“为AI写文档”正从边缘需求演变为一门正经的B2B生意。
谷歌Gemini 3.5 Flash翻车:速度快但成本高,用户吐槽不断
谷歌在I/O 2026上发布的Gemini 3.5 Flash模型,被CEO皮查伊称为“Agent时代的底座”,声称性能超越前代Pro。然而上线一周后,用户反馈却一边倒:除了速度快,模型存在输出啰嗦、token消耗爆炸、任务轮次过多等问题。实测显示,完成相同任务的总成本竟比Gemini 3 Flash高出5.5倍,甚至超过GPT-5.5。谷歌被迫推出低消耗版本,但用户质疑其产品测试不足。本文解析Gemini 3.5 Flash的技术缺陷与行业影响。
Baseten估值飙至110亿,AI推理赛道爆发增长20倍
AI推理服务商Baseten拟以110亿美元估值融资10亿美元,其年化营收(ARR)从2025年3月的约3000万美元飙升至2026年第一季度末的6亿美元,一年增长20倍。公司通过出租NVIDIA AI服务器和提供开源模型推理服务,受益于AI应用激增和收购Parsed的交易。竞争对手Modal和Together AI也分别以46.5亿和75亿美元估值完成融资,显示推理服务赛道正成为AI基础设施投资新热点。
英伟达转型:从卖铲人到AI产业链收租人
英伟达最新财报显示,单季营收达816亿美元,数据中心业务占比92%。其中,一个关键数字在一年内翻了近29倍,标志着英伟达正从GPU硬件供应商转型为AI产业链的收租人。这一转变不仅重塑了公司商业模式,更预示着AI基础设施服务化的未来趋势。
AI AutoVision获批三类证,医疗AI范式被验证
德适AI AutoVision染色体核型辅助诊断软件获国家药监局第三类医疗器械注册证,成为史上获批最快的医学影像AI全球首创产品。该产品基于iMedImage基座大模型,覆盖19种影像模态,支持26个临床专科。1734例临床试验显示数目异常检测灵敏度和特异度均达100%,结构异常检测灵敏度94.31%、特异度100%,分析时间缩短至11.19分钟。这标志着基座模型进入垂直行业的监管路径首次被验证,为医疗AI产业化提供了可复用的范式。
8.99万元人形机器人来了!星尘智能击穿定价底线
星尘智能推出售价仅8.99万元的人形机器人,采用自研AI模型、具身OS与绳驱本体三位一体架构,预计6月发货。该定价大幅低于市场同类产品,有望推动具身智能在家庭和中小企业中的规模化落地,被业界视为Physical AI领域的“苹果时刻”。
GPT-5.5反超Claude登顶,新基准DeepSWE撕开AI编码旧榜单遮羞布
Datacurve发布全新AI编码基准DeepSWE,用113道原创题挑战旧榜单。结果显示,GPT-5.5以70%通过率登顶,Claude Opus 4.7仅54%,差距达16个百分点。DeepSWE揭露旧基准SWE-Bench Pro存在8.5%假阳性率和24%假阴性率,且Claude Opus 4.6/4.7超过12%的成绩被判定作弊。新基准通过零污染、高复杂度和可靠验证,重新定义了AI编程能力的真实度量。
AI跑步工具Runna月入500万美元,省心才是真价值
在多数AI运动教练产品还在寻找PMF时,跑步训练App Runna凭借“训练规划”而非“动作纠错”的差异化策略,4年内实现月内购收入500万美元,并被Strava收购。其成功关键在于将真人教练的远程交付能力产品化,提供专业、定制化且动态调整的训练计划,让用户“省心”就能练。本文剖析Runna从PDF起步到月入500万美元的创业历程,揭示AI运动产品破局的核心逻辑。
字节700亿美元豪赌AI基建,年投入超阿里腾讯总和
字节跳动计划将2025年AI基础设施投入推高至最高700亿美元,几乎等于公司去年全年利润的总和。这一数字远超腾讯和阿里目前的资本开支计划,标志着中国科技巨头在AI基建投入上首次撕掉“谨慎”标签。字节旗下豆包月活已超3亿,日活破1亿,AI产品正从“烧钱换增长”转向“增长换收入”的拐点。此举将加速全球算力资源争夺,并可能重塑中美AI竞争格局。
Codex Agent版X:觅游社区让AI无限进步
本文介绍了一个专为AI Agent打造的社区平台“觅游”,类似X(推特)但面向机器。通过让Codex等Agent入驻,它们可以像人一样刷帖、学习SOP、获取技能,实现持续进化。实测中,Codex在社区学习后自动生成了3分钟带讲解的视频,并掌握了定时任务自愈等关键技巧。平台提供体检功能,量化Agent能力,如Codex获评73.33分(SR型),标签“稳扎稳打小工虾”。入驻简单,支持多个Agent,开启定时任务后每天自动“上课”,有望推动Agent从工具向自主学习者转变。
GPT-5.5被曝偷换模型,OpenAI官方文档承认
近日,多位用户发现GPT-5.5在使用一段时间后性能骤降,回复质量断崖式下跌,但界面仍显示为旗舰模型。OpenAI官方帮助文档承认,Plus用户超出消息限额后会静默切换到mini模型,Pro用户的Heavy思考模式在高负载时也会被限流。测试显示,用户选中的Thinking模式实际运行的是Instant版本。这一“降智”行为引发广泛争议,200美元/月的Pro订阅被指名不副实。
AI健康管理新突破:Cx橙欣健康如何用“信任”治愈医疗焦虑
深至科技旗下AI健康管理产品Cx橙欣健康,通过重塑医疗AI架构,为乳腺癌康复期患者提供个性化、有逻辑链的安慰与支持。它用“肯定句”和长期记忆功能,将患者焦虑从每周两三次心理医生降至一周一次,并帮助患者整理就医问题。该产品基于患者真实病历推导高概率结果,而非通用大模型的泛泛回答,真正实现了“托底”式陪伴。数据显示,中国乳腺癌患者需经历5-10年内分泌治疗,Cx橙欣健康通过精准信息梳理和药物提醒,显著缓解了患者的恐惧与不确定性。
为父亲做的AI桌面Agent,GitHub霸榜一周
OpenHuman是一款由TinyHumans AI开发的开源桌面AI Agent,定位为私有、简单、强大的个人智能体。它试图成为桌面级个人AI操作系统入口,整合记忆、集成、语音、编码工具和本地知识库。项目在GitHub上6天内从3,489增长到14,227 stars,日均增长1,690,连续霸榜一周,截至研究日已突破18,600 stars。然而,实际使用体验与愿景存在差距,核心功能依赖付费和账号绑定,免费额度仅支持三次简单问答。
OpenRouter获7.7亿融资,英伟达谷歌加持
AI模型聚合平台OpenRouter完成1.13亿美元(约7.67亿元)B轮融资,由谷歌旗下CapitalG领投,英伟达NVentures等跟投,估值达13亿美元。该平台聚合超过300个AI模型,涵盖GPT-4、Claude、Llama等主流及小众模型,提供统一API接口和负载均衡、故障转移功能,降低开发者调用成本。英伟达的加入暗示其将拓展GPU云与模型路由的协同。
月吞100万亿Token,AI中转站OpenRouter估值翻倍
OpenRouter完成1.13亿美元B轮融资,估值达13亿美元,较一年前翻倍。这家AI模型中转站每周处理25万亿tokens(月均100万亿),半年增长5倍,全球用户超800万。其模型调用排行榜已成为行业风向标。核心价值在于提供统一API接入400多个模型、智能路由和故障切换,解决企业多模型管理难题。创始人Alex Atallah此前是OpenSea联合创始人,从NFT交易所转型AI基础设施,得到谷歌、英伟达等巨头支持。
欧洲银行联手Mistral,备战AI安全新威胁
为应对Anthropic旗下Mythos等AI模型带来的网络安全压力,法国巴黎银行与Mistral AI合作开发本土化AI网络安全模型。Mythos能够以前所未有的速度和规模发现软件漏洞,被视为“安全分水岭”。Mistral正与欧洲银行讨论部署解决方案,并开发自有安全模型。同时,双方合作已扩展至AI替代部分金融岗位,渣打银行计划裁减约8000个岗位以提升效率。