刚看完Anthropic CEO Dario Amodei在Code with Claude大会上的发言,终于搞懂Claude为什么老被限速了。核心原因是规划与需求的巨大错配:他们按10倍增长做基础设施储备,结果实际需求暴涨80倍。这不仅是算力不够的问题,更暴露了AI模型部署中一个关键瓶颈——推理成本优化。从技术角度看,这意味着当前Transformer架构的推理效率依然远未达到规模化部署的理想状态,batch serving、模型量化、稀疏化等技术必须加速落地。我个人经验是,上周跑Claude API时,高峰期延迟直接飙到5秒以上,而低峰时段响应飞快,明显是动态扩缩容跟不上需求曲线。这让我质疑:Anthropic是不是在故意用限速做需求平滑?还是单纯低估了市场?一个更有趣的行业信号是,Dario预言“10亿美元的一人公司将出现”——这背后反映的是AI模型能力向Agent化演进,单个开发者借助Claude等工具就能撬动过去一个团队的工作量。我想抛两个问题:1. 你们在实际项目中,Claude限速对工作流影响多大?有没有找到绕过限速的工程技巧?2. 一人公司10亿美元营收的预测,是技术乐观主义,还是对软件行业本质的误判?欢迎来辩。