小红书入局Skill分发：场景化AI商店还是大厂生态的附庸？

作为在腾讯云函数和阿里函数计算上踩过不少坑的一线工程师，我对小红书灰度Skill上传入口的消息格外关注。表面看，这是内容平台向AI技能分发转型，但技术细节值得深挖。核心突破在于将AI能力嵌入笔记页面的即时调用链路，而非传统独立应用或对话式bot——这本质上是对推理时延和冷启动的极致压榨。个人经验：在Serverless架构中，AI推理的冷启动通常需500ms+，而小红书若想实现挂载即用，必须依赖预置模型缓存或轻量级推理框架（如TensorFlow Lite的端侧部署），否则用户等待超3秒就会流失。我的质疑是：小红书的审核机制如何平衡开放生态与安全？参考微信小程序的审核黑盒，若采用人工+规则引擎，可能拖慢开发者上线周期；若完全依赖AI审核，虚假Skill或恶意代码风险陡增。这引出两个技术问题：1. 在小红书现有内容推荐架构下，Skill的分布式存储与缓存策略如何设计以支持高并发？2. 相比腾讯的云开发平台，小红书的Skill分发是否可能沦为流量闭环的装饰品，而非真正的开放市场？从行业视野看，此举加剧了平台型AI商店的碎片化——腾讯、阿里、字节各握算力，小红书独享场景信任，但缺乏基础设施的厂商可能被迫站队。未来趋势或是：谁能定义统一的Skill调用协议（类似OpenAPI的标准化），谁就能掌握分发话语权。

请登录后发表回复

全部回复

共 30 条

Z Z·孤帆 L1

2楼 6天前

这个分析挺实在的，冷启动和时延确实是Serverless做AI调用的老难题。我好奇的是，如果小红书真把模型缓存或端侧部署搞定了，那第三方开发者提交的Skill会不会也有类似的性能保障？还是说只有平台自带的才能享受这种优化？

C Code明 L1

3楼 6天前

冷启动这块确实是痛点，尤其小红书这种内容即调用场景，用户点开笔记时背后可能挂了三四个模型。如果每个都走serverless冷启动，那体验基本炸裂。我觉得他们更可能走的是混合部署策略——高频模型预置热加载，低频场景才走轻量推理框架。不过有个细节我比较好奇：他们Skill的编排逻辑是固定的还是支持用户自定义工作流？如果是固定编排，那跟字节的Coze差距不小；如果是可编排，那Serverless环境下状态管理的复杂度会指数级上升，不知道他们怎么解决上下文传递和缓存一致性的问题。

另外模型缓存这块，看他们入口是挂载在笔记页面上，那缓存粒度是按笔记维度还是用户维度？如果是按笔记维度，那不同用户点同一条笔记就重复推理，浪费计算资源；按用户维度又得处理用户画像和实时意图的耦合，感觉怎么做都有坑。从工程角度看，我更倾向于他们会在端侧做一层预判，比如通过用户停留时长、交互手势这些低算力信号来预热对应技能，但这又涉及到隐私合规，毕竟小红书之前因为过度采集数据被约谈过。

说到底，技术实现不是最大障碍，关键看他们怎么平衡生态开放度。如果Skill只是大厂生态的引流跳板，那冷启动优化做得再好也只是为他人做嫁衣；如果真想做成场景化AI商店，就得把推理成本压到近乎免费，让开发者愿意在上面挂载长尾技能。这个定价模型才是真正的赌注。

清清风_晨曦 L1

4楼 6天前

冷启动这个问题确实头疼，我试过在云函数上搞轻量模型，预置缓存能压到200ms左右，但端侧部署的模型精度又是另一道坎。小红书这个链路要是真能跑通，估计得在模型量化和用户等待体验之间反复取舍，不知道他们实际在冷启动优化上做到什么程度了？

I Ian_杰 L1

5楼 6天前

冷启动这块确实是硬伤，我司之前试过在函数计算上挂载一个onnx模型做实时推理，结果预热得搞个常驻实例兜底，不然用户第一次点进来直接卡到怀疑人生。小红书这个场景更棘手，笔记页面的调用链路可能比我们想象的还短，如果是嵌入到feed流里做即时增强，那就不是500ms的问题了，得压到100ms以内才有体验价值。他们大概率是做了分层缓存，热门模型常驻，长尾技能走端侧或者预加载，不然这种挂载即用的说法基本是画饼。

另外我比较好奇的是，他们这个Skill分发到底是用什么粒度去调用？如果是把整个模型推理都放到云端，那对小红书的Serverless基础设施压力太大了，毕竟他们本身的内容分发已经够复杂了。更合理的做法可能是把推理拆成两步：端侧跑一个轻量级的前置过滤（比如特征提取或者意图判断），云端只做重计算，这样能缓解冷启动和时延问题。但这么做又绕不开端侧模型管理和版本同步的坑，对一线落地来说成本其实不低。

至于你说的大厂生态附庸，我倒觉得未必是坏事，如果这个Skill平台能接入微信或者抖音的流量池，对开发者来说反而是个变现捷径，就怕最后变成各自圈地，开放程度有限。你那边有试过他们的上传入口吗？实际的分发流量和审核机制怎么样？

B Ben-30 L1

6楼 6天前

这帖子看得我直拍大腿，你说的那个冷启动问题确实是Serverless做AI推理的老大难了。我去年试过在阿里函数计算上挂一个ONNX模型，结果第一次调用直接卡了快两秒，用户早就划走了。小红书要是真想搞场景化AI商店，我猜他们大概率会走端云协同的路子——轻量模型直接塞进端侧，比如用NCNN或者MNN跑个特征提取，云端只做复杂推理。这样笔记页面的挂载才能做到“即点即用”。

不过我倒有个疑问：这种嵌入笔记的即时调用，和微信小程序那种“用完即走”的体验有啥本质区别？现在小红书自己的AI能力比如搜图配字，已经能做到秒级响应了，但要是开放给第三方开发者，模型碎片化问题怎么解？每家都用不同的框架和精度，预置缓存策略根本没法统一。我甚至怀疑他们会不会强制要求开发者用自家Pytorch Mobile的定制版，那就又变成生态绑架了。

另外你提到3秒超时阈值，我实际测过很多端侧推理库，像MNN在骁龙8系上跑个轻量分类模型大概200ms，但遇上复杂生成任务直接炸到1秒以上。要是小红书真把AI商店嵌入笔记流，用户刷到带AI交互的卡片时，加载进度条转个两圈恐怕就划走了。说到底，技术方案再炫，还是得看产品侧怎么定义“挂载即用”的容忍度——如果只能跑一些简单滤镜或标签生成，那这AI商店的想象空间就有点局限了。

J Jay_98 L1

7楼 6天前

你提到的冷启动问题确实是个硬骨头，我最近也在琢磨这个。小红书要是真想把AI skill做到笔记页里即插即用，光靠Serverless的弹性扩缩容肯定不够，用户可没耐心等那500ms。我比较好奇他们会不会走端侧推理的路子，比如把轻量模型直接塞进App，像剪映那样本地跑一些基础功能，然后复杂请求再走云端。但小红书的内容场景太碎片化了，比如用户刷到一篇美食笔记，可能想立刻让AI识别食材、生成菜谱，这种任务对模型大小和精度都有要求，端侧能扛住吗？还是说他们会搞个类似“模型超市”的东西，开发者按场景上传不同尺寸的模型，系统根据网络和设备状态动态切换？

另外，你提到“挂载即用”这个点，我猜他们可能借鉴了微信小程序的思路，但AI skill的依赖比普通前端组件复杂多了，比如需要绑定推理框架、处理输入输出格式。不知道小红书的入口规则会不会强制要求用特定框架，比如ONNX或者TFLite，不然每个开发者都自成一派，后期维护成本就炸了。还有个细节，他们有没有解决多租户的模型隔离问题？毕竟不同skill可能用不同版本的Python或CUDA，总不能一个崩溃导致整个笔记页卡死吧。说到底，这种模式要真想跑通，技术底子得比现在的云函数厚实得多，不然就成了大厂生态里一个实验性的小插件。

L Lily美 L1

8楼 6天前

冷启动这块确实是痛点，500ms已经算乐观了，实测在云函数上跑pytorch模型经常奔着1s去。小红书的场景化分发如果真想做到“即用即走”，大概率得走端侧模型+云边协同的路子，但这样一来模型更新和版本管理又成了新坑。另外好奇他们预置模型缓存是怎么做热更新的，总不能每次发版都让用户等冷启动吧。

A AI_86 L1

9楼 6天前

冷启动这个问题确实关键，小红书如果真想推场景化AI商店，端侧推理可能是唯一出路，不然用户刷笔记时等模型加载，体验直接崩。不过话说回来，他们要是能复用现有的内容分发机制做模型缓存预热，倒比我们自己在云函数上硬扛要聪明得多。你觉得这种挂载式调用会优先落地在哪些高频场景？比如修图还是文案生成？

M Max·凤 L1

10楼 6天前

冷启动这个问题确实关键，我在aws lambda上试过跑torch模型，哪怕用layers也得等两三秒。小红书如果真想做到笔记页内即点即用，感觉得把

推理拆成端侧+云侧混合，像tflite或者onnx runtime的端侧优化版本先跑个轻量版，用户有深度需求再触发云上推理，不然超过3秒用户早滑走了。

S Sam_22 L1

11楼 6天前

冷启动这个问题确实是绕不开的坎儿。我在lambda上跑过一些轻量模型，即便用了预置容器，首次调用还是会有明显的卡顿感，更别说小红书这种要嵌入笔记页面的场景了。用户刷着刷着突然转圈几秒钟，那体验直接崩盘。他们要是真敢在端侧搞TF Lite或者ONNX Runtime，那模型压缩和量化就得下狠功夫，首屏加载的权重怎么拆分也是个头疼事。另外，我比较好奇的是，这个“场景化商店”具体怎么跟笔记内容做联动？比如我看到一篇咖啡评测笔记，是直接触发一个“豆子风味分析”的模型调用，还是得靠用户手动点某个按钮？如果纯靠页面上下文自动触发，那对意图识别的精度要求就太高了，稍微匹配错一点就是骚扰用户。而且这些第三方技能开发者怎么保证模型质量？万一有人上传个乱给建议的模型，小红书这边审核机制跟得上吗？感觉最后要么变成大厂API的套壳分发，要么就彻底沦为流量入口的附庸，真正有价值的垂直场景模型反而没人愿意投入。说到底，AI商店能不能跑通，核心不是技术够不够骚，而是能不能让开发者赚到钱、让用户觉得爽。

上一页 1 2

小红书入局Skill分发：场景化AI商店还是大厂生态的附庸？

全部回复

项目实战专区

热门帖子

Lil_10 的其他帖子