Clipto.AI登顶Product Hunt：押注AI记忆层，让机器真正理解你

当所有AI都在努力理解世界时，一家名为Clipto.AI的公司却选择了一条更私密、更个性化的路径——理解你。5月底，这家公司推出的端侧多模态搜索工具登顶Product Hunt全球榜首，其核心是构建AI时代缺失的“记忆层”（Memory Layer）。创始人康洪文指出，过去十年AI一直在构建世界模型，但缺少用户模型；Agent越来越聪明，却因缺失记忆无法真正理解用户。Clipto的解法，正是要填补这一空白。Clipto并非仅是一款搜索工具。用户将本地视频、音频、图片和文档导入后，系统会依靠设备自身的AI算力与自研端侧多模态大模型，对所有文件完成感知理解、结构化解析与向量化处理，最终搭建起带有认知图谱、实现时空对齐的个人记忆系统。实际使用中，用户只需用自然语言描述需求，端侧大模型会先解析查询意图与上下文，再通过本地搜索Agent在数秒内精准定位——无论是特定人物、场景、对白，还是完整事件段落，都能直接命中。更关键的是，用户能以对话形式提问，让AI基于本地记忆生成摘要、总结与内容梳理，全程数据不出设备。康洪文的履历揭示了这一理念的技术渊源。2004年他在微软亚洲研究院实习时，就参与帮助Xbox自动分析家庭照片和视频，从数小时素材中提取关键片段生成家庭短片。后来他在卡内基梅隆大学师从计算机视觉传奇学者Takeo Kanade，继续研究视频理解。在他看来，视频本质上是关于时间、人物、事件和关系的复杂信息结构，理解视频就是理解现实世界。2017年他创办慧川智能，推出文字生成视频平台智影，但发现内容生产效率提升后，海量素材的重新利用成了新瓶颈。Clipto的诞生，正是要解决这一痛点。对于记者、创作者、律师、研究员等知识工作者，真正消耗时间的往往不是生产内容，而是在海量素材中寻找内容。Clipto让用户从“搜索文件”变成“搜索记忆”，通过本地多模态模型把视频、音频、图片和文档转化为AI能理解的数据结构。这一方面省去了海量数据上传、调用云端模型产生的高额Token成本；另一方面，对于包含商业机密、敏感信息的工作素材，数据不出设备本身就是一道刚性的安全门槛。康洪文认为，搜索只是第一步，更重要的是建立一套能持续积累个人上下文的Memory Layer——过去十年AI构建的是关于世界的知识库，未来AI需要进一步理解每个用户的个人知识和经历。

Clipto.AI登顶Product Hunt：押注AI记忆层，让机器真正理解你

相关推荐

苹果AI平台技术负责人创业，10亿融资定义具身智能新范式

AI消灭感冒被提上日程，Anthropic和OpenAI罕见联手

苹果AI平台技术负责人创业，10亿融资定义具身智能新范式

AI消灭感冒被提上日程，Anthropic和OpenAI罕见联手

苹果AI平台技术负责人创业，10亿融资定义具身智能新范式

📖 更多原创