当所有AI都在努力理解世界时,一家名为Clipto.AI的公司却选择了一条更私密、更个性化的路径——理解你。5月底,这家公司推出的端侧多模态搜索工具登顶Product Hunt全球榜首,其核心是构建AI时代缺失的“记忆层”(Memory Layer)。创始人康洪文指出,过去十年AI一直在构建世界模型,但缺少用户模型;Agent越来越聪明,却因缺失记忆无法真正理解用户。Clipto的解法,正是要填补这一空白。Clipto并非仅是一款搜索工具。用户将本地视频、音频、图片和文档导入后,系统会依靠设备自身的AI算力与自研端侧多模态大模型,对所有文件完成感知理解、结构化解析与向量化处理,最终搭建起带有认知图谱、实现时空对齐的个人记忆系统。实际使用中,用户只需用自然语言描述需求,端侧大模型会先解析查询意图与上下文,再通过本地搜索Agent在数秒内精准定位——无论是特定人物、场景、对白,还是完整事件段落,都能直接命中。更关键的是,用户能以对话形式提问,让AI基于本地记忆生成摘要、总结与内容梳理,全程数据不出设备。康洪文的履历揭示了这一理念的技术渊源。2004年他在微软亚洲研究院实习时,就参与帮助Xbox自动分析家庭照片和视频,从数小时素材中提取关键片段生成家庭短片。后来他在卡内基梅隆大学师从计算机视觉传奇学者Takeo Kanade,继续研究视频理解。在他看来,视频本质上是关于时间、人物、事件和关系的复杂信息结构,理解视频就是理解现实世界。2017年他创办慧川智能,推出文字生成视频平台智影,但发现内容生产效率提升后,海量素材的重新利用成了新瓶颈。Clipto的诞生,正是要解决这一痛点。对于记者、创作者、律师、研究员等知识工作者,真正消耗时间的往往不是生产内容,而是在海量素材中寻找内容。Clipto让用户从“搜索文件”变成“搜索记忆”,通过本地多模态模型把视频、音频、图片和文档转化为AI能理解的数据结构。这一方面省去了海量数据上传、调用云端模型产生的高额Token成本;另一方面,对于包含商业机密、敏感信息的工作素材,数据不出设备本身就是一道刚性的安全门槛。康洪文认为,搜索只是第一步,更重要的是建立一套能持续积累个人上下文的Memory Layer——过去十年AI构建的是关于世界的知识库,未来AI需要进一步理解每个用户的个人知识和经历。
Clipto.AI登顶Product Hunt:押注AI记忆层,让机器真正理解你
AITNT
2小时前
1
0