端午节前夕,DeepSeek不出意外地带来了新动作——识图模式正式全量上线。手机端App和网页版同步推送,用户打开就能体验。此前该功能仅在小范围灰度测试,如今终于向所有用户开放,标志着DeepSeek在多模态能力上迈出关键一步。然而,有趣的是,有用户测试发现,DeepSeek竟然认不出自家老板梁文锋,这一“翻车”瞬间成为技术圈的谈资,也让人思考视觉AI的边界与挑战。
从功能来看,DeepSeek识图模式支持上传图片并自动识别内容,用户可针对图片提问,如识别物体、场景、文字等。据官方介绍,该模式基于多模态大模型,能够处理复杂视觉信息,包括手写文字、自然景观、产品包装等。实际测试中,对于常见物体和清晰文字,识别准确率较高;但对于模糊图像或特定人物(如梁文锋),表现不尽如人意。这一反差凸显了当前视觉AI在泛化能力上的局限,尤其是对非公开、非标准数据的识别仍存短板。
行业影响方面,DeepSeek识图模式的上线,进一步加剧了国内多模态AI的竞争。目前,百度、阿里、字节等均已推出类似功能,但DeepSeek凭借开源模型和低成本优势,吸引了大量开发者。据公开数据,DeepSeek的API调用价格仅为同类产品的十分之一,这使其在中小企业和独立开发者中迅速普及。此次识图功能全量开放,预计将推动更多应用场景落地,如电商商品识别、教育图文解析、医疗影像辅助等。
展望未来,视觉AI的准确性和鲁棒性仍是核心挑战。DeepSeek识图模式“认不出老板”虽显尴尬,却也提醒行业:技术突破需兼顾数据多样性与模型训练的深度。对于AI从业者而言,这既是警示也是机遇——在追求高性能的同时,更要关注边缘案例的覆盖。建议开发者利用DeepSeek的开源生态,结合自有数据微调模型,以提升特定场景的识别效果。毕竟,AI的终极目标不是完美,而是持续进化。