作为一个在嵌入式AI领域摸爬滚打多年的工程师,看到Opal从摄像头转型音频硬件并拿到OpenAI的4000万美金,我的第一反应不是兴奋,而是警惕。先不说技术细节,单看估值2.75亿美元对应5万台摄像头的销量,这个倍数已经很高了。这次押注AI随身音频硬件,核心卖点应该是端侧语音处理+云端大模型协同。从技术角度看,难点在于:1)低功耗下的实时语音活动检测和降噪,这需要高效的小模型和硬件加速;2)隐私与延迟的平衡,本地处理得足够快才能让用户感觉‘无感’。个人经验告诉我,当前很多AI硬件都死在‘空中楼阁’式的体验设计上,比如唤醒词误触发、云端响应延迟超过200ms就让人抓狂。Opal如果能把端侧推理做到10ms内、功耗控制在100mW以下,才算及格。我比较好奇:OpenAI投钱是为了给ChatGPT找硬件入口,还是真看好Opal的工程能力?另外,这类随身设备如何解决续航与算力之间的矛盾?如果只是把手机上的语音助手做成独立硬件,那大概率是伪需求。行业趋势上,我认为AI硬件会从‘功能叠加’转向‘场景专精’,Opal的成败会直接影响资本对独立AI硬件的信心。