阿里云悄然上线了一款全新的AI语音输入法CosyVoice,主打全场景语音录入,搭载千问大模型。这并非传统意义上的打字工具,而是一个以口述为核心的智能助手,支持macOS和移动端双平台,当前处于限免体验阶段。对于高频文字输出的人群,比如自媒体创作者、办公人士和科研工作者,这款产品有望大幅提升效率,但实测中我也发现了它的一个明显短板。先说说亮点。CosyVoice的语音转写基础能力相当扎实,支持多语种和方言识别,比如上海话、粤语、四川话都能实时转成标准普通话。更实用的是它的智能净化功能,能自动去除口语中的填充词和重复词,比如“嗯”“那个”会被直接过滤。同时,它还能识别口述中的自我修正,比如“不对不对,改成……”这种表述,系统会自动应用最后正确的版本,不留改口痕迹。此外,针对分点需求、数据对比类内容,CosyVoice能自动整理成编号列表或表格,输出格式条理清晰。数字和公式也能智能标准化,比如“三点五八亿”自动转成“3.58亿”,金融和科研场景直接可用。不过,实测中也暴露了一个原生短板:原生词库对小众专属名词、自媒体IP、自创品牌的识别准确度不足。比如科技媒体“读佳”被误识别为常用词“独家”,同音高频词容易覆盖自定义词汇。对于需要频繁输入专有名词的用户,手动修改会显著降低效率。好在阿里云提供了热词Skill功能,用户能手动录入专属术语或项目名称,词条添加保存后,模型转写时会优先匹配这些自定义词汇,从根源减少误识别。自媒体和行业从业者可以批量导入常用词汇,优化识别效果。展望未来,CosyVoice的潜力在于持续迭代。当前冷启动上线,词库和热词功能还有优化空间。对于高频文字输出人群,比如日常聊天、自媒体创作、办公写稿、专业数据记录等场景,这款产品已经能显著提升效率。建议用户先试用热词功能,录入自己的常用词汇,再逐步依赖语音输入。随着词库积累和模型优化,CosyVoice有望在办公和内容创作赛道占据一席之地。
阿里云CosyVoice AI输入法实测:语音转写惊艳,但有个短板
AITNT
9小时前
4
0