实时 AI 资讯
Qwen 发布 Qwen3-ASR-0.6B 自动语音识别模型
Qwen 团队在 Hugging Face 推出 Qwen3-ASR-0.6B-hf 自动语音识别模型,支持中、英、粤语,采用 text-generation pipeline。
发布时间/阅读次数 0
Qwen 团队于 6 月 26 日在 Hugging Face 上架 Qwen3-ASR-0.6B-hf 模型,这是一款自动语音识别(ASR)模型,采用 automatic-speech-recognition pipeline,基于 transformers 库和 safetensors 格式,同时标注了 text-generation 能力。
该模型支持中文(zh)、英文(en)和粤语(yue),标签体系涵盖 transformers、safetensors、qwen3_asr、text-generation 和 automatic-speech-recognition,表明这是一个融合了语音识别与文本生成能力的混合架构。
与同日发布的 Qwen3-ForcedAligner-0.6B 不同,ASR 版本直接面向语音转文字的端到端识别场景,更适合需要直接转录语音的应用,如语音助手、会议记录和实时字幕生成。
来源:Qwen Hugging Face 官方模型库。
为什么重要
Qwen3-ASR-0.6B 的发布进一步完善了 Qwen 的语音模型产品线,为开发者提供了从 ASR 到强制对齐的完整语音方案。