实时 AI 资讯

Qwen 发布 Qwen3-ASR-0.6B 自动语音识别模型

Qwen 团队在 Hugging Face 推出 Qwen3-ASR-0.6B-hf 自动语音识别模型，支持中、英、粤语，采用 text-generation pipeline。

发布时间2026年6月26日 16:39（北京时间）/阅读次数 0

Qwen 团队于 6 月 26 日在 Hugging Face 上架 Qwen3-ASR-0.6B-hf 模型，这是一款自动语音识别（ASR）模型，采用 automatic-speech-recognition pipeline，基于 transformers 库和 safetensors 格式，同时标注了 text-generation 能力。

该模型支持中文（zh）、英文（en）和粤语（yue），标签体系涵盖 transformers、safetensors、qwen3_asr、text-generation 和 automatic-speech-recognition，表明这是一个融合了语音识别与文本生成能力的混合架构。

与同日发布的 Qwen3-ForcedAligner-0.6B 不同，ASR 版本直接面向语音转文字的端到端识别场景，更适合需要直接转录语音的应用，如语音助手、会议记录和实时字幕生成。

来源：Qwen Hugging Face 官方模型库。

为什么重要

Qwen3-ASR-0.6B 的发布进一步完善了 Qwen 的语音模型产品线，为开发者提供了从 ASR 到强制对齐的完整语音方案。

QwenModel ReleaseASRHugging Face

来源

来源 1: https://huggingface.co/Qwen/Qwen3-ASR-0.6B-hf