实时 AI 资讯
Qwen 发布 Qwen3-ForcedAligner-0.6B 语音对齐模型
Qwen 团队在 Hugging Face 上正式发布 Qwen3-ForcedAligner-0.6B-hf 模型,专注于语音识别中的强制对齐任务,支持中、英、粤、法多语言。
发布时间/阅读次数 0
Qwen 团队于 6 月 26 日在 Hugging Face 模型库正式上架 Qwen3-ForcedAligner-0.6B-hf,这是一款面向语音识别任务的强制对齐(forced alignment)模型,采用 token-classification pipeline,基于 transformers 库和 safetensors 格式构建。
该模型标签涵盖 transformers、safetensors、qwen3_asr、token-classification,支持中文(zh)、英文(en)、粤语(yue)和法语(fr)四种语言,表明 Qwen 正在系统化构建其语音技术栈。
强制对齐是语音识别和语音合成中的关键环节,能够将音频信号与文本在时间轴上精确对齐。这一模型的发布为开发者提供了一个专门化的工具,可应用于语音数据集标注、语音合成训练数据的准备等场景。
来源:Qwen Hugging Face 官方模型库,模型页面显示下载量为 0,获赞 1 次。
为什么重要
该模型填补了 Qwen 语音生态中强制对齐环节的空白,对语音数据标注和语音合成工作流的开发者具有实用价值。