实时 AI 资讯

Qwen 发布 Qwen3-ForcedAligner-0.6B 语音对齐模型

Qwen 团队在 Hugging Face 上正式发布 Qwen3-ForcedAligner-0.6B-hf 模型，专注于语音识别中的强制对齐任务，支持中、英、粤、法多语言。

发布时间2026年6月26日 16:42（北京时间）/阅读次数 0

Qwen 团队于 6 月 26 日在 Hugging Face 模型库正式上架 Qwen3-ForcedAligner-0.6B-hf，这是一款面向语音识别任务的强制对齐（forced alignment）模型，采用 token-classification pipeline，基于 transformers 库和 safetensors 格式构建。

该模型标签涵盖 transformers、safetensors、qwen3_asr、token-classification，支持中文（zh）、英文（en）、粤语（yue）和法语（fr）四种语言，表明 Qwen 正在系统化构建其语音技术栈。

强制对齐是语音识别和语音合成中的关键环节，能够将音频信号与文本在时间轴上精确对齐。这一模型的发布为开发者提供了一个专门化的工具，可应用于语音数据集标注、语音合成训练数据的准备等场景。

来源：Qwen Hugging Face 官方模型库，模型页面显示下载量为 0，获赞 1 次。

为什么重要

该模型填补了 Qwen 语音生态中强制对齐环节的空白，对语音数据标注和语音合成工作流的开发者具有实用价值。

QwenModel ReleaseASRHugging Face

来源

来源 1: https://huggingface.co/Qwen/Qwen3-ForcedAligner-0.6B-hf