郭震 AI公众号:郭震AI

实时 AI 资讯

面向ASR纠错的错误感知TF-IDF检索增强生成方法

新研究提出一种轻量级RAG方法,通过感知语音错误的TF-IDF检索来纠正ASR系统对稀有实体和专业术语的幻觉。

发布时间/阅读次数 0

arXiv发表了一项针对端到端ASR系统纠错的新研究。端到端语音识别系统在低资源语言中频繁出现稀有实体和领域专业术语的幻觉问题,检索增强生成(RAG)框架可以缓解这些问题,但现有架构要么依赖忽略语音误识的标准稀疏检索,要么使用计算量过大的跨模态嵌入。

该研究提出了一种错误感知的TF-IDF检索增强生成方法,兼顾了检索精度和计算效率。它能够识别ASR系统常见的音近误识,并利用LLM进行更准确的纠正,同时避免了过高的计算开销。

该论文于2026年6月25日发布于arXiv cs.CL。对于低资源语言的语音应用和专业领域的语音交互系统,该方法提供了一条实用的优化路径。

为什么重要

为低资源语言和专业领域的ASR纠错提供了轻量高效的RAG方案,兼顾精度与计算成本。

arXivASRRAG

来源