实时 AI 资讯

OPPO：面向多模态情绪推理的全感知策略优化框架

arXiv 新研究提出 OPPO 框架，通过强化学习显式优化多模态感知能力，解决当前 Omni-MLLM 在情绪推理中忽视多模态线索和幻觉行为的问题。

发布时间2026年6月25日 12:00（北京时间）/阅读次数 0

一篇题为《Omni-Perception Policy Optimization for Multimodal Emotion Reasoning》的论文在 arXiv 上发表。研究发现，当前面向情绪的 Omni-MLLM 仍然缺乏可靠的全模态感知能力：它们（一）在推理轨迹中未充分利用多模态线索；（二）表现出不忠实的行為，经常从其他模态幻觉出特定模态的陈述。

基于这些洞察，论文提出 OPPO（全感知策略优化）框架，这是一种通过强化学习显式优化多模态感知的框架。首先，全模态感知奖励模型被引入以引导学习。

来源为 arXiv cs.AI（编号 2606.25325），于 2026 年 6 月 25 日发布。

为什么重要

OPPO 直接回应了多模态情绪 AI 中的感知可靠性和忠实性问题，为构建更可信的情感交互系统提供了新范式。

MultimodalEmotion AIReinforcement LearningarXiv

来源

来源 1: https://arxiv.org/abs/2606.25325