郭震 AI公众号:郭震AI

Realtime AI News

实时 AI 资讯

English
AI ResearchLanguage ModelsInterpretability

研究发现循环语言模型存在「读出盲点」:稠密监督无法控制所有隐藏状态变量

一项新研究揭示,在循环语言模型中,每个循环步上的稠密交叉熵损失只能控制读出层暴露的变量,而非循环转移中的所有隐藏状态变量,导致模型存在系统性的监督盲区。

AI ResearchAI for ScienceQuantum Computing

人机协作发现量子算法:AI 从模糊研究直觉推进到数学发现

一篇新研究展示了人机协作从模糊的研究直觉出发,最终共同发现符号嵌入量子算法(sign-embedding quantum algorithms)的完整过程,展示了 AI 辅助数学发现的新范式。

arXivAgentsEvaluation

AgentOdyssey:面向持续学习智能体的开放文本游戏评估框架

新框架AgentOdyssey通过程序化生成的开放文本游戏,系统评估智能体在测试时的持续学习能力。

OpenAIAgentResearch

OpenAI 发布研究论文:AI 代理如何改变工作方式

OpenAI 发布新研究论文,阐述 AI 代理如何通过处理更长、更复杂的任务来变革工作,并跨角色扩展生产力。

ResearchARCReasoning

新论文DiARC:区分正负样本提升LLM的ARC推理能力

arXiv上发表的DiARC方法通过区分正负样本,显著提升了大语言模型在抽象推理(ARC)任务上的表现。

CerebrasStockAI ChipsEarnings

Cerebras上市后首份财报不及预期,股价暴跌CEO称利润率展望被误解

AI芯片公司Cerebras发布上市后首份财报,核心业务毛利率展望低于预期引发股价暴跌,CEO表示市场误解了其利润率指引。

Enterprise AIIndustry

企业紧急行动,防止员工用小额任务耗光AI预算

TechCrunch报道称,企业正在纷纷采取措施,阻止员工将AI预算大量消耗在低价值的小任务上,AI时代从'无限制使用'转向'配额管理'。

GoogleResearchReasoningLLM

Google 研究:推理如何解锁 LLM 中的参数化知识

Google Research 发表新研究,探索推理过程如何激活和利用大语言模型中存储的参数化知识。

每日快报