一号热搜榜,为您提供最新的热搜资讯,热搜榜信息!

DeepSeek发布梁文锋署名论文 开源记忆模块Engram

国内热搜 作者:财联社 热度:370

DeepSeek发布梁文锋署名论文 开源记忆模块Engram

DeepSeek于12日晚发布了一篇新论文《基于可扩展查找的条件记忆:大型语言模型稀疏性的新维度》。这篇论文由北京大学与DeepSeek合作完成,梁文锋是合著作者之一。论文提出了一种称为条件记忆的新方法,通过引入可扩展的查找记忆结构,在同等参数和算力条件下,显著提升了模型在知识调用、推理、代码和数学任务上的表现。DeepSeek还开源了相关的记忆模块Engram。

DeepSeek发布梁文锋署名论文 开源记忆模块Engram
DeepSeek发布梁文锋署名论文 开源记忆模块Engram
DeepSeek发布梁文锋署名论文 开源记忆模块Engram
标签: 开源     模块     记忆