网站域名到期后果产品推广计划方案
1 MemoryOs
论文链接:https://arxiv.org/abs/2506.06326
项目地址:https://github.com/BAI-LAB/MemoryOS
北邮百家 AI 团队重磅推出首个大模型记忆操作系统开源框架 MemoryOS。巧妙融合计算机操作系统原理与人脑分层记忆机制,构建段页式三级存储架构及四大核心模块(存储、更新、检索、生成),提供全链路用户记忆管理方案,让 AI 智能体拥有持久「记性」与深度「个性」
1.1 记忆分层:
STM:短期记忆,时间流,query, time, response三元组, 记录最近会话中的每一次对话,单位是「对话页」,每一页都含有用户提问、AI答复、时间戳,以及自动生成的“上下文摘要”,保证对话语境的延续性。
MTM:中期记忆,仿照操作系统的段页式结构,将多页对话按“语义话题”打包成段(segment)。系统通过计算对话页与段落之间的语义相似度 Fscore(结合词向量余弦与关键词 Jaccard 相似度)来聚合相关对话,确保段内主题清晰、内容连贯。
LTM:长期记忆,这是AI自我意识的一部分,包含两大分支:
1)用户画像:不仅记录静态信息(如姓名、出生年),还动态维护知识库(User KB)和兴趣画像(User Traits),高达90维度。
2)AI画像:包含系统设定角色(如“助理”或“顾问”)和互动演化的行为偏好(Agent Traits),形成一致的人设和行为风格。
这一层级结构不仅模仿了人类记忆的分层机制,也引入操作系统式“分段管理”理念,使AI能区分“即刻对话”、“常谈话题”与“长期偏好”。
1.2 记忆更新 —— 记忆不是堆叠,而是过滤
STM → MTM:采用先进先出(FIFO)队列逻辑。当STM满员,最早的对话页自动转移至MTM,这保证了短期记忆永远聚焦“当前话题”。
MTM → LPM:更为复杂。系统计算每个段的热度分数(Heat),由访问频次(Nvisit)、内容丰富度(Linteraction,对话页面的总数)、最近使用程度(Rrecency,时间衰减系数,当前段上次重新检索时间以来的持续时间)共同决定。公式如下:
当段落热度高于设定阈值,说明它对用户具有持续价值,此时系统将其提取并更新进用户偏好(Traits)与知识库(KB)中。反之,低热度段则被优雅地“遗忘”或回收。
1.3 记忆检索:两阶段:首先识别段,然后检索相关对话页面。
STM 提供最近对话背景,直接使用;
MTM 则要经过“双阶段检索”:先从所有段中选出最相关的若干段(基于Fscore),再在段内挑选最相关的对话页。
LPM 检索用户画像中的语义匹配特征,尤其是动态特征和偏好,找到与当前问题最贴近的历史线索。
最后,它将LPM的个人属性和STM的上下文信息相结合,生成响应,整合用于生成响应的所有相关存储器。
1.4 流程图
1.5 评测方法
GVD(General Virtual Dialogue):模拟15位虚拟用户在10天内与AI进行多轮对话的过程,每天涵盖多个主题。这更像我们日常的“连续使用情境”,检验模型对日常信息的长期保留与更新能力。
LoCoMo Benchmark:被誉为“长对话记忆炼金炉”。每组对话平均长达300轮、包含近9,000个Token,专为检测LLMs在超长交互下的记忆保持力而设计。问题被细分为四类:单跳、 多跳、 时间性推理和开放式提问,极具挑战性。
在评估方式上,团队设置了多维指标。
GVD 使用记忆检索准确率(Acc)、回答正确率(Corr)、上下文连贯性(Cohe)三项打分;
LoCoMo 则采用标准的 F1和 BLEU-1指标,衡量语义精确度与语言生成质量。