Skip to main content

项目背景与目标

羽忆要解决的不是某个单独产品“记忆不好用”的问题,而是整个 Agent 生态里长期存在的结构性断层:记忆能力被绑定在具体模型、具体宿主和具体会话里,用户无法真正拥有自己的长期上下文。

这类问题为什么必须单独做一层基础设施

当前主流模型和 Agent 工具几乎都有各自的会话上下文与记忆机制,但这些能力天然存在三个限制:

  • 生态孤岛:不同模型厂商、不同宿主之间的记忆不能互通
  • 上下文断裂:换工具、换模型、换会话后,过去沉淀的结论往往要重新解释
  • 数据黑箱:用户通常无法完整审计、迁移或删除已经被“记住”的内容

如果记忆继续作为产品私有能力存在,用户的知识和偏好就会被锁定在围墙花园里。羽忆的定位恰恰相反:把记忆从产品特性中抽离出来,变成一个可以部署、迁移、审计和控制的独立基础设施层。

核心目标

第一阶段的设计目标可以概括为一句话:

让用户把“值得长期保留的信息”和“任务过程中的上下文材料”稳定地沉淀到自己的云端记忆层里,并让不同 Agent 可以共享这份记忆。

围绕这个目标,系统需要满足以下要求:

目标说明
开源设计与实现都应可审计、可演进
自托管核心能力不依赖官方托管服务
多 Agent 兼容不同客户端都面向同一套记忆 API
模型无关不绑定特定模型厂商原生 memory
用户可控用户可以查看、删除、归档、失效自己的记忆
部署简单Docker Compose 可以快速拉起最小闭环
安全可审计从第一阶段起就纳入认证、隔离、审计与脱敏

非目标边界

为了保证第一阶段聚焦,羽忆明确不把自己定义成以下几类系统:

  • 不替代模型厂商官方的产品级 memory
  • 不做聊天记录归档系统
  • 不做通用知识库或企业搜索平台
  • 不做以文档问答为中心的 RAG 产品
  • 不在第一阶段引入复杂审批流、多租户计费或全自动记忆治理

这类边界需要明确写出来,是为了避免系统在“什么都能做一点”的扩张里失去主线。羽忆第一阶段的任务不是把所有记忆相关问题一次做完,而是把最核心的“写入、召回、控制、跨 Agent 共享”闭环跑通。

典型使用场景

跨 Agent 共享项目约定

用户在一个 Agent 里沉淀了项目约定、接口风格或技术决策,之后切换到另一个 Agent 时,新的宿主仍然可以读取同一份记忆,而不需要重新讲一遍背景。

长期保存个人偏好

例如:

  • 代码示例优先使用 Java
  • 回答偏详细,先讲原理再给结论
  • 项目接口统一返回 {code, message, data}

这类内容本来就具有跨会话、跨工具复用的价值,适合沉淀为稳定记忆。

延续任务过程中的工作上下文

有些信息不一定值得长期固化,但在短期内极其重要,例如:

  • 某个需求已经完成到哪一步
  • 某个方案为什么被否决
  • 上次排查线上问题时确认了哪些原因

这类材料不适合和长期规则混在一起,但也不能直接丢失,所以需要单独进入历史层,供后续任务召回。

当前阶段的交付判断标准

如果一个用户能够:

  1. 部署羽忆服务端
  2. 通过某个 Adapter 写入稳定记忆
  3. 再写入一条历史材料
  4. 在另一个 Agent 里成功召回这些内容
  5. 并且可以手动删除或切换到临时模式

那就说明这套基础设施已经完成了第一阶段最重要的价值验证。