Titans + MIRAS: Helping AI have long-term memory

Titans + MIRAS Helping AI have long-term memory.png

Titans 新架构和 MIRAS 理论框架,解决人工智能在处理超长上下文时的记忆问题。

核心背景与问题

目前的 Transformer 架构虽然在短期记忆(注意力机制)上表现出色,但随着输入内容长度的增加,其计算成本急剧上升,难以扩展到处理全文档或基因组分析等超长任务。

另一方面,线性 RNN 和状态空间模型(如 Mamba-2)虽然速度快,但通常将上下文压缩为固定大小,导致信息丢失。

解决方案:Titans 和 MIRAS

为了结合 RNN 的速度和 Transformer 的准确性,研究团队提出了两个核心概念:

  1. Titans 架构(工具):
  2. MIRAS 框架(蓝图):

关键成果