论文阅读:arxiv 2025 Advances and Challenges in Foundation Agents--Memory调研

总目录 大模型安全相关研究:https://blog.csdn.net/WhiffeYF/article/details/142132328

https://arxiv.org/pdf/2504.01990#page=64.19
在这里插入图片描述

Memory

1 Representation

名称引用
SensoryText-basedRecAgent202595
SensoryText-basedCoPS202429
SensoryText-basedMemoryBank2024300
SensoryText-basedMemory Sandbox202346
SensoryMulti-modalVideoAgent202488
SensoryMulti-modalWorldGPT202448
SensoryMulti-modalAgentS202451
SensoryMulti-modalOS-Copilot2024117
SensoryMulti-modalMuLan20243
Short-termContextMemGPT2023203
Short-termContextKARMA202410
Short-termContextLSFS20241
Short-termContextOSCAR202415
Short-termContextRCI2023445
Short-termWorkingGenerative Agent20232705
Short-termWorkingRLP202317
Short-termWorkingCALYPSO202362
Short-termWorkingHiAgent202424
Long-termSemanticAriGraph202427
Long-termSemanticRecAgent202595
Long-termSemanticHippoRAG2024124
Long-termEpisodicMobileGPT202330
Long-termEpisodicMemoryBank2024300
Long-termEpisodicEpisodic Verbalization20246
Long-termEpisodicMrSteve20245
Long-termProceduralAAG20241
Long-termProceduralCradle202455
Long-termProceduralARVIS-12024121
Long-termProceduralLARP202320

2 Lifecycle

名称引用
AcquisitionInformation CompressionHiAgent202424
AcquisitionInformation CompressionLMAgent20245
AcquisitionInformation CompressionReadAgent202439
AcquisitionInformation CompressionM2WF20252
AcquisitionExperienceConsolidationExpeL2024300
AcquisitionExperienceConsolidationMindOS2024/54/40
EncodingSelective AttentionAgentCorrd202430
EncodingSelective AttentionMS202419
EncodingSelective AttentionGraphVideoAgent20251
EncodingSelective AttentionA-MEM2024/56/45
EncodingMulti-modalFusionOptimus-1202441
EncodingMulti-modalFusionOptimus-220258
EncodingMulti-modalFusionJARVIS-12024121
DerivationReflectionAgent S202451
DerivationReflectionOSCAR202415
DerivationReflectionR2D220250
DerivationReflectionMobile-Agent-E202539
DerivationSummarizationSummEdits202372
DerivationSummarizationSCM202322
DerivationSummarizationHealthcare Copilot2024/530/59
DerivationKnowledge DistillationKnowagent202456
DerivationKnowledge DistillationAoTD20247
DerivationKnowledge DistillationLDPD20258
DerivationKnowledge DistillationSub-goal Distillation20243
DerivationKnowledge DistillationMAGDi202422
DerivationSelective ForgettingLyfe Agent202341
DerivationSelective ForgettingTiM202357
DerivationSelective ForgettingMemoryBank2024301
DerivationSelective ForgettingS32023/4100/40
RetrievalIndexingHippoRAG2024126
RetrievalIndexingTradingGPT202364
RetrievalIndexingLongMemEval202433
RetrievalIndexingSeCom20255
RetrievalMatchingProduct Keys2019161
RetrievalMatchingOSAgent20245/40
Neural MemoryAssociative MemoryHopfield Networks2017/20277/749
Neural MemoryAssociative MemoryNeural Turing Machines202217
Neural MemoryParameterIntegrationMemoryLLM202434
Neural MemoryParameterIntegrationSELF-PARAM20242
Neural MemoryParameterIntegrationMemoRAG202411
Neural MemoryParameterIntegrationTTT-Layer2024128
Neural MemoryParameterIntegrationTitans202471
Neural MemoryParameterIntegrationR3Mem20253
UtilizationRAGRAGLAB202417
UtilizationRAGAdaptive Retrieval2022681
UtilizationRAGAtlas2023/44/5
UtilizationLong-context ModelingRMT2022/3208/105
UtilizationLong-context ModelingAutoCompresso2023211
UtilizationLong-context ModelingICAE2023169
UtilizationLong-context ModelingGist2023239
UtilizationLong-context ModelingCompAct202427
UtilizationAlleviating HallucinationLamini202411
UtilizationAlleviating HallucinationMemoria20237
UtilizationAlleviating HallucinationPEER202448/65

例如,RecAgent[259]采用基于llm的感觉记忆模块对原始观测进行编码,同时过滤噪声和不相关的内容。
例如,RecAgent[259]采用了一种带有重要性评分系统的注意力机制,该系统为压缩的观察值分配相关性分数,优先考虑关键输入,如特定项目的交互,同时强调不太重要的动作。
例如,RecAgent[259]通过将每个观测值与用户行为模拟环境中模拟回合的开始相对应的时间戳相关联来建模保留,该时间戳表示为⟨observation,重要性评分,时间戳⟩

在像MemoryBank[261]这样的人工智能伙伴系统中,语义记忆以自然语言构建用户画像,而情景记忆保留交互历史,增强个性化和上下文感知行为。
在更细粒度的遗忘机制中,MemoryBank[261]采用艾宾浩斯遗忘曲线(Ebbinghaus forgetting Curve)来量化遗忘率,同时考虑了时间衰减和间隔效应,即重新学习信息比第一次学习更容易的原则。

Expel[96]构建了一个经验库,从训练任务中收集和提取见解,促进对未见任务的推广。
ExpeL[96]利用反思来收集过去的经验,以便将其推广到看不见的任务,并支持失败后的反复尝试。
通过像reflex[75]和ExpeL[96]这样的系统,智能体通过自主管理经验收集、分析和应用的完整周期,实现了复杂的体验式学习,使它们能够从成功和失败中有效地学习。

Mem0 2025

langmem

MemGPT 2024

内容概要:本文是一篇关于智能体(agents)的综述,探讨了从脑启发智能到进化、协作和安全系统的进展与挑战。文章首先介绍了智能体的模块化设计,涵盖认知、感知、行动、记忆、世界建模、情感、目标和奖励等核心组件,强调了这些模块与人类大脑功能的相似性。接下来,文章探讨了智能体的自我增强机制,包括自适应学习、反馈驱动的改进和持续知识集成,以适应动态环境。随后,文章讨论了多智能体系统的协作与进化,强调了集体智慧和适应性决策的重要性。最后,文章详细分析了构建安全和有益的AI系统的必要性,提出了内在和外在安全威胁的缓解策略。文章还探讨了未来的研究方向,包括多模态感知、长上下文建模、幻觉缓解策略等。 适用人群:本文适合研究人员、学生、政策制定者和行业从业者,尤其是对AI智能体、大型语言模型(LLMs)及其应用感兴趣的读者,以及对未来社会中人类与AI共存感兴趣的群体。 使用场景及目标:①理解智能体的模块化设计和其与人类认知的相似性;②学习智能体的自我增强机制和持续学习策略;③探讨多智能体系统的协作模式和集体智慧;④掌握构建安全、有保障和有益的AI系统的策略和技术。 其他说明:本文不仅提供了关于智能体的全面概述,还鼓励读者提出新问题并探索这一领域的研究空白。文章强调了智能体设计不仅要追求强大和高效,还要具备适应性、伦理性和与人类社会的深度一致性。通过综合不同学科的见解,本文为智能体的发展提供了一个前瞻性的路线图。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CSPhD-winston-杨帆

给我饭钱

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值