大型语言模型(LLM)已展现出强大的推理、规划和交流能力,使其能在开放环境中作为自主智能体运行。
尽管单智能体系统在适应性与协同性方面仍存在局限,但近期研究进展已将关注点转向由多个交互式大语言模型组成的多智能体系统(MAS),这些系统可追求合作、竞争或混合目标。这一新兴范式为研究智能体间的社会动态与策略行为提供了有力的实验场。
然而,当前研究仍较为分散,缺乏统一的理论基础。为弥补这一空白,本文通过博弈论视角对基于大语言模型的多智能体系统进行全面综述。
通过围绕博弈论的四个核心要素——参与者、策略、支付函数与信息——梳理现有研究,我们建立了一个系统性框架,用以理解、比较并指导未来关于基于大语言模型的多智能体系统的设计与分析研究。
我们通过博弈论视角对基于大语言模型的多智能体系统进行全面综述,为这一快速发展领域提供统一的理论基础。
通过围绕参与者、策略、支付函数与信息等核心要素梳理现有研究,我们构建了一个系统化框架,用以分类多样的智能体行为与交互动态。
分析表明,虽然大语言模型在高层推理与策略沟通方面表现卓越,但在复杂部分可观测环境下的稳健均衡选择与激励相容方面仍存在显著不足。
最后,我们前瞻性地指出关键研究方向,强调经典博弈论与大语言模型的深度融合,对开发更可靠、自主且具备社会智能的多智能体系统具有决定性意义。