大模型出现之前的Agent

在大模型出现之前，已经出现了符号Agent、反应型Agent、基于强化学习的Agent与具有迁移学习和元学习能力的Agent等

符号Agent

早期人工智能主要采用符号人工智能方法,通过逻辑规则和符号来表示知识和推理。这种方法的代表是专家系统,具有良好的可解释性和表达能力。

但它的局限在于只能处理知识库中已有的问题,对于未知情况和复杂现实问题难以应对,且知识库越大计算负担越重。

高效的感知环境，强调快速和实时做出响应。

Agent自主在未知环境中，从高维输入中学习到复杂策略，比如AlphaGo

Agent在面对新任务时，能够迅速调整学习策略，利用已获得的一般知识和策略，因而能够减少对大量样本的依赖

为了解决基于强化学习的Agent在新任务上的学习要求大量的样本和长时间的训练，并且缺乏泛化能力的问题，研究人员引入迁移学习来减轻新任务训练的负担，促进跨不同任务的知识共享和迁移，从而提高学习效率和泛化能力。