主题
大模型出现之前的Agent
在大模型出现之前,已经出现了符号Agent、反应型Agent、基于强化学习的Agent与具有迁移学习和元学习能力的Agent等
符号Agent
早期人工智能主要采用符号人工智能方法,通过逻辑规则和符号来表示知识和推理。这种方法的代表是专家系统
,具有良好的可解释性和表达能力。
但它的局限在于只能处理知识库中已有的问题,对于未知情况和复杂现实问题难以应对,且知识库越大计算负担越重。
反应型Agent
高效的感知环境,强调快速和实时做出响应。
基于强化学习的Agent
Agent自主在未知环境中,从高维输入中学习到复杂策略,比如AlphaGo
具有迁移学习和元学习能力的Agent
Agent在面对新任务时,能够迅速调整学习策略,利用已获得的一般知识和策略,因而能够减少对大量样本的依赖
为了解决基于强化学习的Agent在新任务上的学习要求大量的样本和长时间的训练,并且缺乏泛化能力的问题,研究人员引入迁移学习来减轻新任务训练的负担,促进跨不同任务的知识共享和迁移,从而提高学习效率和泛化能力。