Skip to content

大模型出现之前的Agent

在大模型出现之前,已经出现了符号Agent、反应型Agent、基于强化学习的Agent与具有迁移学习和元学习能力的Agent等

符号Agent

早期人工智能主要采用符号人工智能方法,通过逻辑规则和符号来表示知识和推理。这种方法的代表是专家系统,具有良好的可解释性和表达能力。

但它的局限在于只能处理知识库中已有的问题,对于未知情况和复杂现实问题难以应对,且知识库越大计算负担越重。

反应型Agent

高效的感知环境,强调快速和实时做出响应。

基于强化学习的Agent

Agent自主在未知环境中,从高维输入中学习到复杂策略,比如AlphaGo

具有迁移学习和元学习能力的Agent

Agent在面对新任务时,能够迅速调整学习策略,利用已获得的一般知识和策略,因而能够减少对大量样本的依赖

为了解决基于强化学习的Agent在新任务上的学习要求大量的样本和长时间的训练,并且缺乏泛化能力的问题,研究人员引入迁移学习来减轻新任务训练的负担,促进跨不同任务的知识共享和迁移,从而提高学习效率和泛化能力。