主题
AIAgent认知再升级:包含AIAgent能力组成、能力基石、Agents开发全流程、智能体的可控性、重构建立竞争壁垒、AI Agent 与 AI Workflow、大模型出现之前的Agent、基于大模型AIAgent不同自动化程度所需要的能力、从应用到智能体服务的升维、产业生态完善、产业重构
第一部分:Agent框架
1、AutoGPT
基于OpenAI LLM的自定义AI代理工具包,功能强大,GitHub上受欢迎。https://github.com/Significant-Gravitas/AutoGPT

2、ChatDev
可重塑软件开发的智能体协作框架
虚拟软件公司框架,多智能体协作完成软件开发任务。
https://github.com/OpenBMB/ChatDev
是什么
- 核心特性围绕
多角色协作、流程分解与优化机制
展开,尤其在解决代码生成中的“幻觉”问题和提升开发效率方面具有创新性 - 将开发流程划分为设计、编码、测试、文档化四个阶段
项目地址:https://github.com/OpenBMB/ChatDev.git
使用方法
shell
# 克隆代码仓库
git clone https://github.com/OpenBMB/ChatDev.git
# 配置Python环境
conda create -n ChatDev_conda_env python=3.9 -y
conda activate ChatDev_conda_env
# 安装依赖项
cd ChatDev
pip install -r requirements.txt
# 设置大模型密钥
export OPENAI_API_KEY="your_api_key"
# 运行
python run.py --task "设计一个2048游戏" --name "2048Game" --org "diyai.cn"
进阶使用
自定义角色与流程:修改配置文件CompanyConfig
,调整智能体职责或开发流程。
可视化工具:通过日志回放功能分析开发过程
ChatDev不仅解决了传统LLM在软件开发中的随机性和代码幻觉问题,还为自动化开发提供了高效、低成本的解决方案。
其局限性主要在于复杂任务(如大规模系统开发)仍需人工调试,但对中小型项目已展现出显著优势
3、LangChain
强大的工作流自动化框架,支持复杂任务的模块化构建和多LLM集成。
https://github.com/langchain-ai/langchain
LangGraph
基于图的工作流框架,适合复杂任务的有状态管理和顺序执行。
https://github.com/langchain-ai/langgraph
4、AutoGen
微软开源框架,支持多智能体协同工作,简化智能体通信。
https://github.com/microsoft/autogen

5、MetaGPT
模仿软件公司结构,智能体分配角色协作完成编码任务。
https://github.com/geekan/MetaGPT
6、BabyAGI
任务驱动型智能体,代码简洁,可扩展性强,支持多种平台和插件。
https://github.com/yoheinakajima/babyagi
7、SuperAGI
灵活的开源AI智能体框架,支持多模型、GUI、矢量数据库集成和性能洞察。
https://github.com/TransformerOptimus/SuperAGI
8、ShortGPT
专注于视频内容创作,可生成脚本、画外音、音乐、标题等。
https://github.com/RayVentura/ShortGPT
9、Camel
多智能体框架,基于角色扮演设计,动态分配任务,促进智能体协作。
https://github.com/camel-ai/camel
10、LoopGPT
AutoGPT迭代版本,支持GPT-3.5,改进集成和自定义功能,成本低。
https://github.com/farizrahman4u/loopgpt
11、JARVIS
使用ChatGPT作为决策引擎,结合HuggingFace模型,灵活处理多种任务。
https://github.com/microsoft/JARVIS
12、OpenAGI
开源AGI研究平台,结合专家模型和任务反馈强化学习,动态选择工具。
https://github.com/agiresearch/OpenAGI
13、CrewAI
角色驱动的协作框架,支持快速原型开发,适合轻量级团队协作任务。
基于LangChain设计,可直接使用LangChain提供的丰富工具和资源
https://github.com/crewAIInc/crewAI
14、Microsoft Semantic Kernel
企业级框架,集成知识图谱和多模态记忆,适合跨系统决策。
https://github.com/microsoft/semantic-kernel
15、OpenAI Swarm
基于蜂群理念的框架,支持高度灵活的交互模式,适合快速验证项目。
https://github.com/openai/swarm
16、Magentic-One
预装多种专用Agent,开箱即用性强,适合标准化任务
https://github.com/jackmpcollins/magentic
17、Archon
开源框架,支持智能体自主构建、多智能体协作和领域知识集成。
https://github.com/coleam00/Archon
18、OmAgent
创新性框架,支持多模态输入输出,适合复杂任务处理和多模态应用。
https://github.com/om-ai-lab/OmAgent# Agent框架集锦
19、AutoGLM 沉思
具体使用方法详见:https://t.zsxq.com/JxHWE
20、字节-Agent TARS
Agent TARS是由字节跳动
开源的一个智能代理框架,旨在通过视觉解释网页,无缝集成命令行和文件系统,从而彻底改变GUI交互
Agent TARS基于视觉-语言
模型(Vision-Language Model),使得用户可以通过简单的语言指令来控制和管理计算机任务12。
21、低代码框架-Coze
22、低代码框架-Dify
23、低代码框架-LangFlow
使用方法详见:https://t.zsxq.com/U95u7
第二部分: MCP与A2A
A2A协议和MCP协议都是为了促进人工智能(AI)系统之间的互操作性和协作而设计的开放协议,但它们关注的方面有所不同。
MCP更多关注于单个AI模型
如何更好地与外部世界交互,比如数据库或API调用;
A2A则侧重于不同Agent间
的协调与合作,使得复杂的任务可以通过多个代理的合作来完成