Skip to content

Agent TARS是由字节跳动开源的一个智能代理框架,旨在通过视觉解释网页,无缝集成命令行和文件系统,从而彻底改变GUI交互

官网: https://agent-tars.com/

Agent TARS基于视觉-语言模型(Vision-Language Model),使得用户可以通过简单的语言指令来控制和管理计算机任务‌12。

UI-TARS

UI-TARS-desktop