字节开源通用型 AI 助手 Agent TARS 初体验
前面跟大家分享了一下 OpenManus 的简单部署使用教程,针对于小白可能安装各种依赖以及遇到错误不知道如何做,需要有一定的计算机知识,今天跟大家分享一下字节开源的 agent TARS,和 Manus 有异曲同工之妙,直接是一款应用程序,直接下载安装就可以使用,小白也能很好上手,再加上是大厂开源项目值得体验一试,下面就带大家使用一下。
UI-TARS Desktop 是一个基于 UI-TARS视觉语言模型 的 GUI 代理应用程序,允许您使用自然语言控制您的计算机。
开源项目地址:https://github.com/bytedance/UI-TARS-desktop
官方宣传页:https://agent-tars.com/
下面是官方说的:
TARS 是一个真正意义上的「通用型 AI 助手」,能够完成大量原本需要人手操作的繁琐任务:
- ✅ 联网搜索
- ✅ 浏览器操作(点击、填表、打开网页)
- ✅ 文件管理与编辑
- ✅ 命令行执行
- ✅ 多模态交互与上下文感知(支持 [MCP 协议])
换句话说,它不仅能看图识字、理解网页结构,还能「动手」替你点页面、操作终端,是真正具备「执行力」的 AI。
快速体验
1、 前往https://github.com/bytedance/UI-TARS-desktop/releases,下载符合自己操作系统的安装包,mac 可以直接使用 homebrew 命令终端执行brew install agent-tars
2、打开agent-tars,配置大模型,我这里直接使用的 deepseek-v3 官方apikey,申请地址:https://platform.deepseek.com/api_keys
3、配置好后直接使用即可
文章目录
商业转载请联系作者获得授权,非商业转载请注明本文出处及文章链接