🔥 今日推荐:Ghost OS
一句话: macOS原生AI agent,不用截图就能控制整个电脑,比传统computer-use方案快10倍。
为什么值得关注
Anthropic的Computer Use很酷但有个致命问题——它依赖截图识别UI,每次操作都要截图→发送给视觉模型→解析→操作,一个简单点击就要5-10秒和几千token。
Ghost OS完全不同。它是Swift原生macOS应用,直接通过Accessibility API读取和操作UI元素。不需要截图,不需要视觉模型,速度飞快。
核心优势
- 🍎 原生macOS — Swift编写,深度集成系统框架
- 🚫 无截图依赖 — 直接读取Accessibility树,不花钱在视觉模型上
- 🧠 自学习 — 记住你的工作流模式,下次更快
- ⚡ 速度快10倍 — 操作响应<100ms,对比截图方案的3-10秒
- 💰 成本低100倍 — 不需要GPT-4V/Claude Vision,省token省API费
技术实现
Ghost OS利用macOS的Accessibility框架:
- 读取UI树 — 获取所有窗口、按钮、文本框的属性
- 精准操作 — 直接发送点击/输入事件到指定元素
- 状态监听 — 实时监听UI变化,确认操作结果
- 工作流记录 — 记录操作序列,支持回放和参数化
快速上手
# 克隆并构建
git clone https://github.com/ghostwright/ghost-os
cd ghost-os
swift build -c release
# 启动MCP Server
.build/release/GhostOS --mcp
配置到你的AI Agent:
{
"mcpServers": {
"ghost-os": {
"command": "/path/to/GhostOS",
"args": ["--mcp"]
}
}
}
⚠️ 首次运行需要在系统偏好设置→隐私与安全中授予辅助功能权限。
实际效果对比
| 操作 | 截图方案 | Ghost OS | |------|---------|----------| | 打开Finder | 8秒 | 0.3秒 | | 复制文件 | 15秒 | 1秒 | | 编辑文档 | 12秒 | 0.5秒 | | 发送邮件 | 20秒 | 2秒 | | 安装应用 | 30秒 | 3秒 |
适用人群
- macOS重度用户,想用AI自动化日常操作
- 测试工程师,需要自动化桌面应用测试
- 开发者,构建macOS AI助手
- 不想花大钱在视觉模型API上的人
GitHub: github.com/ghostwright/ghost-os (1335⭐) 语言: Swift License: MIT
更多MCP工具发现,访问 mcphello.com