4 个 AI 开源项目分别覆盖图表可编辑重建、机器人视觉-语言-动作模型、代码智能体工程化和本地桌面自动化。重点讲清它们解决的问题、核心机制、适合场景和上手方式。
Claude Skills 用 Markdown、脚本和资源文件描述任务流程,让大模型在运行时学会“什么时候做、怎么做、用什么工具做”。它和 MCP 一起,把 AI Agent 从单次问答推向可复用、可治理的工作流系统。
AI 控制电脑通常有终端执行、截图识别、系统原生接口和端到端视觉动作模型几种路线。围绕 Open Interpreter、Self-Operating Computer、Agent S、UFO、Cradle、OS-Copilot、ShowUI、UI-TARS Desktop,梳理它们的工作方式、适用场景和使用风险。