AI Agent（Claw 类）产品
调研与测评报告 2026

基于 6 款商业产品实测 + 2 款开源框架对照

报告日期2026 年 4 月 21 日

报告对象战略发展部

覆盖产品6 款商业产品（实测）+ 2 款开源框架

评估维度7 个核心能力维度，加权评分制

测试周期2026-03-31 至 2026-04-21

本报告含对自家产品 Loomy 的直接对标分析。

1报告导读

核心判断

2026 年 AI Agent 赛道已由 OpenClaw 开源基座 + 多家大厂商业封装 的格局主导。6 款实测商业产品中，腾讯 WorkBuddy（5.00）、智谱 AutoClaw（4.80）、腾讯 QClaw（4.70）位列前三；讯飞 Loomy 以 4.25 分与字节 ArkClaw 并列第 4，基础能力处于中游水平。开源框架 Hermes（基于 Nous Research 多年 LLM 研究积累推出）加权得分 4.75，已达到甚至超过部分商业产品的能力水平。

五点关键观察

同质化严重：6 款商业产品基本都基于 OpenClaw 开源基座做二次封装，核心能力差异有限。真正的分化集中在 模型开放策略、IM 生态整合、技能市场开放程度 三点。
腾讯系占据领先位置：WorkBuddy（5.00）与 QClaw（4.70）分列一、三名。QClaw 是目前市场上 唯一完全免费、官方承担 Token 成本 的产品（4000 万 Token/日），对其他付费产品构成价格压力。
Loomy 基础能力扎实，开放度相关维度偏弱：7 个维度中 5 项处于 4-5 分水平；技能生态（3/5）和人格配置（3/5）因仅支持官方内容、不支持用户自定义而得分偏低。
开源路线日趋成熟：Hermes 项目背后的 Nous Research 团队在 LLM 后训练领域有 3+ 年积累（Hermes 系列模型始于 2023 年），此次在已有研究基础上推出 Agent 框架，短期内达到较高完成度。开源方向的活跃对整个赛道都是结构性变量。
定时任务与 Agent 工具调用脱节是赛道普遍现象：Loomy、MaxClaw、ArkClaw 的 Agent 均无法在对话中原生触发定时任务，需到单独页面手动创建。AutoClaw 是唯一打通这一链路的商业产品。

阅读说明

本报告由单人在约 3 周内完成实测与记录。评分为主观判断，加权分的小数位差距不必严格对待。建议把分数作为"分档参考"（头部 / 中游 / 偏后），把各产品的文字观察作为主要判断依据。未深度实测的产品（KimiClaw、DuMate）未纳入打分，仅依公开资料在第 3 章脚注简评。

2市场全景

📋 配套调研 · 产品综合信息清单

8 款产品的 产品总览表、IM 渠道对比矩阵、社交媒体渠道矩阵，以及完整的官网 / 文档 / 定价链接。本章论述以该清单为数据底盘。

打开完整清单 →

⊙ 评分体系 · 本报告采用的 7 个评估维度 + 加权权重（D3 IM 渠道 20% / D4 任务完成 25% / D5 模型切换 20% / D7 定时任务 10% / D8 技能生态 10% / D10 人格 10% / D9 安全 5%，共 100%），详细说明见附录。

1）产品形态分类

6 款商业产品在"接入方式"上高度一致——全部提供桌面入口，全部需要配置 IM 渠道。真正的结构性差异在于 Agent 操作的是哪一台电脑：

形态	代表产品	操作对象	优势	劣势
操作本地电脑	AutoClaw / QClaw / WorkBuddy / Loomy	用户本机文件系统与进程	原生文件权限、本地计算、隐私可控；Agent 可调用本机工具链	需安装部署；Agent 能力受本机环境与权限约束
操作云端电脑	ArkClaw / MaxClaw	厂商提供的云端虚拟机	零安装即用；云电脑界面可视化好；不依赖用户本机配置	"本地文件"实际是云端文件，对用户有概念误导；深度任务受网络与云端限制

关键区分："操作本地 vs 云端"决定了 Agent 在 实际完成用户日常任务 时的能力边界。本地操作型产品（Loomy 所属）在文件增删、调用本机工具、与本地应用联动上有天然优势；云端操作型产品则在"纯聊天 + 云端内容生成"场景更顺滑。两类产品面向的用户需求并不完全重合。

2）基座技术的高度统一

6 款实测商业产品基本都是在 OpenClaw 开源基座上做二次封装。厂商差异化主要在模型选择（换自家模型 + 若干合作方）、UI 包装（命令行改为图形界面）、生态整合（接入自家 IM / 办公 / 云服务）三个层面。换言之：产品差异化更多是商业策略选择，而非技术突破。

3）综合加权排名

综合加权得分排名（满分 5.00）

WorkBuddy（腾讯云）

5.00

第 1 名

AutoClaw（智谱）

4.80

第 2 名

Hermes（Nous Research）

4.75

开源对照

QClaw（腾讯）

4.70

第 3 名

OpenClaw（社区）

4.70

开源拓荒者

ArkClaw（字节）

4.25

并列第 4 名

Loomy（讯飞）

4.25

并列第 4 名（自家）

MaxClaw（MiniMax）

4.15

第 6 名

商业产品

开源对照（不参与主排名）

讯飞自家产品

开源产品在相同评分体系下计算出的得分，仅作对照，不参与商业产品主排名。

开源框架 Hermes 的加权得分（4.75）已达到赛道头部水平，与 ArkClaw、Loomy、MaxClaw 等商业产品处于同一梯队甚至更靠前。Hermes 并非新起项目 —— 其背后 Nous Research 团队从 2022 年起就专注 LLM 后训练研究，Hermes 系列开源模型已持续迭代多个版本；hermes-agent 框架是他们在已有研究基础上延伸出的 Agent 工程化尝试。这一点使得"开源社区能否快速达到商业产品水平"的判断需要更谨慎。

4）产品定位象限

按"模型开放度"与"用户自定义空间"两个维度对 6 款商业产品 + 2 款开源框架做分布可视化。两个维度均为本次评测中最能体现产品策略分歧的指标。

模型开放度 × 用户自定义空间（坐标轴分值采自各产品 D5、D8、D10 实测）

商业产品

讯飞 Loomy

开源对照

象限解读：右上角为"高开放度 + 高自定义"的理想区；Loomy 当前落在中心偏右（D5=4, D8/D10 均分=3），与 ArkClaw 处于类似位置，可通过提升用户自定义空间（右上移）向头部产品靠拢。

在完成市场全貌与综合评分之后，第 3 章将对 6 款商业产品逐一剖析——先通过单表呈现完整评分矩阵，再围绕每款产品的定位、核心表现、代表性实测评语展开讨论。

3六款商业产品对比

本章按加权排名顺序逐一呈现 6 款商业产品。先给出对比索引表（含开源对照两款），再进入逐一剖析。两款未深测产品（KimiClaw / DuMate）的情况于章节末以脚注形式交代。

产品对比索引（完整评分矩阵）

下表汇总 6 款商业产品 + 2 款开源框架共 8 个样本在 7 个评估维度上的得分与加权总分，为后续逐一剖析提供单页对比视图。开源样本以紫色背景区分，不参与商业产品主排名。

产品	IM 渠道 20%	任务完成 25%	模型切换 20%	定时任务 10%	技能生态 10%	人格配置 10%	安全隐私 5%	加权分	排名
WorkBuddy	5	5	5	5	5	5	5	5.00	第 1
AutoClaw	5	5	5	4	4	5	5	4.80	第 2
Hermes 开源对照	5	5	4	5	5	5	4	4.75	参考
QClaw	5	5	4	4	5	5	5	4.70	第 3
OpenClaw 开源对照	5	5	4	5	5	5	3	4.70	参考
ArkClaw	4	5	5	3	3	4	4	4.25	并列 4
Loomy 讯飞	5	5	4	4	3	3	4	4.25	并列 4
MaxClaw	5	5	3	3	3	5	4	4.15	第 6

逐一剖析

第 1 名WorkBuddy / CodeBuddy5.00 / 5.00

厂商腾讯云 CodeBuddy

产品形态桌面 GUI + 微信小程序

定价专业版 58 元/月

核心差异双模式 + 微信生态

↗ 产品入口 📖 产品文档 💰 定价页

定位与表现：腾讯云旗下研发协作 AI Agent，同时服务 IDE 编程场景和通用办公场景。凭借腾讯生态深度打通，成为本次评测唯一在 7 个维度均拿满分的产品。核心优势在于微信客服号/小程序原生集成带来的用户触达、桌面与小程序双端均可切换模型的灵活度、以及 Ubuntu 沙盒虚拟机环境下较完善的安全隔离。主要短板集中在产品形态层面：官网下载入口存在混乱（有时下载到 IDE、有时到 Claw）、IDE 与 Claw 两种 workspace 的关系对用户不够直观、付费门槛相对 QClaw 免费策略缺乏吸引力。

实测评语 · IM 渠道这是微信小程序，运行在服务器上而不是微信聊天框；聊天框内容显示其运行在一个沙盒虚拟机环境中，内含 Python 代码工具和浏览器。桌面版本和小程序版本的对话框都可以切换不同的模型。对于其他品牌的 Claw，只能接入微信小程序或聊天框，而腾讯基于小程序架构带来了更多灵活度。

第 2 名AutoClaw4.80 / 5.00

厂商智谱 AI

产品形态桌面 GUI

定价龙虾月卡 39 元起

核心差异UI 友好 + 安全指引完整

↗ 产品入口 📖 产品文档 💰 定价页

定位与表现：面向个人用户的桌面 AI 助理，整体产品完成度在赛道中处于高位。核心优势包括：界面美观简洁，新用户上手友好度高；Agent 可在对话中原生触发定时任务（本次评测中是唯一做到的商业产品）；每个 Agent 人格可命名并绑定到独立 IM 频道，人格隔离清晰；首次启动主动弹出"安全与风险指南"对用户进行边界认知引导；模型池覆盖 GLM / DeepSeek / Kimi / MiniMax / 豆包多家。主要短板在技能生态的内容质感（"AI 味"偏重、原创性不足），以及部分 Skill（如小红书）受平台额度限制。

实测评语 · 人格配置用户页面有明显的"创建 Agent"按钮，可定义名称、描述、工作区域等。用户创建的人格由用户自己命名，在将工具配置到 IM 时系统会询问绑定哪一个人格——例如创建一个代码写作人格命名为 coder，即可将 coder 配置到特定 IM 频道，不会与其他人格混淆。

第 3 名QClaw4.70 / 5.00

厂商腾讯

产品形态桌面 GUI + 微信生态

定价完全免费（内测期）

核心差异免费 + 微信扫码

↗ 产品入口 📖 产品文档 💰 免费内测中

定位与表现：腾讯旗下面向大众用户的 Claw 产品，采用"官方承担成本抢占用户心智"的竞争策略。核心优势首推其独一档的免费策略——4000 万 Token/日由腾讯承担成本、公测期无需邀请码；叠加微信扫码 30 秒完成绑定、桌面与微信双端同步聊天记录、一条 Prompt 可批量安装 6 个技能、系统提示词拦截清晰等产品细节，对大众用户构成强吸引力。主要短板在于模型池受限于国产厂商（未支持 OpenAI / Anthropic）、定时提醒的输出格式夹杂原生代码（对普通用户不够友好）、以及免费期结束后的商业模式尚不明朗。

实测评语 · 定时任务格式异常整体可完成任务，但提醒的格式夹杂了原生代码形式：
[cron:a5f35afd-3dee-4ccf-99ed-fe1863289f75 喝水提醒] 喝水时间到！💧 起来喝点水吧~ 这并非普通对话的呈现，类似系统模板泄漏。

并列第 4 名ArkClaw4.25 / 5.00

厂商字节跳动 / 火山引擎

产品形态云端 Web SaaS

定价Lite 9.9 元（首月）

核心差异云电脑展示 + 飞书集成

↗ 产品入口 📖 产品文档 💰 定价页

定位与表现：字节 / 火山引擎的云端 AI 助理，主打零安装与可视化云电脑。核心优势在于手机号登录即用、独有的"云电脑"可视化展示（用户可观察 Agent 在云端的操作过程）、豆包 Seed 2.0 Pro 模型能力扎实、以及飞书深度集成所带来的企业协作场景先天入口。主要短板集中在体验层面：模型响应速度明显偏慢、"本地文件"实际指向云端虚拟机文件（对用户存在概念误导）、定时任务需跳转到单独页面手工配置且 Agent 对话响应慢（实测约 5 分钟）、技能生态封闭不支持第三方扩展。

实测评语 · 定时任务直接在对话框发送定时提醒请求时，处理时间较长且执行不理想，一个简短提醒的响应时间可长达 5 分钟。对话框旁边提供了独立的定时提醒页面，若用户在页面内手动配置（输入标题、提醒内容、时间等），到期执行会比较准时。

第 6 名MaxClaw4.15 / 5.00

厂商MiniMax

产品形态云端 Web + 移动 App

定价基础版 39 元/月（原 133 元）

核心差异多 Agent 协作 + 视觉展示

↗ 产品入口 📖 产品文档 💰 定价页

定位与表现：MiniMax 基于 M2.5 / M2.7 模型打造的云端 Agent，通过"多专家 Agent 协作"（如多 Agent 投研团队）做差异化，且是本次评测中唯一提供移动 App 的商业产品。核心优势在于模型响应速度（实测快于 ArkClaw）、精致的可视化展示窗口、丰富的专家 Agent 预设、以及对话式引导的人格配置。主要短板在于厂商锁定最严——只支持 MiniMax 自家模型池，无法切换到字节 / Kimi / OpenAI / Claude；用户无服务器 / 浏览器 / 终端入口（例如无法自行完成需要浏览器登录的小红书发布等任务），用户自由度显著受限；定时任务稳定性也存在问题（实测 3 次才通过）。

实测评语 · 技能生态搜索时系统能在网上找到基于 GitHub 的丰富内容，组织形式良好；但存在一个显著限制：产品内不提供服务器、浏览器，也不允许用户自行安装浏览器，不能进入 terminal——这导致如"发布小红书"等需要浏览器操作登录的任务无法完成。用户的可操作空间被大幅压缩，体验上更像是"在 MiniMax 产品内套了一层壳"，而非拥有一台属于自己的电脑。

并列第 4 名Loomy4.25 / 5.00

厂商科大讯飞

产品形态操作本地电脑 · 桌面 GUI

定价内测免费 · 新用户赠 5000-10000 积分

公测时间2026 年 4 月 20 日

↗ 产品入口 📖 产品文档 💰 积分说明

定位：讯飞的桌面级 AI 个人助理，面向办公场景。实测整体表现稳定在中游水平——5 个维度（IM 渠道 / 任务完成 / 模型切换 / 定时任务 / 安全）处于 4-5 分；2 个维度（技能生态 / 人格配置）为 3 分，是主要差距点。

核心观察：两个偏低维度共同指向"限制用户自定义能力"——技能生态不支持第三方 Skill、人格配置不支持多角色定制。属产品策略选择，非技术瓶颈。此外实测中发现一个典型断点：定时任务在设置页能建、Agent 在对话中却回复"做不了"，是本次评测所有产品中体验割裂最明显的一处。

实测评语 · 本地文件权限设计（可圈之处）第一次访问桌面文件时会弹出权限确认窗口，批准后可执行增删改查操作。这个权限弹窗的设计符合用户心理预期，在"默认全权限"与"完全限制"两种常见模式间取得较好平衡。

Loomy 的详细产品机会分析见 第 7 章「Loomy 观察与思考」，包含三个可落地的改进方向与可参考的行业实践。

关于两款未纳入对比的产品

KimiClaw（月之暗面）：需 Kimi Allegretto 档位（199 元/月）才能使用，价格门槛过高，本次未深度实测；其产品定位、公开定价、接入能力见第 6 章定价汇总。
DuMate（百度）：在主流横评中未被频繁提及、市场声量较小，本次优先级下调未深测；基础信息见第 6 章定价汇总。

至此完成 6 款商业产品在能力层面的逐一对照。第 4 章将视线转向 2 款开源框架——OpenClaw 作为赛道基座、Hermes 作为近期热门的进化版本——用以审视"去掉产品化包装之后，Agent 框架的能力边界在何处"。

4两款开源框架观察

OpenClaw 与 Hermes 作为开源对照组测评，单独评估，不参与商业产品主排名。设置这一组的目的，是审视"如果去掉产品化包装，Agent 框架的能力边界在何处"，并借此理解开源路线对商业赛道的影响。（本章数据截至 2026-04-14；Hermes 发版频率较高，具体数据建议以该日期为准。）

1）定位与基本信息

两款开源项目在本赛道中扮演的角色并不相同——OpenClaw 是赛道公共基础设施，Hermes 是基于该思路的进化版本。二者的定位与关键指标如下表：

维度	OpenClaw （拓荒者）	Hermes Agent （进化者）
定位	赛道公共基础设施 —— 6 款实测商业产品基本都基于其二次封装	在 OpenClaw 设计思路上重新实现 + 扩展，加入模型自学习闭环（任务后自动生成 SKILL.md）
团队 / 背景	Peter Steinberger（奥地利开发者）	Nous Research（2022 年成立，已融资约 6500 万美元，Paradigm 领投；团队从 2022 年起深耕 LLM 后训练，Hermes 模型系列持续迭代多个版本）
GitHub 仓库	↗ github.com/openclaw/openclaw	↗ github.com/NousResearch/hermes-agent
官方文档	↗ docs.openclaw.ai	↗ hermes-agent.nousresearch.com
Star 数	357,000+	83,827+
最新版本	持续迭代	v0.9.0（2026-04-13 发布）
许可证	MIT	MIT
架构特点	Node.js Gateway 进程（127.0.0.1:18789），Hub-and-Spoke 路由	延续 OpenClaw 架构思路，核心加分项为模型自学习闭环
原生 IM	11+（WhatsApp / Telegram / Slack / Discord / Signal / Matrix …）	16 个（含飞书 / 企微 / 钉钉 / 微信 / QQ 等中国平台）
模型支持	配合通用 LLM API 使用	OpenRouter 200+ 模型 + 直连 OpenAI / Anthropic / Kimi / MiniMax / GLM
Skills / 生态	ClawHub 2,857+ 个 Skill（每个 Skill 本身是 MCP 服务器）	延续 Skill 概念 + 自学习机制自动扩展
部署方式	本地 / Docker / DigitalOcean 一键部署 / VPS 自托管	本地 / Docker / VPS 自托管

2）实测表现与安全风险

在相同评分体系下，OpenClaw 加权得分 4.70、Hermes 4.75，已达到与商业赛道头部相近甚至超越部分商业产品的水平。以下实测观察给出具体的能力与风险画像。

OpenClaw · 任务完成度表现连续使用一个月后观察到：OpenClaw 在本地文件操作方面表现几近满分，具备测试机器 Terminal 的完整权限，能执行绝大多数文件操作类任务。一个典型场景是——在 Discord 上发起语音通话请求后，OpenClaw 会自行上网搜索语音转文字工具并完成安装与集成，从而能够直接在 Discord 中理解用户的语音输入。

Hermes · 社区活跃度与进化机制这是近期增长较快的开源 Agent 项目之一，基于 OpenClaw 的设计思路做扩展，最大亮点是能够根据用户使用习惯做持续的模型微调。考虑到 Nous Research 在 Hermes 模型系列上的长期积累，这种快速的 Agent 框架成熟度并不意外。

安全风险提示 · ClawHavoc 事件：OpenClaw 在 2026 年初发生重大安全事件——超过 40,000 个实例暴露在公网，Cisco AI 安全团队测试发现 ClawHub 中近 20% 的 Skill 被判定为可疑或恶意（含 AMOS Stealer 类窃密软件）；Immersive Labs 甚至建议"立即卸载"。根因是默认 ALLOW-ALL 安全模式 + 无 Skill 沙盒。Hermes 在这方面做了显著改进：代码级做了路径穿越防御、SSRF 防护、敏感信息自动脱敏等多项硬化，但默认安全态势仍需用户自加固。

3）与商业产品对比及对赛道的意味

将开源组与 6 款商业产品在多个维度上横向对比，可以更清晰地看出二者的相对优势与盲区：

对比项	开源（OpenClaw / Hermes）	商业产品
能力上限	4.70 - 4.75	4.15 - 5.00（上限略高）
部署门槛	2-3/5（需技术背景）	5/5（零门槛）
模型自由度	完全自定义（200+ 模型）	厂商池（5-10 个）
成本	软件免费，模型 API 自付	39-199 元/月订阅
安全	默认 ALLOW-ALL，需自加固	厂商保障（沙盒 / 权限审计）
生态	2,857+ 社区 Skills，部分有恶意	10-100+ 官方审核 Skills
目标用户	开发者、极客、科研团队	普通用户、企业员工

基于上述对比，观察到开源路线对整个赛道的四点结构性含义：

能力上限正在与商业产品拉平——Hermes 加权 4.75、OpenClaw 4.70，已达到赛道头部水平，证明"产品化包装"之外的能力并不构成明显壁垒。
商业产品的真正价值在"易用性 + 合规性 + 品牌信任"——大多数企业用户不会自己 git clone 一个开源框架。
开发者 / 极客用户是开源框架的主要受众——Hermes 项目的社区活跃度高，证明这一群体对"模型完全自由 + 部署可控"的需求真实存在。
中长期可能出现的路径：某家厂商基于 Hermes 做商用封装（类似 ArkClaw 之于 OpenClaw 的路径），从而在"自进化"这个差异点上建立新的产品优势。

能力层面的比较完成之后，第 5 章将视角从"产品本身"转向"产品外延"——社交媒体接入能力与官方沟通渠道生态这两项独立调研，反映厂商如何连接外部世界与用户社群。

5产品生态与传播观察

测评过程中围绕"产品如何与外部世界连接"做了两项独立调研：社交媒体接入能力（产品能否读写小红书 / 微博 / 抖音等）与 官方沟通渠道生态（厂商如何维护用户社群）。以下为核心发现与完整报告链接。

1）社交媒体接入能力对比

📋 配套调研 · 社交媒体接入方式调研报告

8 款产品 × 6 个主流社交平台（小红书 / 微博 / 抖音 / B站 / 知乎 / 快手）的能力矩阵与接入途径对比。

打开完整报告 →

接入能力分层（实测摘要）

层级	标记	能力定义	代表
L1 原生发布	✅ 原生	产品内置、平台方授权 API 级集成	ArkClaw → 抖音（字节系）
L2 官方插件	🔌 插件	官方提供配置指南，少量配置	KimiClaw → 飞书
L3 社区生态	🌐 Skills	通过 ClawHub / openclaw-china 等社区实现	QClaw 小红书 Skills（136+ 个）
L4 屏幕操作	🤖 RPA	RPA/CDP 操作 UI，不依赖 API	AutoClaw → 所有平台
L5 内容生成	📝 生成	仅生成文案，需手动复制发布	WorkBuddy 运营专家

关键发现

AutoClaw 通过 RPA 操作屏幕覆盖面最广（小红书 / 微博 / 抖音 / B站 / 知乎全部可操作），但发帖时受额度限制
QClaw 在小红书生态最深，有 136+ 个专用 Skill（通过 ClawHub 社区）
WorkBuddy 内置"运营专家"角色，面向内容生成
ArkClaw 抖音是字节系原生渠道，有天然优势
Loomy 目前社交媒体接入能力较弱

2）官方沟通渠道生态

📋 配套调研 · 官方沟通渠道汇总

8 款产品的微信群 / 飞书群 / Discord / GitHub / 客服热线入口逐一整理，含部分产品可直接扫码的二维码图片链接。具体入口以官网实际信息为准。

打开完整汇总 →

围绕 8 款产品的官方沟通渠道做了横向调研，核心观察如下：

渠道丰富度与目标用户高度相关：偏开发者向的产品（MaxClaw、KimiClaw）更倾向 Discord + GitHub 等国际化社区；面向国内普通用户的产品（WorkBuddy、DuMate、AutoClaw、Loomy）则以微信群 / 飞书群为主要入口。
"官网直出"与"产品内引导"两种入口模式：AutoClaw 在官网 landing page 嵌入二维码，MaxClaw 在开发者平台公开入口，属于"官网直出"；WorkBuddy、Loomy 等则更依赖产品内或公众号引导加入，不在首页呈现。
部分产品目前在公开社群入口上投入较少：例如 QClaw、ArkClaw 当前更多依赖官方工单 / 客服号通道，没有固定的公开群入口。

注：各家厂商的社群运营策略动态变化较快，详细渠道清单请以配套调研为准，并以官网实际信息为准。

生态与传播层面的差异之外，第 6 章进入商业维度：完整定价对比，含未深测的 KimiClaw 与 DuMate。

6完整定价对比

📋 配套调研 · 完整定价调研报告

8 款产品的完整定价明细——订阅套餐（多档位）、API 按量计价（模型 Token 单价）、免费资源、加量包、企业版全量数据，经交叉核验。

打开完整报告 →

最低付费门槛分布

最低月付入门价（元 / 月；按金额从低到高排序）

QClaw

免费

官方承担 Token 成本

Loomy

内测免费

新用户赠积分

DuMate（未测）

赠积分

日赠 1000 积分

ArkClaw

¥9.9

Lite 首月优惠

AutoClaw

¥39

体验月卡

MaxClaw

¥39

基础版

WorkBuddy

¥58

专业版

KimiClaw（未测）

¥199

Allegretto 档

注：前 3 款（QClaw / Loomy / DuMate）当前为免费 / 内测状态，无直接可比月费；条形仅用于视觉层次，数字以右侧文字为准。

完成对赛道整体的观察后，第 7 章将视角聚焦回 Loomy：基于前述评分数据与横向对比，讨论其核心产品力、三个值得重点关注的机会点、以及可参考的行业实践。

7Loomy 观察与思考

Loomy 当前加权得分 4.25，与字节 ArkClaw 并列第 4。7 个维度中 5 项（IM 渠道 / 任务完成度 / 模型切换 / 定时任务 / 安全）处于 4-5 分水平，2 项（技能生态 / 人格配置）为 3 分。两个偏低维度的共同特征是"限制用户自定义能力"，属生态开放度的选择，而非技术瓶颈。

本章基于前述评分数据与实测观察，从"产品机会分析"视角展开更深入讨论。

1）Loomy 的核心产品力与赛道定位

与赛道头部横向对比下，Loomy 具备的产品力基础：

权限模型设计成熟：首次访问桌面文件时的弹窗授权机制，在"默认全权限"与"完全限制"两种常见模式之间取得较好平衡，这一设计在赛道中处于偏高水平。
安全能力边界透明：产品内明确披露"文件操作限制在 Workspace 内 / 禁止 rm -rf 与 sudo / 网络访问只能主动发起"，这类主动披露在同类产品中并不常见。
IM 渠道与主流模型接入已到位：微信、飞书等渠道的配置流程体验与头部持平；已接入讯飞星火、DeepSeek、Kimi、MiniMax、豆包等主流国产模型池。

2）三个值得重点关注的产品机会点

基于赛道横向对比，以下 3 个维度是 Loomy 与头部产品体验差距最明显的地方，且均属于"产品策略调整"而非"底层技术重构"的范畴。

机会点一 · 打通定时任务与 Agent 工具调用链路

实测中观察到一个典型断点：用户在对话中请求"3 分钟后提醒我喝水"时，Agent 明确回复"做不了"；但在设置页面中可以手动创建定时任务。这表明定时任务系统在底层是存在的，但未封装为 Agent 可调用的 tool，导致对话层与任务层割裂。

对照之下，AutoClaw、WorkBuddy、QClaw 均实现了 Agent 对话中直接触发定时任务。从用户体感上，"产品的 Agent 调不动产品本身的功能"是明显可感知的缺陷。该机会点的改造成本相对较低，但改进幅度可被用户直接感知。

机会点二 · 扩展用户自定义 Agent 人格的空间

Loomy 当前的"记忆"模块允许用户描述沟通风格偏好（如"回复简短一些"），但不支持创建完整的自定义人格或多角色切换。对比 AutoClaw 的做法——允许命名多个 Agent + 为每个 Agent 绑定独立 IM 频道 + 对话式引导创建人格——两种体验的用户心理归属差异显著：前者是"调教 AI 说话方式"，后者是"拥有多个角色化的 AI 助理"。

此外，实测过程中观察到 Loomy 的"记忆"并非 100% 严格遵守——例如明确要求"回复不超过两句"后，部分回复仍会出现长段落，显示记忆层与生成层的协同存在优化空间。

机会点三 · 技能生态的分级开放

Loomy 目前仅开放官方技能（实测统计在 10-50 个量级）。对比之下：

QClaw：一条 Prompt 可批量安装 6 个技能，触达效率高
OpenClaw（反面教材）：Skill 市场完全开放，2026 年初因 Cisco AI 安全团队报告 ClawHub 中约 20% Skill 可疑或含恶意代码，遭遇"ClawHavoc"事件

因此在 Loomy 的决策框架中，"完全封闭"与"完全开放"均非理想方案。一个值得参考的路径是"官方审核 + 用户可选接入"的分级机制——官方认证技能保持主推，同时向用户开放受限的第三方技能接入通道，在安全与生态活力之间做平衡。

3）其他观察

微信端稳定性的偶发问题。实测中出现过微信 Agent 偶发断联、桌面端聊天记录清空的情况，一段时间后自动恢复。考虑到 Loomy 处于公测初期（2026 年 4 月 20 日刚开放注册），此类稳定性问题在意料之中，但对用户长期留存影响不可忽视。

赛道其他产品中值得参考的设计细节。除前文提及的机会点对照之外，以下细节在测评中给出了较深印象，列作后续产品规划的参考：

产品	值得关注的设计点
AutoClaw	首次安装时主动弹出"安全与风险使用指南"，在用户建立产品使用边界认知上做得到位
WorkBuddy	沙盒虚拟机（Ubuntu）环境隔离在赛道中最完善；桌面版 + 微信小程序双端均可切换模型
QClaw	系统提示词拦截不仅直接拒绝，还主动提示可替代的正当请求方式
ArkClaw	云电脑可视化展示让用户可观察 Agent 在云端的操作过程，是云端 Agent 独特的透明度实践
Hermes（开源）	"模型根据用户使用习惯持续微调"的自进化机制，是商业产品目前尚未普遍涉及的方向

附录

测评原始数据

本报告中所有评分、评语、截图的原始记录，保存在两个交互式工作台中（需本地环境运行，不在本次分享范围内）：

主测评工作台 — 6 款商业产品的原始评分、评语、实测截图内部资料，如需查阅请联系作者

开源对照工作台 — OpenClaw + Hermes 评测记录内部资料，如需查阅请联系作者

评估维度与权重（简表）

维度	权重	评估要点（简）
IM 渠道支持	20%	原生支持的消息平台、配置便利度、稳定性
任务完成度 & 本地文件	25%	执行标准任务的成功率、文件增删改查能力
可选模型与切换便利度	20%	支持模型数量、切换成本、用户自配 API 可能性
24 小时在线 / 定时任务	10%	Agent 能否原生创建定时任务、关闭后是否执行
技能生态与可扩展性	10%	技能市场开放度、安装难度、数量规模
人格与角色配置	10%	默认人设、自定义能力、记忆偏好维护
安全与隐私保护	5%	权限控制、敏感操作确认、数据主权

报告时间：2026-04-21

数据源：实测工作台原始数据 + 各产品官方文档 + 第三方媒体报道交叉验证

说明：本报告为内部参考材料。评分为单人主观判断，仅代表研究时点情况，建议优先参考各产品的文字观察。

AI Agent（Claw 类）产品调研与测评报告 2026

目录

1报告导读

核心判断

五点关键观察

阅读说明

2市场全景

1）产品形态分类

2）基座技术的高度统一

3）综合加权排名

4）产品定位象限

3六款商业产品对比

产品对比索引（完整评分矩阵）

逐一剖析

第 1 名WorkBuddy / CodeBuddy5.00 / 5.00

第 2 名AutoClaw4.80 / 5.00

第 3 名QClaw4.70 / 5.00

并列第 4 名ArkClaw4.25 / 5.00

第 6 名MaxClaw4.15 / 5.00

并列第 4 名Loomy4.25 / 5.00

4两款开源框架观察

1）定位与基本信息

2）实测表现与安全风险

3）与商业产品对比及对赛道的意味

5产品生态与传播观察

1）社交媒体接入能力对比

接入能力分层（实测摘要）

关键发现

2）官方沟通渠道生态

6完整定价对比

最低付费门槛分布

7Loomy 观察与思考

1）Loomy 的核心产品力与赛道定位

2）三个值得重点关注的产品机会点

机会点一 · 打通定时任务与 Agent 工具调用链路

机会点二 · 扩展用户自定义 Agent 人格的空间

机会点三 · 技能生态的分级开放

3）其他观察

附录

测评原始数据

评估维度与权重（简表）

AI Agent（Claw 类）产品
调研与测评报告 2026