Anthropic 的 Claude Design 和 Google 的 Stitch,是目前最被讨论的两个 AI 设计工具。我用两个真实甲方项目(一个 toC iOS 食材详情页,一个 toB 仓库后台)让它们正面打一架。同一份 prompt、首版直出、各两次迭代、7 个维度打分。第一题 36:25 Claude 完胜,第二题 34:32 几乎打平但方向不同。最后给出一套不需要二选一的「按场景挑工具」方案。

Claude Design vs Google Stitch:用两个真实甲方项目,让两个 AI UI 工具正面打一架

Anthropic 在 2026 年 4 月推出了 Claude Design(Opus 4.7 的视觉旗舰能力),Google 这边 Stitch 也在 3 月做了 2.0 大改版。两个工具都瞄准 AI UI 设计这个口子,但风格完全不同——一个走「写真代码 + 套品牌系统」,一个走「免费 + 多框架导出」。看参数对比意义不大,真正能决定选谁的是把它们丢进真实项目里跑。我手上正好有两个不同方向的甲方需求,于是做了这次正面对决。

01 纸面参数:两条不同的路

01 纸面参数:两条不同的路

开打之前先看牌。Claude Design 走的是 Anthropic 一贯的「专业付费 + 真代码」路线:需要 Pro / Max / Team / Enterprise 订阅,没有免费版。换来的是实时可交互的 HTML 输出——不是设计稿,是真前端,Claude Code 能一键 handoff,自动读你的代码库 + 设计文件来建 Design System。

Google Stitch 走的是 「完全免费 + 多框架导出」路线:Google Labs beta,每天 400 credits,按复杂度扣。底层可以在 Gemini 3.1 Pro 和 3 Flash 之间切换。代码导出格式覆盖最广——HTML / Tailwind / React / Vue / Flutter / SwiftUI 都能导。

迭代方式上两家也完全不同:Claude 是 inline 评论 + 自动生成调节滑块Stitch 是 Voice Canvas(语音对话)+ Annotate 注释 + 多屏 Play 预览。交付路径:Claude 主要走自家的 Claude Code 生态(含 Canva / PDF / PPTX 导出),Stitch 走的是 Figma 粘贴 + 多 IDE 集成(AI Studio、Antigravity、MCP server)。

纸面看下来 Stitch 在「免费 + 灵活」上有明显优势,Claude 在「真代码 + Design System」上更深。但这只是参数表,真正定胜负的是放到具体项目里跑出来什么。

02 比赛规则:三条死规矩 + 7 维度打分

02 比赛规则:三条死规矩 + 7 维度打分

为了让对比公平,我事先定了三条规矩,全程一字不改:

① 同一份 prompt 复制粘贴两次,不为任何一边特殊优化。② 首版直出,第一版决定基本印象,再各给两次迭代。③ 全程录屏,翻车不剪。加速可以,裁剪关键过程不行。

评分用 7 个维度:品牌一致性、信息层级、视觉吸引力、交互合理性、平台规范、状态传达、可直接交付。每个维度 5 分,两题各 35 分满分(最后总分按 ×2 算成 40 分制,方便快速看输赢)。

03 两道题面:一个 toC 一个 toB

03 两道题面:一个 toC 一个 toB

Round 1:BEEBOX 食材详情页(iOS · toC)。用户碰 NFC 标签触发,看食材剩几天 → 问 AI 怎么做。布局要求:温度 → 食材主图 → 进度条 → AI 入口 → 三按钮 + Tab。视觉要求现代清新、食物诱人、浅色主调、大圆角、SF Pro 字体。状态色严格按 iOS 系统色:≥5 天绿、2-4 天黄、≤1 天红。约束是单手操作,临近过期要醒目但不刺眼。

Round 2:3PL 仓库可视化后台(Web · toB)。一屏看全库位、按客户筛、点位查详情、批量操作。桌面 1440×900 不滚动。布局:顶部 KPI → 左筛选 → 中网格 → 右详情 → 底部批量栏。网格 10 行 × 20 列,每格 60×60px,客户色块编码。视觉要求数据密集、专业冷静、中性色、弱化装饰。

第二题里我故意加了一个隐藏题:色盲友好——颜色 + 纹理双通道。看哪个工具会主动处理这个 accessibility 细节。

04 Round 1 准备:toC 场景考的是「诱人感」

04 Round 1 准备:toC 场景考的是「诱人感」

C 端、移动端,考的不是好不好看——是用户想不想用

这一题的核心元素:① Hero 食材主视觉 + 入箱日期;② 状态保质期进度条(绿/黄/红);③ AI 入口浮动卡片(要会发光,让人想点);④ 底部三按钮(拇指可触达)。

评分重点是品牌一致性、AI 人格的塑造、状态色的落地准确度

05 Round 1 首版:同一 prompt,同时按下回车

05 Round 1 首版:同一 prompt,同时按下回车

首版直出。两个工具拿到同样的 prompt,第一版的差距已经很明显

Claude Design 那张图:进度条颜色精确卡到 iOS 系统色,AI 入口卡片做了发光描边,整体气质就像一个有自己设计语言的真实 app;

Google Stitch 那张图:基础元素都齐了,构图也合理,但视觉语言更像 Material 模板的微调,少了那种「这是 BEEBOX 这个品牌」的辨识度。

06 Round 1 迭代:一样的修改,谁改得更对

06 Round 1 迭代:一样的修改,谁改得更对

我给两边发了同一组修改请求:① 进度条上方加一行「还能放 3 天」;② AI 引导文案换得更有趣、像在跟人说话

Claude V2:进度条上方加了精确的剩余天数文字,文案直接改成口语化的拟人风(像在跟你说话),整体风格保持稳定,只动了该动的地方

Stitch V2:剩余天数也加了,但加在了一个新的灰色 chip 里,破坏了原来的节奏感;AI 文案改了,但语气还是偏官方。局部精修能力上明显弱一档

07 Round 1 打分:Claude 36 vs Stitch 25

07 Round 1 打分:Claude 36 vs Stitch 25

7 个维度逐项打分:

品牌一致性 5:2、信息层级 4:4、视觉吸引力 3:4、交互合理性 5:4、iOS 规范 4:4、状态传达 5:4、可直接交付 5:3。

总分 Claude Design 36 / 40,Google Stitch 25 / 40。C 端「诱人感」场景,Claude 完胜——它同时把品牌、AI 人格、局部精修做对了

Stitch 唯一赢的是「视觉吸引力」一项——它做的图本身漂亮,但拼到这个具体业务里,缺品牌识别、缺 iOS 系统色精度、缺细节迭代能力。

08 Round 2 准备:toB 场景考的是「数据密度」

08 Round 2 准备:toB 场景考的是「数据密度」

B 端、Web 后台、数据密集。要的不是好看——是看得清、点得到、改得动

核心是 10×20 的网格(每格 60px),骨架是顶部 KPI + 左筛选 + 右详情,约束是多客户色块 + 一屏不滚动。

隐藏题:色盲友好——颜色 + 纹理双通道。这条故意没强调,看哪边会主动处理。

09 Round 2 首版:真功夫藏在三个魔鬼细节里

09 Round 2 首版:真功夫藏在三个魔鬼细节里

这一题两边的图乍一看都不错,但真正的差距在三个细节

魔鬼 01 网格密度:Claude 的格子尺寸严格按 60px 来;Stitch 把格子放大了,导致一屏装不下 200 格。

魔鬼 02 客户色系:Claude 给每个客户做了独立色系(同色相多明度),数据量再大也分得清;Stitch 用饱和度高的彩虹色,色多就乱。

魔鬼 03 色盲约束:Claude 主动给每个客户色块加了独立纹理(斜线、点阵、网格),双通道编码命中隐藏题;Stitch 完全跳过了这条——只用颜色区分,色盲用户看不出来。

10 Round 2 代码考验:能不能直接塞进 Next.js

10 Round 2 代码考验:能不能直接塞进 Next.js

光看图不算数,能跑的才叫「可直接交付」。我把两边的代码塞进了一个真实的 Next.js 项目。

Claude(React/JSX):直接 PASS。组件已经拆好——<BinCell> 接 status 和 client.color 两个 props,用 bins.map 渲染整个 grid,开发拿到就能往 props 里塞数据。

Stitch(HTML+Tailwind):PARTIAL。格子是用静态 HTML 硬编码 200 次写出来的(每个 bin 一个 div),需要开发自己重写成组件再上数据。能用,但是要返工。

这就是 Claude 「真代码」路线和 Stitch 「视觉导出」路线的核心差异——前者交付的是工程师能直接接手的东西,后者交付的是设计师的图加上代码壳

11 Round 2 打分:34 vs 32,质量打平方向不同

11 Round 2 打分:34 vs 32,质量打平方向不同

7 个维度:品牌一致性 4:4、信息层级 5:4、视觉吸引力 4:4、交互合理性 4:4、Web 规范 4:4、状态传达 5:4、可直接交付 4:4

总分 Claude 34 vs Stitch 32这一题不是质量之争,是方向之争

Claude 走深度:客户色系做得细致、命中色盲隐藏题、信息层级更清晰,但视觉风格偏专业冷峻。Stitch 走清爽:界面观感更现代轻盈、装饰留白更舒服,但少做了一些 B 端会要的工程细节。

12 总结:两题打完,到底该选谁

12 总结:两题打完,到底该选谁

两题最终成绩:Round 1 BEEBOX 36 vs 25,Round 2 3PL WMS 34 vs 32。总分上 Claude 领先,但真正的选择不应该按总分来——应该按业务场景来

选 Claude Design 的人:做垂直行业项目、客户要求多;需要真代码可直接交付给开发;有自己的品牌系统要套;愿意为 Pro / Max 订阅付费。

选 Google Stitch 的人:做通用场景、要多版方案给客户挑;看重清爽现代的视觉风格;主要走 Figma 设计交付路径;预算紧——它完全免费。

如果两类项目都有,把这两个工具同时挂在工作流里——按客户类型路由,比纠结「哪个更好」省事得多。

13 结语

真正决定胜负的不是模型本身,是你的项目类型。Claude Design 和 Google Stitch 不是替代关系,是分工关系——一个是「带工程能力的设计师」,一个是「能出多套方案的视觉助手」。做 toC 高品牌项目找 Claude,做 toB 数据密集型也找 Claude,做通用场景比稿、做免费快速出图找 Stitch。不要二选一,按场景挑工具。